Piše: AP
Ona stoji iza današnje "eksplozije" umjetne inteligencije (artificial intelligence - AI), iako svi kompjuterski naučnici nisu smatrali da je Fei-Fei Li na pravom putu nakon ideje o ogromnoj vizualnoj bazi podataka ImageNet za koju su bile potrebne godine da se kreira.
Li, sada osnivačka Instituta za umjetnu inteligenciju usmjerenu na čovjeka pri Univerzitetu Stanford, Sjedinjene Države, u novim objavljenim memoarima govori o svom pionirskom radu u rukovođenju skupa podataka koji je ubrzao granu kompjuterskog oblika AI-ja.
Knjiga "Svijet koji vidim" prikazuje njene napredne godine, mijenjanje sredine iz Kine u New Jersey te je prati kroz akademske krugove, prvo kroz Silicijsku dolinu i dvorane američkog Kongresa dok rastuća komercijalizacija AI tehnologije izaziva pažnju javnosti uz popratne negativne reakcije.
Vaša knjiga opisuje kako ste zamislili ImageNet [vizuelna baza podataka dizajnirana za korištenje u softverskom istraživanju vizuelnog prepoznavanja objekata] kao više od ogromne baze podataka. Možete li objasniti?
Fei-Fei Li: ImageNet je zaista suštinska priča o identifikaciji smjera problema u vezi s umjetnom inteligencijom, a zatim pronalaženju načina da se tamo dođe. Te smjernice su bile da zaista preispitam kako možemo riješiti problem vizuelne inteligencije.
Jedan od najosnovnijih problema u vizuelnoj inteligenciji je razumijevanje ili način na koji gledamo na objekte jer je svijet sačinjen od objekata. Ljudska vizija je utemeljena na našem razumijevanju objekata, a ima ih baš mnogo. ImageNet je pokušaj da se definiše problem prepoznavanja objekata i obezbijedi put za njegovo rješavanje, a to je put velikih podataka.
Kada bih mogao da putujem kroz vrijeme prije 15 godina, kada ste naporno radili na ImageNetu, i pričao Vam o DALL-E-u, Stable Diffusionu, Google Geminiju i ChatGPT-u [modeli AI-ja], šta bi Vas o tome najviše iznenadilo?
Fei-Fei Li: Ono što me ne bi iznenadilo je upravo sve to što spominjete — DALL-E, ChatGPT, Gemini koji su bazirani na velikim podacima. Oni su unaprijed obučeni za veliku količinu podataka. To je upravo ono čemu sam se nadala.
Ono što bi me iznenadilo je da smo do generativne umjetne inteligencije došli brže nego što je većina nas to mislila. Za ljudsku generaciju to zapravo nije jednostavno. Većina nas nisu prirodni umjetnici. Najlakša generacija za ljude su riječi jer je govor generativan, ali crtanje i slikanje nije generativno za normalne ljude. Trebaju nam Van Goghovi svijeta.
Šta većina ljudi želi od inteligentnih mašina i da li je to u skladu sa onim što naučnici i tehnološke kompanije rade?
Fei-Fei Li: Mislim da ljudi u osnovi žele dostojanstvo i dobar život. To je skoro osnovni princip naše zemlje. Mašine i tehnologija trebaju biti usklađene s univerzalnim ljudskim vrijednostima - dostojanstvom i boljim životom, uključujući slobodu i sve te stvari.
Ponekad kada govorimo o tehnologiji ili ponekad kada gradimo tehnologiju, bilo da je namjerna ili nenamjerna, o tome dovoljno ne govorimo. Kad kažem "mi", to uključuje ljude u tehnologiji, uključuje i kompanije, ali uključuje i novinare. To je naša kolektivna odgovornost.
Koje su najveće zablude o umjetnoj inteligenciji?
Fei-Fei Li: Najveća zabluda o AI-ju u novinarstvu je kada novinari koriste AI kao subjekat i glagol, a ljude stavljaju u objekt. Ljudska aktivnost je veoma važna. Mi stvaramo tehnologiju, implementiramo je i njome upravljamo. Mediji i javni diskurs, pod velikim uticajem štampe, govore o umjetnoj inteligenciji bez odgovarajućeg poštovanja prema ljudskom faktoru. Toliko je članaka i rasprava koje počinju sa "AI donosi to i to; AI radi to i to, AI pruža to i to; AI uništava to i to". Smatram da ove stvari moramo prepoznati.
Budući da ste se prije svijeta kompjutera bavili i neuronaukom, koliko su procesi umjetne inteligencije različiti ili slični ljudskoj inteligenciji?
Fei-Fei Li: Nakon što sam neuronauku zagrebala po površini, još više poštujem različitost tih procesa. Mi, zapravo, ne znamo te zamršene detalje o tome kako naš mozak razmišlja. Imamo neke nagovještaje o vizuelnim zadacima nižeg nivoa kao što je gledanje boja i oblika. Međutim, ne znamo kako ljudi pišu poput Shakespearea, kako smo zavoljeli nekoga, kako smo dizajnirali most Golden Gate. Toliko je složenosti u nauci o ljudskom mozgu da su ove stvari i dalje misterija. Ne znamo kako to radimo u manje od 30 vati, energiji koju mozak koristi. Kako to da smo tako loši u matematici dok smo tako brzi u sagledavanju, navigaciji i manipulaciji fizičkim svijetom?
Mozak je beskrajni izvor inspiracije za ono šta bi umjetna inteligencija trebala biti i šta bi trebala činiti. Njegova neuralna arhitektura, njegovi Hubel i Wiesel [David Hubel i Torsten Wiesel, neurofiziolozi i dobitnici Nobelove nagrade] koji su zaista bili prvi koji su to otkrili - bili su početak inspiracije umjetne neuronske mreže. Tu arhitekturu smo posudili, iako matematički ne replicira u potpunosti ono što mozak radi.
Mnogo je ovdje isprepletenih inspiracija. Međutim, moramo da poštujemo da je puno nepoznanica. Stoga, teško je odgovoriti na pitanje koliko su slični.