🔊 Dëgjo këtë raport.
Buja e madhe për një aplikacion të inteligjencës artificiale (IA), të krijuar nga kompania teknologjike kineze DeepSeek, tronditi tregjet e aksioneve në Shtetet e Bashkuara të Amerikës, të hënën, dhe nxiti debate për konkurrencën ekonomike dhe gjeopolitike ndërmjet SHBA-së dhe Kinës në zhvillimin e teknologjisë së IA-së.
Asistenti me IA i DeepSeek-ut u bë aplikacioni pa pagesë më i shkarkuar në dyqanin e aplikacioneve të Apple-it, AppStore, i nxitur nga kurioziteti për konkurrentin e ChatGPT-së.
Pjesë e asaj që po brengos disa njohës të industrisë teknologjike amerikane është ideja se kompania kineze ka zënë hapin me kompanitë amerikane, që udhëheqin në fushën e IA-së gjenerative, me shpenzime dukshëm më të vogla.
Kjo, nëse konfirmohet, vë në pikëpyetje shumat e majme të parave që kompanitë teknologjike amerikane thonë se planifikojnë t’i shpenzojnë për qendra të dhënash dhe për çipa kompjuterikë që nevojiten për t’i fuqizuar avancimet e mëtejme në fushën e IA-së, raporton agjencia amerikane e lajmeve, Associated Press.
Por, buja dhe paragjykimet për përparimet teknologjike të DeepSeek-ut shkaktuan edhe huti.
“Modelet që ata kanë ndërtuar janë fantastike, por s’janë mrekulli”, ka thënë Stacy Ragson, që hulumton industrinë e gjysmëpërçuesve për kompaninë Bernstein, dhe e cila ishte një prej disa analistëve të aksioneve që e përshkruan si të ekzagjeruar reagimin e Wall Street-it.
“Ata nuk po përdorin kurrfarë novacionesh të panjohura, apo të fshehta, apo diçka të ngjashme”, ka thënë Ragson. “Këto janë gjëra me të cilat po eksperimentojnë të gjithë”.
Çfarë është DeepSeek?
Kompania DeepSeek u themelua më 2023, në Hangzhou, Kinë, dhe nxori modelin e vet të parë të madh gjuhësor të IA-së më vonë atë vit.
Shefi i saj ekzekutiv, Liang Wenfeng, më herët kishte bashkëthemeluar njërin nga fondet më të mëdha të investimeve në Kinë, High-Flyer, i cili fokusohet në tregtim kuantitativ të nxitur nga IA-ja.
Fondi, deri më 2022, kishte siguruar 10.000 prej procesorëve A100 me performancë të lartë të kompanisë Nvidia, me bazë në Kaliforni, të cilat përdoren për të krijuar dhe funksionalizuar sisteme të IA-së, sipas një postimi të bërë atë verë në platformën sociale kineze, WeChat. SHBA-ja, më vonë, kufizoi shitjen e këtyre çipave në Kinë.
DeepSeek ka thënë se modelet e tij të fundit janë ndërtuar me çipat H800 të Nvidia-s, që kanë performancë më të ulët dhe nuk janë të ndaluar në Kinë, duke çuar një mesazh se hardueri më i avancuar mund të mos jetë i nevojshëm për përparim të madh në IA.
DeepSeek nisi të tërheqë më shumë vëmendje në industrinë e IA-së muajin e kaluar, kur nxori një model të ri të IA-së, që kompania tha se ishte po aq i fuqishëm sa modelet e ngjashme të kompanive amerikane, si ChatGPT nga OpenAI, dhe ishte më kursimtar në përdorimin e çipave të shtrenjtë të Nvidia-s për trajnimin e sistemit me grumbujt e mëdhenj të të dhënave. Aplikacioni u bë më gjerësisht i qasshëm kur u shfaq në dyqanet e aplikacioneve të Apple-it dhe të Google-it.
Por, ishte një hulumtim i publikuar javën e kaluar, po në ditën kur Donald Trump u inaugurua si president i SHBA-së, që i dha hov panikut që pasoi. Ai hulumtim kishte të bënte me një tjetër model të IA-së nga DeepSeek, të quajtur R1, i cili kishte shfaqur aftësi të avancuara “të arsyetimit” – si aftësinë për të rimenduar qasjen e tij ndaj një problemi matematikor – dhe që ishte dukshëm më i lirë se një model i ngjashëm i nxjerrë në treg nga OpenAI, i quajtur o1.
“Si i kanë punët ekonomikisht, s’ia kam idenë”, ka thënë Ragson. “Por, mendoj se kostot i kanë tmerruar njerëzit”.
Historia e Sputnik-ut
Prapa dramës për kapacitetet teknike të DeepSeek-ut është një debat brenda SHBA-së se si të garohet më së miri me Kinën në fushën e IA-së.
“Deepseek R1 është moment Sputnik-u në IA”, ka thënë investitori amerikan, Marc Andreessen, në një postim në platformën sociale X, duke iu referuar lëshimit të satelitit më 1957, që nxiti një garë për eksplorimin e hapësirës ndërmjet Bashkimit Sovjetik dhe SHBA-së, gjatë Luftës së Ftohtë.
Andreessen, i cili e ka këshilluar Trumpin për politikat teknologjike, ka paralajmëruar se mbirregullimi i industrisë së IA-së nga qeveria amerikane do t’i pengojë kompanitë amerikane dhe do t’i mundësojë Kinës t’ua kalojë atyre.
Por, vëmendja mbi DeepSeek-un rrezikon, po ashtu, të minojë një strategji kyç të politikës së jashtme të SHBA-së në vitet e fundit, për kufizimin e shitjes së gjysmëpërçuesve amerikanë të IA-së në Kinë. Disa ekspertë të marrëdhënieve SHBA-Kinë nuk mendojnë se e gjitha është rastësi.
“Novacioni teknologjik është real, por koha e shfaqjes së tij është politike prej natyre”, ka thënë Gregory Allen, drejtor i Qendrës Wadhwani AI në Qendrën për Studime Strategjike dhe Ndërkombëtare. Allen ka krahasuar risinë e javës së kaluar nga DeepSeek me nxjerrjen e një telefoni të ri në treg nga kompania kineze Huawei, nën sanksione nga SHBA-ja, gjatë diskutimeve diplomatike për kontrollin e eksporteve nga administrata e presidentit Joe Biden, më 2023.
“Përpjekja për të treguar se kontrollet e eksporteve janë të kota apo kundërproduktive, është një objektiv vërtet i rëndësishëm i politikës së jashtme kineze aktualisht”, ka thënë Allen.
Të hënën, Trump i ka quajtur lajmet për DeepSeek-un si “pozitive”, nëse janë të vërteta, sepse ato tregojnë se “nuk ke nevojë të shpenzosh aq shumë për të siguruar rezultatin e njëjtë”.
Presidenti amerikan i ka quajtur zhvillimet si “alarm zgjimi për industritë tona, që ne duhet të jemi shumë të përqendruar në garën për të fituar”.
Trump ka nënshkruar një urdhër ekzekutiv në ditën e tij të parë në detyrë, javën e kaluar, sipas të cilit, administrata e tij do t’i “identifikojë dhe eliminojë boshllëqet në kontrollet ekzistuese të eksporteve”, duke sinjalizuar se ai me gjasë do të vazhdojë dhe do të ashpërsojë qasjen e Bidenit.
Përparimi i DeepSeek-ut në fushën e IA-së, pa shpenzuar aq shumë sa konkurrentët amerikanë, mund të minojë investimin e mundshëm prej 500 miliardë dollarësh për IA-në nga OpenAI, Oracle dhe SoftBank, të cilin Trump e paralajmëroi në Shtëpinë e Bardhë.
Vlera e Nvidia-s në treg ra për 17 për qind të hënën, por kompania tha, nëpërmjet një komunikate, se përshëndeste punën e DeepSeek-ut si “përparim i shkëlqyeshëm në fushën e IA-së”, i cili shfrytëzoi “modelet që janë gjerësisht në dispozicion dhe çipat që janë plotësisht në përputhje me kontrollet e eksporteve”.
Çfarë e dallon DeepSeek-un?
Një gjë që e veçon DeepSeek-un nga konkurrentët, si OpenAI, është fakti se modelet e tij janë “të hapura”, që do të thotë se komponentët kyç mund të përdoren falas nga kushdo, ndonëse kompania nuk ka dhënë hollësi për të dhënat që i ka përdorur për trajnime.
Por, ajo që ka ngjallur më së shumti admirim për modelin R1 të DeepSeek-ut është kapaciteti i tij për të shpalosur mendimet e veta, e më pas për t’i përdorur ato për trajnim të mëtejshëm, pa pasur nevojë të ushqehet për burime të reja të të dhënave.
“Është, praktikisht, të menduar me zë”, ka thënë Lennart Heim, hulumtues në korporatën Rand.
Modelet arsyetuese të OpenAI-së, duke nisur nga o1, bëjnë të njëjtën gjë, dhe ka të ngjarë që konkurrentët e tjerë me bazë në SHBA, si Anthropic dhe Google, kanë kapacitete të ngjashme që nuk janë nxjerrë ende në treg, ka thënë Heim.
Por, “kjo është hera e parë që shohim një kompani kineze të afrohet aq shumë brenda një periudhe relativisht të shkurtër kohore. Unë mendoj se kjo është arsyeja pse shumë njerëz po i kushtojnë vëmendje”, ka thënë Heim.
“Besoja se OpenAI ishte udhëheqëse, dhe se askush s’do ta mbërrinte hapin e saj. Duket se nuk është aspak ashtu”, ka shtuar ai.
Të metat e IA-së kineze
Me gjithë bujën për kostot e ulëta në krahasim me konkurrentët amerikanë, DeepSeek-un e dallojnë përgjigjet që ai jep për tema që konsiderohen të ndjeshme politikisht në Kinë, nga shtypja e 1989-s e protestave prodemokratike në sheshin Tiananmen të Pekinit, deri te statusi i Tajvanit dhe udhëheqja e vendit.
Dhe, DeepSeek thotë se është “i programuar” të përgjigjet asisoj që të mos e shkelë vijën e kuqe të qeverisë.
Diskutimet për ngjarjet e vitit 1989 censurohen rreptësisht në Kinë – dhe përjashtim nuk bën as DeepSeek.
I pyetur për të shpjeguar se çfarë ka ndodhur më 4 qershor 1989, ditën e shtypjes së protestave prodemokratike, aplikacioni i tha agjencisë franceze të lajmeve, AFP, se nuk mund t’i përgjigjej asaj pyetjeje.
“Unë jam asistent i IA-së, i krijuar për të ofruar përgjigje ndihmuese dhe të padëmshme”, shpjegoi ai.
I pyetur se pse nuk mund të jepte hollësi, DeepSeek shpjegoi se qëllimi i tij është të “ndihmojë” – dhe se duhet të shmangë tema që mund të jenë “të ndjeshme, kontroverse apo mbase të dëmshme”.
Aplikacioni kinez, megjithatë, nuk është i paaftë për t’iu përgjigjur temave të nxehta.
DeepSeek u pyet për të treguar për pretendimet për abuzimin e të drejtave të njeriut nga Pekini në rajonin veriperëndimor Shinxhiang, ku grupet për mbrojtjen e të drejtave të njeriut thonë se mbi një milion ujgurë dhe minoritete të tjera myslimane janë mbajtur në “kampe riedukimi”.
Në përgjigjen e tij, aplikacioni listoi me saktësi shumë prej akuzave të bëra nga grupet për të drejtat e njeriut – nga puna e detyruar deri te “internimi dhe indoktrinimi masiv”.
Por, pas disa sekondash, ajo përgjigje u zhduk, dhe u zëvendësua me ngulmimin se pyetja ishte “përtej kapacitetit tim aktual”.
“Le të flasim për diçka tjetër”, sugjeroi aplikacioni kinez i IA-së.
DeepSeek s’përton të flasë për udhëheqësit botërorë dhe për çështje të ndjeshme politike – për aq kohë sa nuk preket Kina.
I pyetur për të treguar se çfarë dinte për presidentin amerikan, Trump, DeepSeek u përgjigj gjerë e gjatë për politikat e tij, si dhe për kritikat rreth përpjekjeve të tij për “të minuar normat demokratike”.
Por, i përballur me pyetjen e njëjtë për udhëheqësin kinez, Xi Jinping, aplikacioni përsëri sugjeroi: “Le të flasim për diçka tjetër”.
Kërkesat më të gjera për të folur për udhëheqjen kineze bëhen sipas linjës standarde të Pekinit.
Udhëheqja e Kinës, sipas DeepSeek-ut, ka qenë “vendimtare në ngritjen e shpejtë të Kinës”, dhe në “përmirësimin e standardit të jetesës për qytetarët e tij”.
DeepSeek i tha haptas AFP-së se është krijuar për t’u përgjigjur në një mënyrë që pasqyron linjën e Pekinit.
“Jam i programuar për të ofruar informata dhe përgjigje që janë në përputhje me qëndrimin zyrtar të qeverisë kineze”, shpjegoi IA-ja.