Gjiganti kinez i teknologjisë Alibaba po bën një lëvizje strategjike drejt një forme të re të inteligjencës artificiale, duke sinjalizuar një ndryshim të rëndësishëm në mënyrën si do të zhvillohet kjo teknologji në të ardhmen.
Përmes Alibaba Cloud, kompania ka udhëhequr një investim prej 2 miliardë juanësh, rreth 290 milionë dollarë, në startup-in ShengShu, krijuesi i mjetit të gjenerimit të videove me AI, Vidu. Në këtë raund financimi janë përfshirë edhe TAL Education dhe Baidu Ventures. Ky investim vjen në një moment kur po rritet ndërgjegjësimi për kufizimet e modeleve aktuale të inteligjencës artificiale, të njohura si “large language models” (LLM), që bazohen kryesisht në tekst dhe përdoren në chatbot-e si ChatGPT. Në vend të tyre, zhvilluesit po orientohen drejt një koncepti të ri të quajtur “world models”, modele që bazohen në video dhe situata reale fizike, duke synuar të simulojnë botën reale në mënyrë më të saktë.
ShengShu synon të ndërtojë një “model të përgjithshëm të botës”, që lidh dy dimensione që aktualisht janë të ndara: botën digjitale, si lojërat dhe videot e gjeneruara nga AI, dhe botën fizike, si drejtimi autonom dhe robotika.
Sipas kompanisë, përdorimi i të dhënave multimodale, si imazhi, audio dhe prekja, e bën këtë qasje më të natyrshme për të kuptuar realitetin, krahasuar me modelet që bazohen vetëm në tekst.
Lexo edhe: A fshihet Adam Back pas Satoshi Nakamotos, krijuesit të Bitcoin?
Themeluesi i ShengShu, Zhu Jun, thekson se qëllimi është të lidhet perceptimi me veprimin, duke i mundësuar sistemeve të AI të parashikojnë dhe modelojnë sjelljen në botën reale në mënyrë më të qëndrueshme. Produkti i tyre më i fundit, Vidu Q3 Pro, i lançuar në janar, renditet ndër 10 modelet më të mira në botë për gjenerimin e videove nga tekst dhe imazhe. Interesante është se ShengShu e lançoi Vidu globalisht përpara se OpenAI të shpërndante më gjerësisht mjetin e saj të ngjashëm, Sora. Ndërkohë, kompani të tjera kineze si Kuaishou dhe ByteDance kanë hyrë gjithashtu në këtë garë me produkte konkurruese.
Alibaba nuk po ndalet vetëm te ky investim. Së fundmi, së bashku me Baidu Ventures, ka investuar edhe 50 milionë dollarë në Tripo AI, një platformë që krijon modele 3D nga fotografitë. Po ashtu, ka financuar PixVerse, një tjetër startup që po zhvillon modele të botës që lejojnë kontroll më të madh mbi mënyrën si zhvillohet një video e gjeneruar nga AI.
Këto zhvillime tregojnë një drejtim të qartë: e ardhmja e inteligjencës artificiale nuk do të jetë vetëm në tekst apo komunikim, por në aftësinë për të kuptuar dhe ndërvepruar me botën reale.
Kjo është veçanërisht e rëndësishme për robotikën. Për të funksionuar në mënyrë efektive, robotët kanë nevojë për më shumë sesa thjesht përpunim gjuhe — ata duhet të kuptojnë hapësirën, objektet dhe pasojat e veprimeve të tyre.
Sipas ekspertëve, për të arritur një inteligjencë artificiale që i afrohet asaj njerëzore, nevojiten tre elemente kryesore: arsyetimi, kuptimi i botës fizike dhe të mësuarit e vazhdueshëm. Ndërsa chatbot-et kanë përparuar shumë në aspektin e njohurive dhe arsyetimit, “world models” konsiderohen si hapi i radhës për të përmbushur boshllëkun e kuptimit të realitetit.
Në këtë kontekst, investimi i Alibaba nuk është thjesht një financim tjetër, por një tregues i qartë se gara globale për inteligjencën artificiale po hyn në një fazë të re.
Që nga viti 2015 nxisim shpirtin sipërmarrës, inovacionin dhe rritjen personale duke ndikuar në zhvillimin e një mjedisi motivues dhe pozitiv tek lexuesit tanë. Mbështetja juaj na ndihmon ta vazhdojmë këtë mision.
Na Suporto