Nga Elina Noor–Që nga momenti kur OpenAI prezantoi publikisht ChatGPT në nëntor të vitit 2022, u bë e qartë se modelet e mëdha gjuhësore të inteligjencës artificiale (LLM) po përforconin një botëkuptim të vetëm: atë perëndimor – të industrializuar, të pasur, të arsimuar dhe demokratik. Edhe vetë OpenAI e pranoi më vonë se ChatGPT reflektonte një prirje të theksuar drejt anglishtes dhe vlerave perëndimore.Mirëpo, përpara se edhe Google apo Anthropic të sillnin versionet e tyre në treg, zhvilluesit në Azinë Juglindore kishin kuptuar diçka thelbësore: rajoni kishte nevojë për modele që të flisnin gjuhët dhe të pasqyronin realitetet e veta. Kjo nuk ishte një sfidë e vogël, duke pasur parasysh se në këtë rajon fliten mbi 1,200 gjuhë.
Në një kontekst ku identitetet kulturore dhe kujtesat postkoloniale përplasen me njëra-tjetrën, gjuha është më shumë se një mjet komunikimi është politikë, identitet, histori. Madje edhe shtete që duken gjuhësisht homogjene, si Kamboxhia, Tajlanda apo Vietnami – fshehin brenda vetes një shumësi gjuhësh, dialektesh dhe traditash orale që nuk përkthehen dot lehtësisht në sistemet dixhitale.
Sfida për të ndërtuar një AI vërtet lokale
Zhvillimi i modeleve vërtet “lokale” për Azinë Juglindore është përballur me një sërë pengesash: mungesë të të dhënave të strukturuara në gjuhët vendase, mungesë burimesh kompjuterike për të trajnuar modele nga e para, madje edhe probleme më bazike, si mungesa e energjisë elektrike apo standardeve të shkruara për disa gjuhë.
Për këtë arsye, shumë zhvillues janë përqendruar në modifikimin e modeleve të mëdha perëndimore si BERT i Google, RoBERTa i Meta-s, apo së fundmi Mistral i Francës. Modele si PhoBERT (për vietnaminishten), IndoBERT (për indonezishten) apo Typhoon (për tajlandishten) janë shembuj të tillë.
Nga varësia te pavarësia
Në vitin 2024, Qwen, modeli i Alibaba Cloud, solli një ndryshim të dukshëm në rajon, duke ofruar më shumë alternativa për zhvilluesit e Azisë Juglindore. Sipas një raporti të Carnegie Endowment, 5 nga 21 modelet rajonale të lansuara në atë vit u ndërtuan mbi arkitekturën e Qwen.
Megjithatë, edhe ky ndryshim sjell sfida të reja: modelet kineze mbartin një tjetër prirje ideologjike, që nuk përfaqëson domosdoshmërisht vlerat lokale. Pra, përpjekja për të ndërtuar teknologji më të pavarura mund të sjellë një varësi të re, këtë herë nga Lindja.
Për t’i dhënë fund kësaj varësie, janë bërë përpjekje për të ndërtuar modele të reja krejtësisht nga e para: si SEA-LION (me 11 gjuhë zyrtare të rajonit), PhoGPT (vietnameze) apo MaLLaM (malajisht). Megjithëse SEA-LION përdor ende arkitekturën e Google, ajo mbështetet në një bazë të dhënash autentike gjuhësore nga rajoni.
Një AI që njeh rrënjët
Një shembull interesant është Sahabat-AI, një model që “flet” indonezisht, sundaneze, javaneze, balineze dhe batakeze. Ajo përshkruhet si një “dëshmi e përkushtimit të Indonezisë ndaj sovranitetit të saj digjital”.
Por që një AI të reflektojë me vërtetësi një komunitet, nuk mjafton të flasë gjuhën lokale, ajo duhet të njohë dhe të kuptojë mënyrën sesi komuniteti e koncepton botën.
Për shembull, në shoqëritë indigjene të Azisë Juglindore, koha nuk konceptohet domosdoshmërisht si lineare, e ndarë në orare dhe efikasitet. Kjo ndikon në mënyrën si rrëfehen historitë. Kronikat balineze, për shembull, shpesh nuk ndjekin strukturën klasike të një narracioni perëndimor, ato mund të konsiderohen si mite nga syri perëndimor, por për komunitetet vendase janë dokumente të identitetit dhe të kuptimit të jetës.
Rreziku i përjetësimit të paragjykimeve
Historianët kanë paralajmëruar se përdorimi i lenteve perëndimore në interpretimin e teksteve lokale ka shkaktuar keqinterpretime të rënda. Kolonializmi në Indonezi është një rast tipik: administratorët kolonialë shpesh i përkthenin dhe i interpretonin tekstet vendase sipas botëkuptimit të tyre. Këto përkthime, të pasakta dhe plot paragjykime, janë ruajtur si dokumente historike dhe tani janë pjesë e të dhënave me të cilat trajnohen modelet e IA. Nëse nuk filtrohen me kujdes, këto paragjykime mund të përjetësohen në mënyrë automatike nga teknologjia.
*Elina Noor është studiuese e nivelit të lartë në Programin për Azinë pranë Fondacionit Carnegie për Paqe Ndërkombëtare.
Të drejtat e autorit: Project Syndicate, 2025. /www.project-syndicate.org
Që nga viti 2015 nxisim shpirtin sipërmarrës, inovacionin dhe rritjen personale duke ndikuar në zhvillimin e një mjedisi motivues dhe pozitiv tek lexuesit tanë. Kjo punë që e bëjmë me shumë dashuri nuk ka të paguar. Ne jemi platforma e vetme e cila promovon modelin pozitiv të sipërmarrjes së lirë. Përmes kësaj platforme mbështesim edukimin gjatë gjithë jetës si mjet për zhvillimin personal dhe profesional të brezave. Kontributi juaj do të na ndihmojë në vazhdimin e këtij misioni në gjithë trevat shqipfolëse.
Mund të kontribuoni KETU. Falemnderit.