Pavarësisht se AI po avancon çdo ditë e më shumë, përsëri hasen problematika, mes të cilave është drejtshkrimi. Nëse do të vendosni një inteligjencë artificiale kundër disa nxënësve ajo do të rrëzohet më shpejt nga sa ju e mendoni.
Pavarësisht të gjitha përparimeve që keni parë në AI, ajo ende nuk mund të shqiptojë. Nëse u kërkoni gjeneruesve tekst-në-imazh si “DALL-E” të krijojnë një menu për një restorant meksikan, mund të dalloni disa artikuj të shijshëm si “taao”, “burto” dhe “enchida” mes mijëra fjalësh të tjera pa kuptim. Apo nëse do përpiqeni të përdorni inteligjencën artificiale të Instagram-it për të gjeneruar një postim që të thotë “postim i ri”, AI ka raste që krijon një grafik të papërshtatshëm dhe që nuk ka lidhje me atë që kërkohet.
“Gjeneruesit e imazhit priren të performojnë shumë më mirë në pjesë si, makinat dhe fytyrat e njerëzve, dhe më pak në gjëra më të vogla si gishtat dhe shkrimi i dorës”, thotë Asmelash Teka Hadgu, bashkëthemelues i Lesan dhe një bashkëpunëtor në Institutin DAIR.
Teknologjia që qëndron pas gjeneratorëve të imazheve dhe teksteve janë të ndryshme, megjithatë të dy llojet e modeleve kanë vështirësi të ngjashme me detaje si drejtshkrimi. Gjeneruesit e imazhit në përgjithësi përdorin modele difuzioni, të cilat rindërtojnë një imazh nga zhurma. Kur bëhet fjalë për gjeneruesit e tekstit, modelet e mëdha të gjuhës (LLM) mund të duken sikur po lexojnë dhe u përgjigjen kërkesave tuaja si truri i njeriut, por në fakt ata po përdorin matematikë komplekse për të përshtatur modelin e kërkesës me një në hapësirën e tij te fshehtë duke e lënë të vazhdojë modelin me një përgjigje.
“Modelet e difuzionit, lloji më i fundit i algoritmeve të përdorura për gjenerimin e imazheve, po rindërtojnë një hyrje të caktuar. Ne mund të supozojmë se shkrimet në një imazh janë një pjesë shumë e vogël, kështu që gjeneruesi i imazhit mëson modelet që mbulojnë më shumë nga këto pikselë”, shton ai.
Algoritmet janë të nxitur për të rikrijuar diçka që duket si ajo që shihet në të dhënat e tij të trajnimit, por ai nuk i njeh rregullat që ne i marrim si të mirëqena , që “hello” nuk shkruhet “heeelllooo”.
Inxhinierët mund t’i përmirësojnë këto çështje duke shtuar grupet e tyre të të dhënave me modele trajnimi të krijuara posaçërisht për të mësuar AI se si duhet të duken duart. Por ekspertët nuk parashikojnë që këto çështje drejtshkrimore të zgjidhen aq shpejt. Disa modele, si Adobe Firefly, mësohen të mos gjenerojnë fare tekst. Nëse futni diçka të thjeshtë si “menuja në një restorant” ose “billboard me një reklamë”, do të merrni një imazh të një letre bosh në një tavolinë darke ose një billboard të bardhë në autostradë. Por nëse vendosni mjaft detaje në kërkesën tuaj, këto korrniza mbrojtëse janë të lehta për t’u anashkaluar.
Në Reddit, YouTube dhe X, disa njerëz kanë ngarkuar video që tregojnë se si ChatGPT dështon në drejtshkrimin në artin ASCII, një formë e hershme e artit në internet që përdor karaktere teksti për të krijuar imazhe. Në një video të fundit, e cila u quajt një “udhëtim i shpejtë i heroit inxhinierik”, dikush përpiqet me kujdes të udhëheqë ChatGPT përmes krijimit të artit ASCII që thotë “Honda”. Ata kanë sukses në fund, por jo pa sprova dhe mundime. Për të parë videon klikoni këtu.
“Në thelb, LLM thjesht nuk e kuptojnë se çfarë janë shkronjat, edhe nëse mund të shkruajnë sonete në sekonda. LLM-të bazohen në këtë arkitekturë të transformatorit, i cili në fakt nuk po lexon tekst. Ajo që ndodh kur futni një kërkesë është se ajo përkthehet në një kodim. Kur sheh fjalën “the”, ka këtë kodim të asaj që do të thotë “the”, por nuk di për “T”, “H”, “E” “, thotë Guzdial.
Për një person mesatar, për shembull, një imazh i krijuar nga AI i një dyqani muzikor mund të jetë lehtësisht i besueshëm. Por dikush që di pak për muzikën mund të shohë të njëjtin imazh dhe të vërejë se disa nga kitarat kanë shtatë tela, ose që tastet bardh e zi në një piano janë të vendosura gabimisht.
Megjithëse këto modele të inteligjencës artificiale po përmirësohen me një ritëm alarmant, këto mjete janë ende të detyruara të hasin probleme si kjo, gjë që kufizon kapacitetin e teknologjisë.
“Ky është përparim konkret, nuk ka dyshim për këtë. Por lloji i zhurmës që po merr kjo teknologji është thjesht çmenduri”, tha Hagdu.
Që nga viti 2015 nxisim shpirtin sipërmarrës, inovacionin dhe rritjen personale duke ndikuar në zhvillimin e një mjedisi motivues dhe pozitiv tek lexuesit tanë. Kjo punë që e bëjmë me shumë dashuri nuk ka të paguar. Ne jemi platforma e vetme e cila promovon modelin pozitiv të sipërmarrjes së lirë. Përmes kësaj platforme mbështesim edukimin gjatë gjithë jetës si mjet për zhvillimin personal dhe profesional të brezave. Kontributi juaj do të na ndihmojë në vazhdimin e këtij misioni në gjithë trevat shqipfolëse.
Mund të kontribuoni KETU. Falemnderit.