Gemini, ChatGPT apo Grok, cili AI është më i saktë në matematikë? - Business Magazine Albania

Gemini, ChatGPT apo Grok, cili AI është më i saktë në matematikë?

Një studim i fundit tregon se përdorimi i AI-së për llogaritje të përditshme mbart rreziqe: ka rreth 40% gjasa që përgjigjja të jetë e pasaktë. Hulumtuesit testuan pesë modele AI përmes 500 pyetjeve të përditshme matematikore, duke zbuluar se saktësia ndryshon shumë nga modeli në model dhe nga fusha në fushë.

Modelet e testuara:

  • ChatGPT-5 (OpenAI)

  • Gemini 2.5 Flash (Google)

  • Claude 4.5 Sonnet (Anthropic)

  • DeepSeek V3.2 (DeepSeek AI)

  • Grok-4 (xAI)

Rezultatet: asnjë model nuk arriti mbi 63% saktësi në matematikën e përditshme. Lider është Gemini me 63%, i ndjekur nga Grok me 62.8%. DeepSeek renditet i treti me 52%, ChatGPT pason me 49.4%, ndërsa Claude mbyll listën me 45.2%. Mesatarja e thjeshtë e pesë modeleve është 54.5%.

Lexo edhe: Facebook do të tarifojë përdoruesit për postimin e linkeve

Saktësia sipas kategorive

  • Matematikë dhe konvertime: Gemini 83%, Grok 76.9%, DeepSeek 74.1%, ChatGPT 66.7%

  • Fizikë: mesatarja vetëm 35.8%, ku Grok 43.8%, Gemini 43%, Claude 26.6%

  • Biologji dhe kimi: DeepSeek 10.6%

Grok dhe Gemini janë më të saktët në financë dhe ekonomi (76.7%), ndërsa ChatGPT, Claude dhe DeepSeek mbeten nën 50%.

Katër gabimet kryesore të AI-ve:

  1. Llogaritje të pasakta (68% e gabimeve): gabime në saktësinë e numrave ose rrumbullakime

  2. Logjikë e gabuar (26%): formula ose metoda e pasaktë

  3. Keqkuptim i udhëzimeve (5%): interpretime të gabuara të pyetjes

  4. Refuzimi për të përgjigjur

Ekspertët këshillojnë: “Nëse detyra është kritike, përdorni kalkulator ose burime të sigurta, ose kontrolloni përgjigjen edhe me një AI tjetër,” tha Dawid Siuda, bashkëautor i ORCA Benchmark.

Që nga viti 2015 nxisim shpirtin sipërmarrës, inovacionin dhe rritjen personale duke ndikuar në zhvillimin e një mjedisi motivues dhe pozitiv tek lexuesit tanë. Mbështetja juaj na ndihmon ta vazhdojmë këtë mision.



Na Suporto
Must watch
Business Mag Nr. #40 – Dhjetor 2025

Ky fundvit na gjen duke festuar një dekadë nga botimi ynë i parë. Një dekadë histori, rrëfime e përpjekjesh për të qenë zëri i sipërmarrjes shqiptare, për t’i dhënë hapësirë dhe MOMENTUM çdo biznesi në rrugëtimin e tij për tu rritur e triumfuar. 

Një dekadë si dokumentim i rrugës që ka përshkruar biznesi shqiptar; një dekadë që të zhyt në refletime për çfarë ka kaluar dhe të fton të mendosh sesi do të duket ekonomia e së ardhmes. 

Ndërsa hyjmë në vitin e ri 2026, duket se për bizneset dhe vendimmarrësit një realitet i ri po bëhet më se i qartë: modeli tradicional i rritjes nuk mund të jetë më i mjaftueshëm. Perspektiva europiane e Shqipërisë, teknologjia, pritshmëritë e konsumatorëve, përgjegjësia sociale dhe ajo ambientale po i imponojnë ekonomisë një transformim të domosdoshëm. Koha kërkon një ekonomi që është njëkohësisht digjitale, inovative, por edhe e qëndrueshme. 

Në kopertinë vjen Guvernatori Gent Sejko, i cili flet për një ekonomi që rritet në një dekadë trazirash globale dhe për rolin thelbësor që luan stabiliteti financiar.

Rubrika “Green” i kthehet një prej temave më të nxehta të dekadës: energjia,  klima, ekonomia qarkulluese. Shqipëria ka qenë e bekuar me burime të riciklueshme, …

Shiko më shumë
Na ndiqni në rrjetet sociale
0