AI asistenti masovno griješe u vijestima, Gemini najgori po tačnosti

Ukupno je 45 odsto analiziranih AI odgovora sadržavalo bar jednu ozbiljnu grešku, dok je 81 odsto imalo neki oblik problema, pokazalo je istraživanje.

IZVOR: Agencije

Foto:Fripik

Vodeći AI asistenti pogrešno prikazuju sadržaj vijesti u gotovo polovini svojih odgovora, pokazalo je istraživanje objavljeno u srijedu koje su proveli Evropska radiodifuzijska unija (ERU) i Bi-Bi-Si. Međunarodno istraživanje analiziralo je tri hiljade odgovora na pitanja o vijestima postavljena najpoznatijim AI asistentima – softverskim aplikacijama koje koriste vještačku inteligenciju za razumijevanje prirodnog jezika i obavljanje zadataka za korisnika.

Procijenjeni su AI asistenti na 14 jezika prema kriterijumima tačnosti, navođenja izvora i sposobnosti razlikovanja mišljenja od činjenica, među kojima su ChatGPT, Kopilot, Gemini i Perpleksiti. Ukupno je 45 odsto analiziranih AI odgovora sadržavalo bar jednu ozbiljnu grešku, dok je 81 odsto imalo neki oblik problema, pokazalo je istraživanje.

Rojters je kontaktirao kompanije uključene u istraživanje kako bi zatražio njihov komentar o rezultatima. Gemini, Guglov AI asistent, ranije je na svojoj internet stranici naveo da pozdravlja povratne informacije korisnika kako bi se platforma mogla nastaviti unapređivati i postati korisnija.

OpenAI i Majkrosoft su prethodno izjavili da su takozvane „halucinacije“, situacije u kojima AI model generiše netačne ili obmanjujuće informacije zbog, primjera radi, nedostatka podataka – problem na kojem aktivno rade kako bi ga otklonili. Perpleksiti na svojoj stranici navodi da jedan od njegovih načina rada, nazvan „Dip risrč“ (Deep Research), ima tačnost od 93,9 odsto u pogledu činjenica.

Trećina odgovora AI asistenata pokazala je ozbiljne greške u navođenju izvora, poput izostanka izvora, pogrešnog ili netačnog navođenja, navodi se u istraživanju. Čak 72 odsto odgovora Geminija, Guglovog AI asistenta, imalo je značajne probleme s izvorima, u poređenju sa manje od 25 odsto kod svih ostalih asistenata.

Problemi s tačnošću utvrđeni su u 20 odsto svih analiziranih odgovora, uključujući slučajeve zastarjelih informacija. Primjeri navedeni u istraživanju uključuju situaciju u kojoj je Gemini pogrešno naveo izmjene zakona o jednokratnim e-cigaretama te slučaj kada je ChatGPT nekoliko mjeseci nakon smrti pape Franje i dalje navodio da je on aktuelni papa.

U istraživanju je učestvovalo 22 javna medijska servisa iz 18 zemalja, među kojima su Francuska, Njemačka, Španija, Ukrajina, Velika Britanija i Sjedinjene Američke Države. Kako AI asistenti sve više zamjenjuju tradicionalne internet pretraživače u pristupu vijestima, javno povjerenje moglo bi biti ozbiljno narušeno, upozorio je ERU.

„Kada ljudi više ne znaju čemu mogu vjerovati, na kraju ne vjeruju ničemu, a to može obeshrabriti učešće u demokratskim procesima“, izjavio je direktor ERU-a za medije Žan Filip De Tender.

Prema „Digital njuz reportu 2025“ Rojtersovog instituta, oko sedam odsto svih korisnika interneta koji prate vijesti i čak 15 odsto onih mlađih od 25 godina koristi AI asistente za informisanje o aktuelnostima. Novi izvještaj poziv je AI kompanijama na veću odgovornost i unapređenje načina na koji njihovi asistenti odgovaraju na pitanja povezana s vijestima.