Tehnologija
22.10.2025.
09:01
AI asistenti masovno griješe u vijestima, Gemini najgori po tačnosti
Ukupno je 45 odsto analiziranih AI odgovora sadržavalo bar jednu ozbiljnu grešku, dok je 81 odsto imalo neki oblik problema, pokazalo je istraživanje.

Vodeći AI asistenti pogrešno prikazuju sadržaj vijesti u gotovo polovini svojih odgovora, pokazalo je istraživanje objavljeno u srijedu koje su proveli Evropska radiodifuzijska unija (ERU) i Bi-Bi-Si. Međunarodno istraživanje analiziralo je tri hiljade odgovora na pitanja o vijestima postavljena najpoznatijim AI asistentima – softverskim aplikacijama koje koriste vještačku inteligenciju za razumijevanje prirodnog jezika i obavljanje zadataka za korisnika.
Procijenjeni su AI asistenti na 14 jezika prema kriterijumima tačnosti, navođenja izvora i sposobnosti razlikovanja mišljenja od činjenica, među kojima su ChatGPT, Kopilot, Gemini i Perpleksiti. Ukupno je 45 odsto analiziranih AI odgovora sadržavalo bar jednu ozbiljnu grešku, dok je 81 odsto imalo neki oblik problema, pokazalo je istraživanje.
Rojters je kontaktirao kompanije uključene u istraživanje kako bi zatražio njihov komentar o rezultatima. Gemini, Guglov AI asistent, ranije je na svojoj internet stranici naveo da pozdravlja povratne informacije korisnika kako bi se platforma mogla nastaviti unapređivati i postati korisnija.
OpenAI i Majkrosoft su prethodno izjavili da su takozvane „halucinacije“, situacije u kojima AI model generiše netačne ili obmanjujuće informacije zbog, primjera radi, nedostatka podataka – problem na kojem aktivno rade kako bi ga otklonili. Perpleksiti na svojoj stranici navodi da jedan od njegovih načina rada, nazvan „Dip risrč“ (Deep Research), ima tačnost od 93,9 odsto u pogledu činjenica.
Trećina odgovora AI asistenata pokazala je ozbiljne greške u navođenju izvora, poput izostanka izvora, pogrešnog ili netačnog navođenja, navodi se u istraživanju. Čak 72 odsto odgovora Geminija, Guglovog AI asistenta, imalo je značajne probleme s izvorima, u poređenju sa manje od 25 odsto kod svih ostalih asistenata.
Problemi s tačnošću utvrđeni su u 20 odsto svih analiziranih odgovora, uključujući slučajeve zastarjelih informacija. Primjeri navedeni u istraživanju uključuju situaciju u kojoj je Gemini pogrešno naveo izmjene zakona o jednokratnim e-cigaretama te slučaj kada je ChatGPT nekoliko mjeseci nakon smrti pape Franje i dalje navodio da je on aktuelni papa.
U istraživanju je učestvovalo 22 javna medijska servisa iz 18 zemalja, među kojima su Francuska, Njemačka, Španija, Ukrajina, Velika Britanija i Sjedinjene Američke Države. Kako AI asistenti sve više zamjenjuju tradicionalne internet pretraživače u pristupu vijestima, javno povjerenje moglo bi biti ozbiljno narušeno, upozorio je ERU.
„Kada ljudi više ne znaju čemu mogu vjerovati, na kraju ne vjeruju ničemu, a to može obeshrabriti učešće u demokratskim procesima“, izjavio je direktor ERU-a za medije Žan Filip De Tender.
Prema „Digital njuz reportu 2025“ Rojtersovog instituta, oko sedam odsto svih korisnika interneta koji prate vijesti i čak 15 odsto onih mlađih od 25 godina koristi AI asistente za informisanje o aktuelnostima. Novi izvještaj poziv je AI kompanijama na veću odgovornost i unapređenje načina na koji njihovi asistenti odgovaraju na pitanja povezana s vijestima.

Zapadne zemlje smišljeno hoće da naprave katastrofu sa gasom i naftom
Тag:
Preporučeni sadržaj

Bitkoin pao za 1,9 odsto na 93.500 evra, itirijum za 3,7 odsto na 3.330 evra
Tehnologija
21.10.2025.

Meta uklanja i gasi svoju Mesendžer aplikaciju
Tehnologija
21.10.2025.

Viber grupe danas ne rade, poruke se ne učitavaju
Tehnologija
20.10.2025.



