Найпопулярніші чат-боти роблять значні помилки, підсумовуючи новини — дослідження

Чотири найпопулярніші чат-боти зі штучним інтелектом – ChatGPT від OpenAI, Copilot від Microsoft, Gemini від Google та Perplexity AI – не завжди точно підсумовують новини.

Про це свідчать результати нового дослідження BBC, повідомляє Mezha.

Журналісти видання ставили чат-ботам запитання, основані на різних новинах, і просили використовувати BBC як джерело для відповідей. Однак у багатьох випадках ChatGPT, Copilot та інші припускалися помилок, неточно передавали інформацію або зверталися до інших джерел.

У межах дослідження кожному з чат-ботів було надіслано 100 запитань, і в 91% відповідей виявили хоча б невеликі помилки, а в 51% – суттєві проблеми. 19% відповідей містили фактичні помилки, такі як неправильні твердження, хибні цифри або дати.

Серед помилок, яких припускалися чат-боти, були неправильне використання джерел або змішування відповідей. Чат-боти, як-от ChatGPT чи Gemini, іноді використовували старі новини BBC, подаючи їх як актуальні, або змішували інформацію з останніх новин із застарілими даними.

Ще однією проблемою чат-ботів є те, що вони не завжди здатні розрізнити фактичні дані та авторську думку. Журналісти виявили щонайменше 23 випадки, коли думка автора подавалася як факт.

Загалом це дослідження показало, що Copilot і Gemini мають більше суттєвих помилок у відповідях на основі новин, ніж ChatGPT чи Perplexity, однак проблеми спостерігаються у всіх чат-ботів.

Читайте також: Які професії найактивніше користуються ШІ і яка глибина його використання, — дослідження

ШІ дослідження новини чатботи