Найпопулярніші чат-боти роблять значні помилки, підсумовуючи новини — дослідження
Чотири найпопулярніші чат-боти зі штучним інтелектом – ChatGPT від OpenAI, Copilot від Microsoft, Gemini від Google та Perplexity AI – не завжди точно підсумовують новини.
![Фото: vctr.media](/media/images/vctr.media-1735289427.png.original.webp)
Про це свідчать результати нового дослідження BBC, повідомляє Mezha.
Журналісти видання ставили чат-ботам запитання, основані на різних новинах, і просили використовувати BBC як джерело для відповідей. Однак у багатьох випадках ChatGPT, Copilot та інші припускалися помилок, неточно передавали інформацію або зверталися до інших джерел.
У межах дослідження кожному з чат-ботів було надіслано 100 запитань, і в 91% відповідей виявили хоча б невеликі помилки, а в 51% – суттєві проблеми. 19% відповідей містили фактичні помилки, такі як неправильні твердження, хибні цифри або дати.
Серед помилок, яких припускалися чат-боти, були неправильне використання джерел або змішування відповідей. Чат-боти, як-от ChatGPT чи Gemini, іноді використовували старі новини BBC, подаючи їх як актуальні, або змішували інформацію з останніх новин із застарілими даними.
Ще однією проблемою чат-ботів є те, що вони не завжди здатні розрізнити фактичні дані та авторську думку. Журналісти виявили щонайменше 23 випадки, коли думка автора подавалася як факт.
Загалом це дослідження показало, що Copilot і Gemini мають більше суттєвих помилок у відповідях на основі новин, ніж ChatGPT чи Perplexity, однак проблеми спостерігаються у всіх чат-ботів.
Читайте також: Які професії найактивніше користуються ШІ і яка глибина його використання, — дослідження