Для навчання ШІ використовували сайти терористів з “ДНР-ЛНР”. Багато українських ЗМІ мають гірші показники
Сайти терористичних угруповань “ДНР” і “ЛНР” використовувалися для навчання моделей штучного інтелекту у Google C4 dataset (colossal, cleaned version of Common Crawl's web crawl corpus). Низка українських ЗМІ або зовсім не потрапили в масив, або отримали значно гірші показники у вибірці, ніж ресурси бойовиків. ТЕКСТИ знайшли посилання на ці дані у базі даних, яку оприлюднило видання The Washington Post у своїй статті Inside the secret list of websites that make AI like ChatGPT sound smart, переклад якої ми публікували напередодні.