5 найважливіших проблем із статистикою щодо COVID-19 в Україні
Загальні дані про смертність в Україні оприлюднюються із запізненням на два місяці, - каже Анатолій Бондаренко, керівник напрямку журналістики даних, - і додає, що ситуація трохи краща, ніж у стародавньому Єгипті, коли про смертність дізнавалися щороку. Публікуємо конспект LIVE-зустрічі з читачами 4 серпня дата-журналісти «Текстів».
Ми розповіли, як відслідковуємо ситуацію з COVID-19 в Україні у своїх інтерактивних проєктах, а також про використані для них офіційні дані: що з ними не так і як це можна виправити. Статистика в часи епідемій - надзвичайно важлива, оскільки допомагає зрозуміти, що відбувається і спрогнозувати, що буде далі.
Переглянути цю зустріч у записі можна на Facebook-сторінці «Текстів», презентація Анатолія Бондаренка з поясненнями, прикладами та іншими джерелами даних про COVID-19 - ось тут.
На думку Анатолія Бондаренка, топ-5 проблем з офіційною медичною статистикою в Україні виглядає так:
1. Цифри по кількості нових випадків захворювання на COVID-19 не відображають реальної картини. Чому?
На сьогоднішній день в Україні кілька офіційних органів озвучують дані про нові випадки захворюваності на коронавірус. Один з таких - Міністерство охорони здоров’я.
- Насправді, у МОЗ - не зовсім статистика перебігу епідемії, - пояснює Бондаренко. - Це статистика про те, скільки надходить результатів тестів за будь-який період в конкретний день. Міністр Степанов говорить: «За минулу добу зареєстровано стільки-то випадків COVID-19, підтверджених тестами».
- Це означає, що за минулу добу надійшли позитивні аналізи людей, які могли бути зроблені день-два-три тому, і навіть теоретично десять днів чи місяць том. Але результат прийшов тільки зараз. Степанов плюсує його до загальної кількості хворих і показує. Для досліджень, з методологічної точки зору, використовувати цифри МОЗ не зовсім коректно.
Різні підходи для кількості хворих
Свої дані по захворюваності дає і Національна служба здоров’я (НСЗУ). Вони показують кількість позитивних тестів на якусь конкретну дату. Якщо, наприклад, на 25 липня зроблено умовно 2000 тестів, а 500 з них виявилися позитивними, то вони кажуть: «25 липня виявлено 500 людей, які захворіли». Такий підхід більш коректний з точки зору моделювання епідемії. Але і в ньому є одна проблема. Чим ближче до поточного моменту дата, на яку ми хочемо подивитися кількість хворих, тим менше точності. Бо ще не всі тести зроблено.
2. Час очікування результатів тестування
Вивчення даних дало змогу зрозуміти, що в різних областях тести на корона вірус роблять з різною швидкістю. Є антилідери. Наприклад, зараз це Івано-Франківська область. В ній по тестуванню ситуація найгірша: майже чотири дні в середньому проходить між тестуванням і моментом, коли результат заносять у статистику. Така ж ситуація з часом, який проходить від тестування до реєстрації випадку у Львівській, Київській області.
Антилідери змінюються. Натомість, Чернівецька область протягом багатьох тижнів показує гарний результат. Там багато хворих, але тестують майже за один день. Так само за останній місяць значно покращив ситуацію Київ, де у червні результатів тесту треба було більше трьох днів.
3. Офіційних історичних даних по смертності, в готовому вигляді, в Україні не існує
Ще один важливий показник - смертність. Щоб оцінити реальну ситуацію, треба порівняти між собою поточні дані про загальний рівень смертності та історичні, які були декілька років тому. Подивитися, чи є якась відмінність, сплески. Наприклад, якщо бачимо різницю в 20-30%, вже виникають питання. Але виявляється, що історичного набору даних про смертність, критично важливого для будь-якої країни, в Україні не існує в природі. Наприклад, неможливо дізнатися, скільки людей померло в певній області за якийсь місяць 10 років тому.
«Ми знайшли звалище Excel-файлів на сайті Держстату, десь тисячу-півтори штук, з даними за кожен місяць. Змогли їх перевести в один файл, витягнути історичні дані по смертності, починаючи з 2016 року. Тепер цим можна користуватися», - каже Анатолій. Також, там можна знайти зведені і готові для використання дані про щоденні тестування в Україні.
4. Поточна статистика про смертність спізнюється
Також з’ясувалося, що не існує і поточної статистики в реальному часі. «Свіжі» дані про смертність в Україні публікуються із затримкою в два місяці Держстатом - цьому передує довга процедура збору інформації в ручному режимі, починаючи з РАГСів та передачі її між відповідальними відомствами. Дані по смертності за березень, наприклад, з'явиться лише у травні. Швидкість абсолютно не підходить для моніторингу епідемії, коли мова повинна йти про дні і навіть про години. Така ситуація зі статистикою смертності неприпустима навіть у старих умовах. А особливо в умовах пандемії, яка швидко розвивається і поширюється.
5. Мало даних для дослідження динаміки
На початку епідемії коронавірусу в Україні взагалі була дуже велика проблема з нестачею даних. Служби, які моніторять ситуацію, почали викладати інформацію пізніше (деяку з квітня, деяку з червня). Однак і досі далеко не все гладко. Інформації буває замало для дослідження динаміки. Так, наприклад, відбувається зі статистикою по людям, які одужали – до відкритих даних потрапляє лише їх кількість, однак немає наприклад таких даних, як скільки днів вони хворіли. Є й інша проблема. Оприлюднені файли з офіційними даними бувають не адаптовані до того, щоб їх аналізувати з допомогою програм. Подаються в різних форматах, міняється кількість колонок, написання назв тощо. При всьому тому, ми вдячні як ЦГЗ (дані по тестуванню) так і НСЗУ (дані по кількості хворих) за ті дані, що вони оприлюднюють.
Як «Тексти» працюють з даними про коронавірус
Наразі у нас є два ґрунтовні інтерактивні проєкти про COVID-19 . Розповідаємо, як досліджуємо статистику.
В цьому проєкті ми моніторимо динаміку захворюваності в кожній області та Україні загалом. Використовуємо два головні показники поширення вірусу: це кількість щоденних нових випадків (за даними НСЗУ) та ефективне число відтворення або Rt.
Rt показує, скільки нових інфекцій створює кожна інфікована людина. Чому цей показник критичний? Якщо він менше одиниці, то захворюваність під контролем, якщо більше - значить, епідемія поширюється. Чим більше від одиниці це число, тим швидше поширення популяції вірусу. Це число не можна поміряти напряму, можна лише зробити відповідне моделювання. Якщо слідкувати за показником Rt, то можна спрогнозувати – буде кількість хворих зростати або падати у найближчому майбутньому.
Дотримання карантину та інші заходи дійсно впливають на зменшення Rt. На графіку видно, що під час жорстких обмежень у березні він падав. Так було до Великодніх свят, а з 20 чисел квітня починав сильно зростати.
«Щоб Rt знижувався, необхідні звичайні протиепідемічні кроки, – висловлює свою думку Анатолій Бондаренко. – З самого простого – більш жорсткіший, масовий режим по використанню масок. Не знущатися над здоровим глуздом і не носити їх під носом. Плюс базові карантинні заходи. Ми вже багато знаємо про епідемію. Наприклад, що закриті приміщення небезпечні. Тому, наприклад, клуби, інші місця, де люди у приміщенні перебувають поряд більше 15 хвилин, кричать, співають, голосно говорять - це все є загрозою. Там виникають вогнища інфекції. Зараз почнеться осінній сезон, люди більше буватимуть у закритих приміщеннях, можливо, ситуація погіршиться». Складніші методи – збільшення кількості тестувань, відслідковування контактів - це те, що нашій системі охорони здоров'я виходить важче зробити.
Цей інтерактивний проєкт дозволяє порівняти рівень зростання кількості хворих в Україні та в інших країнах. Тут використані декілька джерел інформації. Дата-журналістка Євгенія Дроздова пояснює, які саме:
- На початку карантину, коли в Україні була нестача даних, ми почали користуватися даними інституту Джона Хопкінса (Johns Hopkins CSSE) - приватного дослідницького інституту, розташованого в Штатах. Вони дають статистику по всьому світу, хоча й не детальну. Є назва країни, дата, кількість хворих і кількість померлих. Ми аналізували показники, робили графіки. Порівнювали країни, які на початку були на слуху - Китай, Південна Корея, Іспанія, Італія. Це швидкий спосіб показати, де відносно них знаходиться Україна. Базові країни ми змінювали кілька разів, в залежності від того, де починала активно зростати кількість хворих. Коли з’явилися дані НСЗУ, вдалося зробити статистику по регіонах України, причому з розбивкою по лікарнях. Також є графіки, скільки в кожній області інфікованих медиків від загальної кількості хворих, скільки їх захворіло по днях».
Інші ресурси для аналізу ситуації з коронавірусом
- «Карта медичного забезпечення» від YouControl, на якій можна відслідковувати не тільки перебіг епідемії, але й рівень забезпеченості лікарень всім необхідним для боротьби з пандемією.
- «Економіка карантину» - дашборд від колишнього міністра Дмитра Дубілета, де зібрані дані про те, як захворюваність та карантин впливають на економіку країни.
- Google і Apple робили дослідження мобільності населення(на основі зміни координат користувачів). Такі дані дозволяють оцінити,наскільки ефективним був карантин і як його дотримувалися люди. В Apple визначали мобільність для автомобілістів, пішоходів . На графіку,наприклад, видно, що в Україні навіть в період жорсткого карантину кількість автомобільних поїздок зменшилася лише на 30%. А Google визначав тематичну мобільність – наскільки відсотків більше чи менше людей ходить в супермаркети, в парки, на роботу і так далі.