В

«Відкриті дані» держструктур: лише 8% у машиночитаному форматі

На Єдиному державному порталі відкритих даних очікуємо побачити власне дані, натомість знаходимо копії договорів, бланки заяв, телефонні довідники й розмаїття звітів. Де ж відкриті дані? Майже весь зміст data.gov.ua - це публічна інформація, але не дані у вузькому значенні. Реєстр всіх договорів, які уклали районні, сільські, міські ради в межах хоча б області — це дані, а один pdf — ні. Публічна інформація має бути легкодоступною, але навіщо змішувати її з відкритими державними даними?

Автор: Надія Романенко

Держава збирає і продукує багато інформації, яка потрібна громадянам, розробникам Інтернет-сервісів, журналістам, вченим та активістам, і допомагає самим чиновникам управляти ефективніше.

Наприклад, в деяких американських містах аналіз даних допоміг передбачати аварії на водогонах. Це зекономило гроші (податки громадян) й зусилля міській владі.

Відкриваючи дані, держслужбовці скоротять кількість запитів на доступ до інформації. Відкритість означає не лише прозорість, підзвітність і простий доступ до інформації для всіх, але й вигоду. Це економія на роботі з запитами й невпорядкованими базами даних для держапарату, прибутки від нових розробок для підприємців, а отже — заможніші громадяни і більше податків державі.

Відкриті дані вигідні всім.

Ми постійно працюємо з різними даними і, відповідно, завжди у пошуку цих самих даних. Тому свого часу запуск Єдиного державного веб-порталу відкритих даних став для нас справжньою #перемогою. Адже всі органи державної влади зобов'язані викладати на ньому або на своєму сайті визначений Постановою Кабміну перелік наборів даних. До цього зобов'язує Закон "Про доступ до публічної інформації", нікуди не подінешся.

Закон визначає «відкриті дані» як "публічну інформацію у форматі, що дозволяє її автоматизоване оброблення електронними засобами, вільний та безоплатний доступ до неї, а також її подальше використання". Людською мовою — це дані, які можна достатньо легко обробити комп'ютером, які структуровані і їх кожен може скачати й використовувати безкоштовно. Щоб виконати ці умови, держава має викладати свої дані у форматі json, csv, xml і подібні.

Але не все так просто. У постанові Кабміну, яка вказує чиновникам, як виконувати закон, закладена суперечність: серед допустимих форматів відкритих даних є формат файлів, який використовується для збереження зображень — і pdf, і Word. Жодна людина, що працює з даними, не назве ці формати "машиночитаними".

Формати даних на data.gov.ua Якщо дані викладені в кількох форматах, ми враховували лише найліпший з точки зору автоматичної обробки. Більшість даних на порталі не є машиночитаними. Навіть звичні таблиці з об'єднаними комірками — вже не відкриті дані.

Постанова змушує чиновників викладати не лише набори даних в вузькому сенсі (реєстри, бази даних), а й тексти нормативних актів, бланки заяв, телефонні довідники, каталоги відкритих даних. Чи доречно все це розміщувати на одному сайті? Ні! (хіба що телефонний довідник в машиночитаному вигляді). Контакти і бланки доречно розмістити на сайті самої установи.

Додамо до цього недосконалий пошук на data.gov.ua та відсутні фільтри для пошуку потрібної інформації, і отримаємо розгубленого шукача даних, що продирається крізь pdf-договори, зразки заяв, рішення рад, звіти про будь-що і форми №ХХХ-абв.

На порталі відкритих даних варто вдосконалити пошук: додати більше опцій пошуку та фільтрації. Наприклад, за форматами, типом даних, регіоном і т.п. Або виділити дійсно набори даних, придатні для комп'ютерної обробки, в окремий розділ.

Набори даних за темами і форматами

Ми розділили набори даних на категорії за ключовими словами.

Зверніть увагу на дані по фінансовій звітності (це звіти про витрати, бюджетні плани, кошториси). Там 50% документів — у форматі pdf. Чесно кажучи, у такому вигляді їх можна було й не викладати, бо це марне витрачання часу. І лише третина фінансової звітності доступна в табличному або машиночитаному вигляді.

В документах про закупівлі менше pdf, але і «табличних або машиночитаних» наборів теж менше - лише п'ята частина.

Україна покращує позиції в міжнародних рейтингах з відкритих даних, але ще багато потрібно змінити. Бо натепер, навіть якщо оприлюднено — це ще не значить відкрито.

Що потрібно зробити? Крім того, що змусити викладати усі дані у машиночитаному форматі, варто учити чиновників, як збирати дані. Також потрібно, щоб усі заголовки в усіх наборах називалися однаково. Наприклад: зараз викладають багато документів, які називаються «Бюджет» або «Кошторис». Варто усі називати однаково — наприклад, «Бюджет».

Якщо це звіт про витрати, то УСІ установи мають заповнювати таблиці з однаковими стовпчиками.

Зараз не скажеш, що зайшовши на data.gov.ua, можна легко знайти й опрацювати потрібні дані. Оприлюднення даних — чергова формальність. Причини — і в компромісному й суперечливому законодавстві, і в необізнаності чиновників щодо відкритих даних та у нерозумінні їхнього значення.

Типи наборів даних на data.gov.ua

реформи політика набори даних інфографіка відкриті дані уряд

Знак гривні
Знак гривні