“Пошук цифри перетворюється на пекло”. Інтерв’ю з радником
прем’єр-міністра про відкриті дані

“В нас найбільш “не цифрові” сектори, в яких найбільша кількість даних - це агро, енергетика і інфраструктура. Там є що робити, там купа даних, але всі вони закриті, а отже з ними ніхто не працює. Така ж ситуація в медицині. Але в медицині, окрім того, є велике питання щодо достовірності інформації”.

Інтерв’ю: Андрій Газін

Про що мова?

Донедавна українське законодавство у сфері доступу до публічної інформації не передбачало активного розкриття даних, а працювало за моделлю реагування на запити від журналістів, громадських організацій чи активістів. Інформацію від міністерств чи держкомпаній можна було отримати, лише надіславши їм офіційного запита. Відповідали на запити більш менш прийнятно, втім, завжди лишався значний ризик: а) не отримати відповіді; б) отримати неповну відповідь; в) отримати відповідь у неприйнятному форматі (pdf-файлі, факсом чи паперовим листом).

Прийняті поправки до Закону про доступ до публічної інформації зобов’язують органи влади поширювати дані у структурованих форматах, які уможливлюють автоматичну обробку. А Постанова Кабміну про набори відкритих даних чітко регламентує порядок та формати публікації даних і визначає перелік з понад 300 наборів даних, що підлягають обов’язковому оприлюдненню.

Цим новаціям в українському законодавстві передувала тривала кампанія тиску - семінари та публічні дискусії із залученням представників влади, міжнародних експертів, громадських організацій та ІТ-бізнесу. Робоча група вивчала міжнародний досвід у сфері відкриття даних, складала список наборів даних, які підлягають оприлюдненню в першу чергу, та просувала ідею відкриття даних серед представників державних компаній і підприємств.

“Основних аргументів на користь відкриття даних два, - каже радник прем'єр-міністра з відкритих даних Денис Гурський. - По-перше, прозорість. Це потрібно державним органам, аби почувати себе впевнено перед громадськістю, донорами і вищим керівництвом країни. По-друге, це необхідність розробляти електроні сервіси. Держава зараз неспроможна розробити електронні сервіси для громадян. І ми говоримо не про адміністративні послуги, які переводяться в електронний формат, а про мобільні аплікації, веб-сайти, які взаємодіють із державними підприємствами, міністерствами, міськими адміністраціями”.

Відкриття урядових даних дозволяє залучити до створення корисних сервісів громадськість та ІТ-розробників. На основі відкритих даних можна створити цілу екосистему електронних сервісів для внутрішнього українського ринку. Це, у свою чергу, означає нові робочі місця та надходження до держбюджету.

"Минулого року разом із компанією Microsoft ми замовили дослідження у Варшаві, яке нарахувало в ЄС до 2020 року додаткових 2% ВВП за рахунок відкриття даних. Тобто, за рахунок правильно прийнятих рішень на основі даних і за рахунок стартапів, які базуються на відкритих даних", - розповідає Гурський.

Які дані оприлюднять?

Постанова Кабміну затверджує перелік з 327 наборів даних, які міністерства та державні підприємства мають оприлюднити на Національному порталі відкритих даних до 21 квітня 2016 року. Серед іншого оприлюдненню підлягають:

  • єдиний державний реєстр юридичних осіб та фізичних осіб-підприємців;
  • інформація про осіб, які переховуються від органів влади;
  • єдиний державний реєстр осіб, які вчинили корупційні правопорушення;
  • державний реєстр потенційно небезпечних об’єктів;
  • інформація про стан аварійності на автомобільних дорогах;
  • реєстр платників податку на додану вартість;
  • державний реєстр лікарських засобів;
  • єдина державна електронна база з питань освіти;
  • інформація про пасажиропотік на залізничному та авіатранспорті;
  • єдиний державний реєстр судових рішень.

Складаючи перелік, зважали на рекомендації стратегічного документу країн Великої вісімки G8 Open Data Charter, який закріплює основні принципи роботи з відкритими даними та визначає пріорітетні галузі, але одночасно намагались реалістично оцінити здатність українських відомств зібрати та структурувати інформацію.

“Внутрішніми розпорядженнями витягувати перелік того, що збирається і зберігається, просто щоб розуміти, що потрібно оприлюднювати. Цей аудит почався в Міністерстві інфраструктури, Міністерстві економічного розвитку та Мінфіні. Це міністерства, в яких є найбільша кількість даних, і які є основними гравцями. Власне так і була сформована постанова”.

Від початку планувалось, що міністерства оприлюднять дані впродовж трьох місяців, однак Мінюст подовжив термін до шести місяців.

“Мінюст сказав, що три місяці - недостатньо. А в шість мають вкластися. Багато міністерств уже готові відкривати дані, тому що мають готові матеріали. Як хтось не буде встигати, або не буде публікувати дані, я підключатиму всю нашу кабмінівську команду, аби вони почали тиснути.

Крім того, ми хочемо запровадити на Порталі відкритих даних систему рейтингування розпорядників даних, щоб можна було подивитись, хто скільки публікує, і мати зведений графік. І регулярно показувати цей графік вищому керівництву країни.”

Звісно, 327 наборів даних - це далеко не все, що збирається державою. Перелік наборів даних буде доповнюватись, і на Порталі відкритих даних будь-хто може лишити запит на той чи інший набір даних. Запити розглядають на засіданнях міжвідомчої робочої групи, там же ухвалюють рішення щодо публікації.

Які першочергові завдання?

Якщо із оприлюдненням даних більш менш розібрались, то зі збором та зберіганням лишаються питання. Здебільшого всі дані збираються в регіонах - чи це держкомпанії, чи держустанови. Часто збираються та зберігаються аби як. Подекуди й досі на папері. Аби відкриті дані в Україні справді запрацювали, необхідно встановити чіткі інструкції на всіх рівнях.

"Основне завдання - створити інформаційну інфраструктуру в Україні. Після аудиту стало зрозуміло, що немає нормальної чіткої структури, немає чіткого бачення. Все збирається і зберігається на власний розсуд. Немає чітких інструкцій, як це має відбуватись. Незрозуміло, які дані більш актуальні, які менш актуальні.

Пошук якоїсь цифри перетворюється на пекло. Наприклад, у Міністерстві економічного розвитку працює 1200 людей. І якщо нам потрібно зрозуміти, скільки грошей було витрачено на газове опалювання у 2008 році порівняно із 2015, пошук цих даних гарантовано займе декілька годин.

Ми маємо побудувати інформаційну архітектуру, яка буде чітко регламентувати, як все збирається, зберігається і поширюється. Ми зараз врегулювали процедуру поширення даних. Але тепер треба зробити декілька кроків назад і зрозуміти, як узагалі це має збиратись і зберігатись.

В нас найбільш “нецифрові” сектори, в яких найбільша кількість даних - це агро, енергетика й інфраструктура. Там є що робити, там купа даних, але всі вони закриті, а отже, з ними ніхто не працює. Така ж ситуація в медицині. Але в медицині, окрім того, є велике питання щодо достовірності інформації".

Не менш важливе і кадрове питання. Міністерствам та держкомпаніям необхідно налагодити збір, збереження та публікацію даних, принагідно - співпрацювати із розробниками, журналістами та громадськими організаціями. Для цього потрібні спеціалісти, які мають досвід роботи з даними, мінімально знаються на статистиці, уявляють собі можливі сфери застосування тих чи інших датасетів. Це в ідеалі. В реальності все трохи гірше.

"В деяких міністерствах банально немає спеціалістів для того, аби налагодити внутрішній електронний документообіг. Кадровий резерв відсутній. Реформа держслужби має вирішити це питання. Але також треба брати радників із досвідом у цій сфері. Це перспективна робота, це новий ринок.

Треба шукати серед людей, які мають досвід в ІТ, в державних структурах, у роботі зі статистикою. Крім того, якщо у людини немає досвіду роботи в державних структурах, але є досвід у бізнесі, це додаткова перевага. Тому що ця людина незашорена бюрократичними процесами, має свіжий погляд, і буде просто ламати стіни".

Крім того, виникає задача адміністрування Порталу відкритих даних. Нині він знаходиться у безкоштовному хмарному хостингу, наданому компанією Microsoft, однак це не триватиме вічно. Утримання Порталу в хмарному хостингу Гурський оцінює приблизно в 1 мільйон гривень на рік. Серверний хостинг обійдеться дорожче.

"Зараз ми маємо перенести Портал на сервери Державного агентства з електронного урядування. Але питання в тому, чи витримають ці сервери навантаження. Тому що це доступ через АРІ, і це велике навантаження на базу. Треба масштабуватись, а зробити це на серверах складно. Можливо, треба почекати один чи два місяці на закон про хмарні технології, аби Держагенство купило собі хмару там, де їм подобається, і перенесло Портал на цю хмару".

Які подальші кроки?

Аби відкриті дані в Україні запрацювали, необхідно докласти ще чимало зусиль. Налагодити системну роботу із даними на всіх рівнях урядування, заохотити журналістів шукати в даних історії, громадські організації та аналітичні центри - використовувати дані для аналітики, і зацікавити програмістів, зрештою, розробляти додатки та сервіси. Разом з тим - створити концепцію інформаційної інфраструктури.

"Необхідно розробити концепцію інформаційної інфраструктури, яка буде відповідати на питання, як дані мають збиратися, зберігатися і поширюватись. Такого документу поки немає. Він має з’явитися, пройти громадські обговорення і після того вилитися в розпорядження чи нову постанову".

Для систематизації роботи із розробниками додатків і сервісів в Уряді планують створити інкубатор ІТ-проектів, який буде надавати консультативну допомогу командам на старті. Подібний інкубатор успішно працює в Британії на базі Open Data Institute.

"Зокрема ми говоримо про створення інкубатора ІТ-проектів на основі open і big data, аби систематизувати роботу з айтішниками. Й український уряд дуже зацікавлений у тому, щоб такий проект відбувся. Все, що стосується хакатонів, потрібно систематизувати і зробити більш сталим. Тому що після хакатонів усі розбігаються. А ми хочемо познайомити програмістів і активістів із міністерствами і менторами [наставниками - прим. ред.], розробити схему взаємодії. Така невеличка інкубаційна програма, тижнів на шість, яка буде давати проектам життя".

Проекти, засновані на даних

Edumeter

Рейтинг українських шкіл, побудований на основні даних Зовнішнього незалежного оцінювання 2010-2014 років. Дозволяє порівнювати школи за кількома ключовими предметами.

Police.kh.ua

Карта криміногенної ситуації у Харкові, яка складається щоденно на основі оперативних звітів правоохоронних органів. Дозволяє досліджувати стан злочинності у розрізі районів міста та за видами злочинів. Також містить історичні дані з 2011 року.

Cityscale

Портал із картами порівняння вартості купівлі та оренди квартир, розміру комунальних тарифів та статистики злочинів у розрізі районів міста Києва. Окрім карт містить також різноманітні набори даних.