Журналістика даних: Посібник



Вибори до фінського парламенту та фінансування кампаній

  • 1582 Перегляди
  • 0 Коментарі
  • 28/10/2012Дата публікації

Протягом останніх місяців у Фінляндії продовжувалися суди з приводу фінансування виборчої кампанії під час фінських виборів 2007 року.

Ілюстрація 38. Фінансування виборів (Helsingin Sanomat)

По тому, як у 2007 році пройшли вибори, преса виявила, що закони про оприлюднення даних з фінансування кампаній не писані для політиків. По суті, фонди кампаній витрачалися на підкуп виборців політиками, які потім відмовилися відкрити дані про ці витрати, як цього вимагає фінське законодавство.

Після цих інцидентів закон став суворішим. І на загальнодержавних виборах у березні 2011 року видання Helsingin Sanomat вирішило ретельно дослідити усі доступні дані з фінансування кампаній. За новим законом фінансування виборчої кампанії має бути відкритим, і лише пожертви до 1500 євро можуть залишатися анонімними.

1. Знайти дані та програмістів

Helsingin Sanomat організовувала в себе хакерські марафони (хакатони) з березня 2011 року. Ми запрошували фінських програмістів, журналістів та графічних дизайнерів до підвального приміщення в нашій будівлі. Учасники ділилися на групи по троє, і їм пропонувалося розробити візуалізації та програми. У нас на той час було десь по 60 учасників на кожному з таких заходів. Ми вирішили, що дані з фінансування кампаній стануть центральною темою хакатону HS Open #2 в травні 2011 року.

Національна аудиторська служба Фінляндії – це офіційна установа, яка зберігає документацію про фінансування кампаній. Тут нам було нескладно. Директор з інформаційних технологій цієї служби, Якко Хамунен, створив веб-сайт, що надає доступ в режимі реального часу до бази даних з фінансування кампаній. Аудиторська служба зробила це всього через два місяці після нашого запиту.

Сайт Vaalirahoitus.fi від того часу й надалі надаватиме пресі та громадськості інформацію про фінансування кампаній на кожних виборах.

2. Знайти ідеї під час мозкового штурму

Учасники хакатону HS Open #2 придумали двадцять різних прототипів того, що можна було б зробити з даними. Усі ці прототипи можна знайти на нашому сайті (текст фінською мовою).

Дослідник з біоінформатики на ім’я Жанне Пелтола відзначив, що дані з фінансування кампаній виглядали подібно до генетичних даних, які вони досліджували з метою пошуку в них взаємних залежностей. У біоінформатиці є програма з відкритим кодом під назвою Cytoscape, яку використовують для позначення цих взаємних залежностей. Тож ми пропустили ці дані через Cytoscape й отримали дуже цікавий прототип.

3. Втілити ідею на папері й у Інтернеті

За законом про фінансування кампаній обрані парламентарі повинні оприлюднити дані про фінансування через два місяці після виборів. На практиці це означає, що ми отримуємо дійсні дані в середині червня. На хакатоні HS Open ми мали дані лише від тих парламентарів, які подали їх завчасно.

Також виникла проблема з форматом даних. Національна аудиторська служба надавала дані у двох файлах у форматі CSV. Один містив дані про загальний бюджет кампаній, у іншому був перелік усіх донорів. Нам треба було поєднати ці дві бази даних, створивши файл, у якому було три колонки: донор, отримувач та сума. Якщо політики використовували власні дані, в нашому форматі це виглядало так: політик А пожертвував Х євро політикові А. Можливо, це не зовсім інтуїтивно зрозуміло, але для Cytoscape цей формат підійшов.

Коли ми очистили та переформатували дані, то просто пропустили їх через Cytoscape. На основі результату наш графічний підрозділ зробив графіку на цілу сторінку.

Насамкінець ми створили красиву візуалізацію на нашому сайті. Цю графіку ми робили не на основі результатів аналізу за мережевим методом (з допомогою Cytoscape - прим.). Ми хотіли, щоб люди отримали простий спосіб дізнатися, скільки коштів іде на кампанію, і хто дає ці кошти. Перший режим перегляду показує розподіл коштів між парламентарями. Коли ви клікаєте на певному парламентарю, з’являється розшифровка його чи її фінансувань. Ви також можете проголосувати, гарним чи поганим є цей конкретний донор. Візуалізацію створили Джуна Рувінен та Юкка Кокко з рекламної агенції під назвою Satumaa.

Веб-версія візуалізації фінансування виборчих кампаній використовує такі ж дані, як і мережевий аналіз.

4. Опублікувати дані

Зрозуміло що, Національна аудиторська служба вже опублікувала дані самостійно, тож не було потреби робити це вдруге. Але так як ми очистили дані та переформатували їх у кращу структуру, ми вирішили їх оприлюднити. Ми зробили це на основі відкритої ліцензії Creative Commons Attribution. Після цього кілька незалежних програмістів зробили візуалізації цих даних, і ми опублікували деякі з них.

Інструменти, які ми використовували під час роботи над проектом: Excel та Google Refine для очистки та аналізу даних, Cytoscape для мережевого аналізу, Illustrator та Flash для візуалізацій. Замість Flash краще було б використати HTML5, але в нас була обмаль часу.

Чому ми навчилися? Можливо, найважливіший урок полягав у тому, що структури даних – це може бути дуже складно. Якщо оригінальні дані представлені в «незручному» форматі, на перерахунок та конвертування може піти багато часу.

 
 

Коментарі 0

Для того, щоб писати свої коментарі, залогіньтесь! Якщо ви не маєте логіну, тоді спочатку зареєструйтесь, щоб його отримати!