Журналістика даних: Посібник



Хакерський марафон Mapa76

  • 1358 Перегляди
  • 0 Коментарі
  • 30/10/2012Дата публікації

Ми відкрили в Буенос-Айресі підрозділ Hacks/Hackers («Журналісти/хакери») у квітні 2011 року. Ми провели дві початкові зустрічі, щоб популяризувати ідею більшої співпраці між журналістами та програмістами. На кожну прийшло від 120 до 150 людей. На третій зустрічі ми організували 30-годинний хакатон за участю восьми учасників під час конференції з цифрової журналістики в місті Розаріо, за 300 кілометрів від Буенос-Айреса.

Ілюстрація 41. Mapa76 (Hacks/Hackers Буенос-Айрес)

Темою, що весь час поставала на цих зустрічах, було бажання «вилучити» великі обсяги даних з Інтернету та представити їх у візуальній формі. Так народився проект під назвою Mapa76.info, який допомагає користувачам вилучати дані і потім представляти їх, використовуючи карти та «лінійки часу». Завдання аж ніяк не просте.

Чому Mapa76? 24 березня 1976 року в Аргентині стався державний заколот, який тривав до 1983 року. За цей період військової диктатури орієнтовно 30 тисяч людей зникли, тисячі загинули, і 500 дітей народилися в тюрмі. Більш ніж 30 років по тому кількість людей в Аргентині, засуджених за злочини проти людяності, скоєні під час диктатури, становить 262 особи (дані станом на вересень 2011 року). Наразі тривають 14 судів та ще 7 мають призначену дату початку. У розпочатих судових справах фігурують 802 особи.

Ці судові справи породжують значні обсяги даних, які складно обробляти дослідникам, журналістам, організаціям із прав людини, суддям, прокурорам та ін. Дані створюються в розрізнений спосіб, і слідчі зазвичай не використовують програмний інструментарій, щоб інтерпретувати ці дані. Зрештою це призводить до того, що певні факти залишаються поза полем зору, та обмеження кількості гіпотез. Mapa76 – це інструмент журналістських розслідувань, що надає відкритий доступ до цієї інформації заради виконання журналістських, законодавчих, юридичних та історичних завдань.

Готуючись до хакатону, ми створили платформу, яку б використовували програмісти та журналісти під час спільної роботи у день заходу. Мартін Сарсале розробив кілька базових алгоритмів для вилучення структурованих даних із нерозмічених текстових документів. Були використані деякі бібліотеки з проекту DocumentCloud.org, але небагато. Платформа автоматично аналізувала та вилучала з тексту імена, дані та географічні назви – і дозволяла користувачам досліджувати ключові факти у різних справах (такі як дата народження, місце арешту, імовірне місце зникнення тощо).

Нашою метою було надання платформи для автоматичного вилучення даних із судових вироків по військовій диктатурі у Аргентині. Ми хотіли знайти спосіб автоматичного (або принаймні напівавтоматичного) показу ключових даних, пов’язаних із справами у період 1976-1983 року, що засновані на письмових свідченнях, судових слуханнях та вироках. Вилучені дані (імена, місця та дати) збиралися, накопичувалися, після чого дослідники могли їх аналізувати чи покращувати, а також досліджувати за допомогою карт, лінійок часу та інструментів мережевого аналізу.

Проект дозволяв журналістам, слідчим, прокурорам та свідкам простежувати історію життя конкретної особи, включно з обставинами її захоплення та подальшого зникнення або звільнення. Коли якась інформація відсутня, користувачі мали змогу «прочесати» велику кількість документів, що могли бути пов’язані з цією справою.

Ми оприлюднили інформацію про хакатон під час зборів Hacks/ Hackers Буенос-Айрес, у якої на той час було близько 200 членів (на час написання цього розділу їх близько 540). Ми також зв’язалися з багатьма організаціями із захисту прав людини. На зустріч прийшло близько 40 осіб, серед них журналісти, представники правозахисних організацій, програмісти та дизайнери.

Під час хакатону ми визначили завдання, які могли б незалежно виконувати різні фахові групи учасників, щоб полегшити перебіг процесу. Наприклад, ми попросили дизайнерів попрацювати над інтерфейсом, який поєднував би карти та лінійки часу, програмістів – пошукати способи вилучення структурованих даних та розробити алгоритми розрізнення імен, а журналістів – подивитися, що сталося з певними людьми, порівняти різні версії історій і «прочесати» документи в пошуках сюжетів про ті чи інші випадки.

Мабуть, найбільшою проблемою, яка постала після завершення хакатону, було те, що наш проект був вельми амбіційним, наші оперативні завдання – вимогливими, і було складно координувати слабко пов’язану між собою мережу волонтерів. Майже в усіх залучених до проекту осіб були завантажені робочі дні, а багато хто також брав участь у інших акціях та проектах. Hacks/Hackers Буенос-Айрес провів 9 зустрічей у 2011 році.

Проект наразі перебуває на стадії активного розвитку. Є ядро команди з чотирьох людей, яке працює з понад десятьма учасниками. У нас є публічний список розсилки та репозиторій коду, і в такий спосіб усі охочі можуть долучитися до проекту.

Маріано Блехман, Hacks/Hackers Буенос-Айрес

Переклад здійснено за підтримки фонду "Відродження"

 
 

Коментарі 0

Для того, щоб писати свої коментарі, залогіньтесь! Якщо ви не маєте логіну, тоді спочатку зареєструйтесь, щоб його отримати!