Журналістика даних: Посібник



Краудсорсинг даних у Guardian Datablog

  • 1649 Перегляди
  • 0 Коментарі
  • 13/01/2013Дата публікації

За Вікіпедією, краудсорсинг (crowdsourcing, «колективне збирання інформації») – це процес розподіленого вирішення проблем чи виробництва, який передбачає передачу завдань на виконання мережі людей, яку ще називають «гурт». Далі читайте уривок з інтерв’ю Саймона Роджерса про те, як у Guardian Datablog застосували краудсорсинг для висвітлення скандалу з витратами парламентарів, теми вживання наркотиків та листів до Сари Пейлін.

Ілюстрація 65. Відредагована копія документа про побічні витрати парламентарія Стівена Паунда (Guardian)

Часом до вас потрапляє тонна файлів, статистичних даних чи звітів, які неможливо опрацювати одній людині. Так само ви можете роздобути матеріали, які нечитабельні або в поганому форматі, і ви мало що можете з цим зробити. І тут у пригоді може стати краудсорсинг.

Що вже точно є в Guardian, так це багато читачів, і багато пар очей. Якщо є цікавий проект, де нам потрібен їхній внесок, ми можемо попросити їх про допомогу. Саме це ми зробили у проекті про витрати британських парламентарів. У нас було 450 тисяч документів та дуже мало часу на роботу. Тож чи є кращій спосіб, ніж запропонувати це завдання нашій читацькій аудиторії?

Проект «Витрати парламентарів» відкрив багато прихованих фактів. Ми отримали більше тем для публікацій, ніж даних. Проект був винятково успішним у сенсі інтернет-трафіку. Людям він справді сподобався.

Наразі ми ведемо проект із MixMag про вживання наркотиків, який теж був феноменальним. Виглядає, що він буде масштабнішим за огляд злочинності в Британії за показниками кількості людей, які взяли в ньому участь, що просто прекрасно.

Ці два проекти поєднує те, що вони присвячені питанням, які справді хвилюють людей, і тому люди охоче витрачають на них свій час. Значний обсяг роботи з краудсорсингу, ініційованої нами, було виконано завдяки допомозі від «фанатиків». У проекті про витрати парламентарів спочатку був потужний сплеск трафіку, який згодом згас. Але у нас все ще є люди, які з одержимістю переглядають кожну сторінку, шукаючи в ній аномалії чи теми для статей. Одна особа опрацювала 30 тисяч сторінок. Вони знаються на цій справі.

Ми також застосовували краудсорсинг у проекті, присвяченому листам до Сари Пейлін. І знову це дуже допомогло в процесі просіювання сирої інформації в пошуках журналістських тем.

Якщо говорити про створення сюжетів для статей, то в нашому випадку краудсорсинг спрацював дуже добре. Але в сенсі генерації даних ми не дуже активно застосовували краудсорсинг.

Деякі з наших проектів із краудсорсингу, які справді добре спрацювали, були більш подібні на старомодні опитування. Коли ви запитуєте людей про їхній досвід, їхні життя і діяльність, це працює дуже добре, бо люди не схильні тут щось вигадувати. Вони кажуть те, що відчувають. А коли ми просили людей начебто виконати замість нас нашу роботу, тут треба було знаходити такий базовий підхід, за якого ви могли б довіряти тим даним, які створили люди для вас.

Щодо надійності даних, то я гадаю, що метод, використаний у проекті Old Weather, - це те що треба. Вони брали десять людей для опрацювання кожної позиції, що є гарним способом забезпечити точність. У проекті «Витрати парламентарів» ми намагалися мінімізувати ризик того, що парламентарі виходили б в онлайн та редагували свої власні записи, щоб виглядати в них краще. Але остаточного захисту від подібних дій нема. Можна лише відстежувати певні URL-адреси, або чи не надходять дані з району SW1 у Лондоні. Тож тут справа хитріша. Дані, які ми отримували, не завжди були надійними. І хоч статті вийшли чудові, ми не отримали «сирих» даних, якими можна було б із упевненістю користуватися.

Якщо б я давав пораду завзятим журналістам даних, які хочуть застосувати краудсорсинг задля збору даних, я б рекомендував їм робити це по такій темі, яка справді хвилює людей, і яка продовжуватиме їх хвилювати й після того, коли вона зникне з заголовків на перших сторінках. Ще допомагає залучати людей організація краудсорсингу у формі, подібній до гри. Коли ми вдруге готували публікацію про витрати, це було більше схоже на гру, де люди отримували окремі завдання. Це справді допомогло – давати людям специфічні завдання. Велика відмінність тут ось у чому: я вважаю, якщо ви просто даєте людям гору інформації, щоб вони її опрацювали, і кажете «ану працюйте», це виглядатиме як важка і невдячна робота. Тому я вважаю, що дуже важливо, щоб це був цікавий процес.

Маріанн Бучар, блог «Журналістика даних», інтерв’ю із Саймоном Роджерсом (Guardian)

 
 

Коментарі 0

Для того, щоб писати свої коментарі, залогіньтесь! Якщо ви не маєте логіну, тоді спочатку зареєструйтесь, щоб його отримати!