Журналістика даних: Посібник



Візуалізація як «робоча конячка» журналістики даних

  • 1804 Перегляди
  • 0 Коментарі
  • 13/02/2013Дата публікації

Перш ніж ви спробуєте створити діаграму чи карту на основі ваших даних, поміркуйте хвилинку над тим, скільки ролей виконують статичні та інтерактивні графічні елементи у вашій журналістській роботі.

Візуалізація в журналістиці спроможна:

• Допомогти вам визначити теми та запитання для подальшої роботи над сюжетом

• Визначити відхилення в даних: це може бути ідея для якісної статті або, можливо, помилка у ваших даних

• Допомогти знайти типові приклади

• Показати слабкі місця у вашому репортажі

Візуалізації також виконують багато ролей під час публікації статей:

• Ілюструють твердження, наведене в статті, у більш аргументований спосіб

• Прибирають з тексту непотрібну технічну інформацію

Особливо в тому випадку, коли вони є інтерактивними та дозволяють вести дослідження, візуалізації роблять ваш процес роботи над матеріалом прозорим для читачів.

З цих ролей випливає, що вам слід братися за візуалізації і на ранніх етапах вашої журналістської роботи, незалежно від того, чи ви працюєте над електронними даними, чи над документами. Не розглядайте це як окремий етап, про який варто задуматися вже після того, як стаття загалом написана. Хай ця робота допомагає вам скеровувати вашу журналістську діяльність.

Розпочати – це часом означає просто подати у візуальній формі вже зроблені вами нотатки. Погляньте на інфографіку в Ілюстрації 84, яка була опублікована у Washington Post в 2006 році.

Ілюстрація 84. Як змінювалися субсидії фермерам протягом часу (Washington Post)

Вона наводить ту частину доходу від ферм, яка пов’язана із субсидіями, та ключові події протягом останніх 45 років, що впливали на дохід. На її розробку пішло декілька місяців. Пошук даних, які можна було б використовувати протягом тривалого часу, з однотипними дефініціями та однотипними значеннями, становив суттєву проблему. Дослідження всіх цих піків та «низин» на візуалізації допомогло нам тримати в пам’яті контекст під час нашої журналістської роботи. Це також означало, що одна рутинна частина завдання була загалом завершена ще до того, як були написані статті.

Ось кілька підказок про те, за допомогою візуалізацій почати дослідження ваших баз даних.

Підказка 1. Використовуйте підбірку малих графіків (т.зв. small multiples, щоб швидко зорієнтуватися у великій базі даних

Я використав цю техніку у Washington Post, коли ми досліджували ідею про те, що адміністрація Джорджа Буша роздавала гранти, виходячи з політично ангажованих, а не незалежних міркувань. Більшість із цих програм із допомоги виконувалася за формулою, а інші фінансувалися роками, тож нам було цікаво, чи можна виявити тут якусь закономірність, розглянувши близько 1500 різних довільних потоків.

Ілюстрація 85. Гранти міністерства охорони здоров’я та соціальних служб США: спарклайни допомагають оцінити тему статті (Washington Post)

Я створив графік для кожної програми, де червоні точки вказували на рік президентських виборів, а зелені – на рік виборів до конгресу. Проблема: так, у деяких із цих програм справді спостерігався пік за шість місяців до президентських виборів – червоні точки з піковими цифрами поруч із ними – але це не той рік виборів. Замість перевиборів Джорджа Буша пік стосується президентських виборів 2000 року, коли Білл Клінтон перебував у Білому Домі, а його віце-президент Ел Гор ішов на наступні вибори.

Було справді легко це побачити за допомогою серій графіків, а не у таблиці з цифрами, а інтерактивна форма дала нам змогу перевірити різні типи грантів, регіонів та агенцій. Карти, виконані за принципом small multiples, надають спосіб відтворити час та місце в статичних зображеннях, які легко порівнювати – часом навіть легше, ніж у інтерактивній графіці.

Цей приклад було створено за допомогою короткої програми, написаної мовою PHP, але зараз набагато простіше робити таке за допомогою спарклайнів у Excel 2007 та 2010. Едвард Тафт, експерт з візуалізацій, винайшов ці «глибокі, прості, подібні до слів графіки», щоб передавати інформацію з великих баз даних у режимі «одного погляду». Зараз їх можна побачити всюди, від невеликих графіків під котируваннями на біржі до даних про перемоги та поразки в спорті.

Підказка 2: Розгляньте ваші дані зі сторони і "догори дригом"

Коли ви намагаєтеся зрозуміти, яка саме тема статті пов’язана з набором даних, то не існує неправильних способів розглядати ці дані; спробуйте будь-який підхід, який тільки можете придумати, і ви отримаєте інакшу перспективу. Якщо ви пишете про злочинність, можна поглянути на графік змін у насильницьких злочинах протягом року; іншим може бути зміна у відсотках; ще іншим – порівняння з іншими містами; або це може бути зміна протягом тривалих періодів часу. Використовуйте «сирі» цифри, відсотки та коефіцієнти .

Розгляньте це все у різних масштабах. Намагайтеся дотримуватися правила, що ваша вісь Х має перебувати на нулі. Тоді відступіть від цього правила і подивіться, чи це повідомить вам щось іще. Спробуйте логарифмічну шкалу та квадратні корні для даних, що мають дивний розподіл.

Враховуйте результати досліджень із візуального сприйняття. Експерименти Вільяма Клівленда показали, що око починає помічати зміни в зображенні, коли середній кут становить близько 45 градусів. З цього виходить, що вам слід ігнорувати принцип «завжди починайте з нуля», і замість цього намагатися отримати більш інформативну графіку. Наші дослідження з епідеміології показали, що потрібний рівень знаходиться на межі вашого графіка чи діаграми. Кожен із цих варіантів дозволяє побачити дані в різних перспективах. Коли це перестане повідомляти вам щось нове, ви знатимете, що справу завершено.

Підказка 3: Не робіть припущень

Після того, як ви розглянули ваші дані у різних ракурсах, ви, імовірно, виявили записи в базі даних, які видаються неправильними – ви можете не зрозуміти відразу що вони означають, або там будуть відхилення в даних (т.зв. викиди – прим.), які виглядають так, неначе це помилки, або ж тренди, які мають обернений характер.

Якщо ви хочете підготувати публікацію на основі ваших ранніх досліджень або зробити візуалізацію, вам слід з’ясувати ці питання, і тут не можна робити припущень. Це або підґрунтя для цікавих статей, або помилки; цікавий виклик, кинутий загальним уявленням, або ж просто непорозуміння.

Нема нічого незвичного в тому, що місцеві органи влади надають електронні таблиці, у яких повно помилок, так само легко не зрозуміти урядовий жаргон, використаний у базі даних.

Найперше, поверніться до початків вашої роботи. Чи прочитали ви документацію та застереження до неї, і чи існує ця проблема в оригінальній версії даних? Якщо все «по вашу сторону» виглядає коректно, тоді час сідати на телефон. Вам потрібно все з’ясувати, якщо ви плануєте це використовувати, тому починати треба негайно.

Сказавши це, зауважимо, що не кожна помилка справді щось важить. У базі даних фінансування виборчої кампанії типово мати кількасот поштових індексів, які не існують в природі, у базі даних на сто тисяч записів. До тих пір, поки всі ці індекси не належать до одного міста або не стосуються одного кандидата, ці випадкові помилки в записах насправді нічого не означають.

Вам слід запитати себе: Якщо я хочу використати ці обставини, чи отримають читачі фундаментально точне бачення того, про що повідомляють ці дані?

Підказка 4: Уникайте одержимості надмірною точністю

Протилежна сторона того, що ви не поставили достатньо запитань, - це надмірне захоплення точністю. Ваша дослідницька інфографіка має бути коректною загалом, але не турбуйтеся, якщо у вас різні рівні округлення цифр, якщо вони не становлять у сумі точно 100 відсотків, або якщо ви пропустили дані по року чи двох на проміжку в 20 років.

Насправді ви можете спробувати прибрати мітки та маркери масштабу, як це зроблено на діаграмах угорі, щоб отримати ще краще загальне відчуття даних

Підказка 5: Створюйте хронологію випадків та подій

На початку роботи над будь-якою складною статтею створіть хронологію ключових подій та ситуацій. Для цього завдання можна використати Excel, документ Word чи спеціалізований інструмент на кшталт TimeFlow, але в певний момент ви зрозумієте, яку базу даних можна «підкласти» під цю хронологію. Періодичний перегляд хронології покаже вам, чи існують у вашій статті «дірки», які потребують заповнення.

Підказка 6: Не зволікайте із зустрічами з вашим редакційним відділом графіки, і проводьте їх регулярно

Проведіть «мозковий штурм» про можливі варіанти графіки з редакційними художниками та дизайнерами. Вони матимуть гарні способи поглянути на ваші дані, пропозиції про те, як можна забезпечити інтерактивність, та знання про те, як поєднати дані та статтю. Вашу журналістську роботу значно полегшать знання про те, що вам слід зібрати вже на ранніх етапах, або ви можете попередити вашу команду, що візуалізацію неможливо створити, якщо ви не зберете ці дані.

ПІДКАЗКИ ДО ПУБЛІКАЦІЇ

Ви могли провести за вашим розслідуванням лише кілька днів чи кілька годин, а можливо, ви готували статтю протягом місяців. Але коли настає час її публікувати, два аспекти отримують більшу вагу.

Пам’ятаєте про той пропущений рік, який був у ваших ранніх дослідженнях? Раптом виявляється, що без нього ви не можете просуватися далі. А ті неякісні дані, які ви проігнорували в статті? Вони не даватимуть вам спокою.

Причина в тому, що ви не можете обійти в статті "неякісні" дані. Якщо йдеться про графіку, у вас або є все, що вам потрібно, або у вас нема нічого – середини не існує.

1. Співвідносьте зусилля зі збору даних із розробкою інтерактивної графіки

У інтерактивній графіці нічого не приховаєш. Якщо ви справді маєте намір дати змогу вашим читачам досліджувати дані так, як їм заманеться, тоді кожен елемент цих даних має бути тим, чим він названий. Користувачі можуть виявити будь-яку помилку в будь-який час, і це переслідуватиме вас місяцями та роками.

Якщо ви створюєте вашу власну базу даних, це означає, що вам слід вичитати на предмет помилок, перевірити факти та відредагувати всю базу даних. Якщо ви використовуєте урядові дані, вам слід вирішити, скільки вибіркових перевірок цих даних треба виконати, і що ви плануєте робити, якщо виявите неминучу помилку.

2. Робіть дизайн для двох типів читачів

Графіка – чи це є окрема інтерактивна візуалізація, чи статична візуалізація, яка супроводжує вашу статтю – повинна задовольняти потреби двох відмінних груп читачів. Вона має бути легкою для розуміння з першого погляду, але при цьому досить складною для того, щоб запропонувати щось цікаве людям, які хочуть заглибитися в неї. Якщо ви робите інтерактивну графіку, подбайте про те, щоб ваші читачі отримали з неї щось більше, ніж окрема цифра чи ім’я.

2. Подавайте одну ідею – а тоді спрощуйте її

Ви певні, що хочете, щоб люди бачили лише якусь одну річ? Прийміть рішення про те, яке саме найпотужніше враження має отримати ваш читач, а потім подбайте про те, щоб усе інше зникло. У багатьох випадках це означає вилучення інформації – навіть тоді, коли Інтернет дає вам можливість подати все. За винятком того, якщо ваша головна мета – це прозорість вашого журналістського розслідування, більшість деталей, зібраних у вашій хронології, просто не є достатньо важливими. У статичній графіці це буде страхіття. У інтерактивній – нудьга.

 
 

Коментарі 0

Для того, щоб писати свої коментарі, залогіньтесь! Якщо ви не маєте логіну, тоді спочатку зареєструйтесь, щоб його отримати!