Журналістика даних: Посібник



Різні діаграми – різні оповіді

  • 3068 Перегляди
  • 0 Коментарі
  • 14/02/2013Дата публікації

У цифровому світі, з його перспективами «занурення» у тривимірне віртуальне середовище, ми схильні забувати про те, що так довго мали лише чорнило на папері. Ми зараз думаємо про цей статичний, плаский засіб передачі інформації як про щось другорядне, але насправді протягом сотень років ми писали та друкували, і ми спромоглися опанувати неймовірні багатства знань та практик про те, як представляти дані на сторінці. І хоч інтерактивні діаграми, візуалізації даних та інфографіка зараз на підйомі, вони «стоять на плечах» багатьох якісних практик, які нам відомі. І тільки коли ви поглянете назад в історію класичних діаграм та графіків, можна зрозуміти цей масив знань та перенести його на нові види носіїв.

Деякі з найвідоміших графіків та діаграм постали з потреби кращого пояснення «щільних» таблиць із даними. Вільям Плейфер (William Playfair) був шотландським поліглотом, який жив наприкінці 1700 – на початку 1800 років. Він самотужки представив світові багато тих самих графіків та діаграм, які ми й досі використовуємо. У своїй книзі «Комерційний та політичний атлас» (1786 рік) Плейфер використав стовпчикову діаграму http://en.wikipedia.org/wiki/Bar_chart, щоб виразно показати обсяги імпорту та експорту Шотландії в новий візуальний спосіб.

Ілюстрація 95. Ранній зразок стовпчикової діаграми (Вільям Плейфер)

Потім він популяризував знамениту секторну діаграму в своїй книзі «Статистичний конспект» (1801). Потреба в цих нових формах діаграм та графіків постала з комерційної діяльності, але з плином часу з’являлися й інші, за допомогою яких рятували людські життя. У 1854 році Джон Сноу створив свою, зараз славнозвісну «Холерну карту Лондона», додавши маленький чорний стовпчик до кожної адреси, де був зафіксований випадок холери. Через деякий час можна було побачити щільність епідемічного прояву і вжити заходів, щоб стримати розповсюдження хвороби.

Ілюстрація 96. Холерна карта Лондона (Джон Сноу)

Спливав час, і фахівці, що використовували ці нові графіки та діаграми, набиралися все більшої хоробрості і експериментували далі, просуваючи цей носій інформації до тих рівнів, які нам відомі зараз. Андре-Мішель Гуеррі першим опублікував ідею карти, де різні регіони були розфарбовані в різні кольори залежно від значення певної змінної. В 1829 році він створив першу фонову картограму, зафарбувавши регіони Франції різними відтінками, щоб показати рівень злочинності в них. Зараз ми бачимо, як подібні карти використовують для показу результатів політичних опитувань, підсумків голосувань, розподілу за рівнем доходів та багатьох інших змінних, що мають географічну прив’язку. Здається, що це така проста ідея, але навіть сьогодні її важко опанувати та зрозуміти, не кажучи вже про раціональне використання.

Ілюстрація 97. Фонова картограма Франції, що відтворює рівень злочинності (Андре-Мішель Гуеррі)

Існує багато інструментів, які повинен розуміти і мати в своєму арсеналі фаховий журналіст, щоб будувати з їх допомогою візуалізації. І замість того, щоб відразу хапатися за найскладніше, краще спиратися на чудове підґрунтя графіків та діаграм. Все, що ви створюєте, має походити із серій «базових» графіків та діаграм. Якщо ви опануєте основи, тоді зможете просуватися далі до конструювання набагато складніших візуалізацій, створених із цих базових одиниць.

Два найбільш типові види діаграм – це стовпчикова та лінійна. І хоч вони дуже подібні у тому, як їх використовують, вони також можуть суттєво відрізнятися за значенням. Візьмімо як приклад продажі певної компанії з помісячною розбивкою. У нас буде 12 стовпчиків, що представляють кількість отриманих щомісяця коштів.

Ілюстрація 98. Проста стовпчикова діаграма: зручна для представлення відокремленої інформації

Давайте розглянемо, чому це мають бути стовпчики, а не лінійний графік. Лінійні графіки ідеальні для «неперервних» даних. Але наші дані продажів – це сума за місяць, а не щось неперервне. За допомогою стовпчиків ми знаємо, що в січні компанія заробила 100 доларів, а в лютому – 120. Якби ми використали лінійний графік, в нас так само були б ці 100 та 120 доларів у перше число кожного з цих двох місяців, але на основі лінійного графіка ми б вважали, що 15 числа компанія нібито отримала 110 доларів. А це не так. Стовпчики застосовуються для відокремлених вимірюваних одиниць, тоді як лінії – для неперервних, таких як температура.

Ілюстрація 99. Простий лінійний графік: зручний для представлення неперервної інформації

Ми бачимо, що о 8:00 температура була 20 градусів по Цельсію, а в 9:00 становила 22 градуси. Якщо ми подивимося на лінію, щоб дізнатися про температуру о 8:30, ми побачимо 21 градус, що є правильною оцінкою, бо температура є неперервною і у кожній точці не є сумою інших значень – вона репрезентує точне значення у певний момент або розрахункове значення між двома точними вимірами.

І стовпчикові діаграми, і лінійні графіки можуть накладатися одна на одну. Це чудовий інструмент розповіді, який може спрацьовувати по-різному. Давайте розглянемо як приклад компанію, яка має три філіали у трьох місцях.

Ілюстрація 100. Згрупована стовпчикова діаграма.

Кожного місяця ми маємо три стовпчики, по одному на кожен із філіалів, загалом 36 на рік. Коли ми розташуємо їх поруч один з одним, ми відразу побачимо, який філіал у якому з місяців заробляв найбільше. Це цікава та доречна тема для статті, але в тих же самих даних ховається й інша. Якщо ми розташуємо стовпчики один на іншому, так щоб на кожен місяць був тільки один, то втратимо можливість легко показати, який із них відповідає найбільшим доходам, але тепер зможемо бачити, у які місяці вся компанія вела бізнес найкраще.

Figure 101. Комбінована стовпчикова діаграма

І перша, і друга являють собою правильні методи показу однієї й тієї ж інформації, але вони передають два різні сюжети за допомогою одних і тих же початкових даних. Для журналіста найважливіший аспект роботи з даними – це від початку обрати сюжет, який буде цікаво розповісти. Чи це те, які місяці найкращі для ведення бізнесу, чи який із філіалів є передовиком? Це простий приклад, але в цьому є весь фокус журналістики даних – поставити правильне питання до того, як ви зайдете занадто далеко. А там стаття спрямовуватиме ваш вибір візуалізації.

Стовпчикова діаграма та лінійний графік – це дійсно хліб з маслом для будь-якого журналіста даних. Від цього ви можете просунутися до гістограм, горизонтальних графіків, спарклайнів, потокових графіків та інших. Всі вони мають спільні властивості та краще пристосовані для дещо відмінних ситуацій, таких як кількість даних, джерело даних чи розміщення графіка у тексті.

У журналістиці один з найчастіше застосовуваних способів візуалізації – це карта. Час, кількісні дані та географічні дані типові для передачі за допомогою карти. Нам завжди цікаво, наскільки більше чогось у певній області, ніж у іншій, або як щось переходить від одної області до іншої. Блок-схеми та фонові картограми є дуже зручними інструментами, які варто опанувати задля створення журналістських візуалізацій. Тут найголовніше – це знати, як правильно застосовувати кольорове кодування карти, щоб не увести читачів в оману і не створити в них помилкове враження. Результати політичних виборів, як правило, кодуються за принципом «все або нічого», навіть якщо у частині країни переможець отримав лише на 1% більше. Кольорові позначення не повинні бути бінарними, але градієнти кольорів слід застосовувати обережно. Розуміння карт – це велика складова журналістики. Карти з легкістю відповідають на питання «де» з відомої п’ятірки «Хто, що, коли, де, чому».

Коли ви освоїте базові типи графіків та діаграм, то зможете після цього будувати більш складні та вигадливі візуалізації даних. Якщо ви не розумієте основ, то ваші конструкції стоятимуть на хиткому фундаменті. Це схоже на те, як ви вчилися правильно писати – короткими реченнями, не забуваючи про аудиторію і не ускладнюючи матерій так, щоб звучати «по-розумному» - натомість просто передавати зміст читачам. Так само не потрібно передавати куті меду і з даними. Починати з малого – це найефективніший спосіб передати журналістський сюжет, повільно розбудовуючи його лише тоді, коли це потрібно.

Енергійний текст – це стислий текст. У реченні не має бути непотрібних слів, у абзаці – непотрібних речень. Із таких же причин у малюнку не має бути непотрібних ліній, в машині – непотрібних деталей. Вимога не в тому, щоб журналіст писав усі речення коротко, або щоб він уникав усіх деталей і описував лише контури, але щоб кожне слово промовляло.

Вільям Странк-молодший (Елементи стилю, 1918 рік).

Нічого страшного, якщо ви у вашій статті використаєте не всі дані. Вам не слід просити в когось дозволу бути лаконічним – це має стати вашим правилом.

Браян Суда, (optional.is)

 
 

Коментарі 0

Для того, щоб писати свої коментарі, залогіньтесь! Якщо ви не маєте логіну, тоді спочатку зареєструйтесь, щоб його отримати!