Журналістика даних: Посібник



Використання та поширення даних: старі закони, приховані доповнення та реальність

  • 1369 Перегляди
  • 0 Коментарі
  • 18/01/2013Дата публікації

У цьому розділі ми побіжно розглянемо стан законодавства, пов’язаного з даними та базами даних, а також як ви можете відкрити доступ до своїх даних за допомогою вже існуючих публічних ліцензій та юридичного інструментарію. І нехай це не розхолодить вашого ентузіазму до журналістики даних. Юридичні обмеження щодо даних зазвичай не стануть вам на перешкоді, і ви легко зможете подбати про те, що вони не стануть на перешкоді й іншим, які захочуть використати опубліковані вами дані.

Констатуємо очевидний факт: ще ніколи не було так просто отримувати дані. Як це було до появи практики широкої публікації даних у Інтернеті: навіть якщо ви встановили, який саме набір даних вам потрібний, ви мусили запитувати тих, у кого була копія, щоб він надав її вам, і це типово передбачало документальні звернення та особистий візит. Тепер вам треба, щоб ваш комп’ютер зробив запит їхньому комп’ютеру, щоб той надіслав копію на ваш комп’ютер. Концептуально це виглядає подібно, але ви відразу маєте копію, а вони (автор чи видавець) нічого не робили, і, можливо, навіть уявлення не мають про те, що ви завантажили копію.

А як оцінюється завантаження даних за допомогою програми (що іноді називають «скрейпінг») з точки зору правил користування? Зверніть увагу на попередній параграф: ваш браузер є саме такою програмою. Чи можуть правила користування дозволяти доступ лише певним типам програм? Якщо у вас є забагато часу та коштів на те, щоб читати ці документи і, можливо, попросити поради в адвоката, то звісно ж, так і робіть. Але зазвичай достатньо просто не бути придурком: якщо ваша програма шкодить чужому сайту, доступ із вашої мережі до нього можуть заблокувати, і, можливо, так вам і треба. Зараз існує великий практичний досвід щодо отримання доступу до даних та скрейпінгу в Інтернеті. Якщо ви плануєте це робити, то прочитайте приклади на сайті на кшталт ScraperWiki, і це дасть вам відправну точку.

Як тільки ви отримали певні дані, що вас цікавлять, ви можете будувати до них запити, детально вивчати, сортувати, візуалізувати, знаходити кореляції та застосовувати будь-які методи аналізу над вашою копією цих даних. Ви можете публікувати результати вашого аналізу, в якому можна цитувати будь-які дані. Це право загалом виражене в поширеній фразі «свобода фактів» (подібно до свободи слова), але, можливо, ця фраза поширена лише серед тих, хто забагато думає про законність баз даних, або, говорячи ще більш широко (і більш розлого), про владу над даними.

А що як ви, будучи фаховим (або таким, що подає надії стати фаховим) журналістом даних, захочете опублікувати не тільки ваш аналіз, включно з деякими фактами чи даними, але повні бази/набори даних, використані вами – а можливо, й доповнені вами – на додачу до вашого аналізу? А можливо, ви просто займаєтеся впорядкуванням даних і не проводили ніякого аналізу – це добре, світові потрібні люди, що дбають про дані. Якщо ви використовуєте дані, зібрані кимось іншим, тут може бути проблема. (Якщо ваша база даних повністю створена вами, все одно прочитайте наступний абзац як мотивацію до практики поширення даних, про яку йдеться в абзаці, наступному за наступним).

Якщо ви знайомі з тим, як закони про копірайт обмежують використання творчих робіт – у випадку, коли власник копірайту не дав дозволу використовувати цю роботу (або ця робота перебуває у всезагальній власності, або ж ваше використання підпадає під винятки та обмеження на зразок права на добросовісне використання), а ви все одно її використали – розповсюдили, виконали тощо - власник прав може змусити вас припинити ці дії. Попри те, що факти належать усім, зібрання фактів можуть підпадати під аналогічне обмеження, хоча тут у відповідних законах є більше варіацій, ніж в законах про авторське право на творчі роботи. Якщо коротко, база даних може бути суб’єктом авторського права як творча робота. У багатьох юридичних системах діє принцип «створено в поті чола», тобто, просте укладання бази даних, навіть без будь-яких творчих складників, перетворює її на суб’єкт копірайту. Зокрема, в США, потрібний вищий рівень мінімальної творчої складової, щоб почав діяти копірайт (якщо вам цікаво, подивіться класичну справу Фейста про телефонну книгу). Але в деяких юридичних системах існують також «права на бази даних», які обмежують їхнє використання окремо від законів про копірайт (хоч часто ці норми накладаються одна на одну у сенсі того, що під них підпадає, особливо там, де фактично нема «порогу» креативності, потрібного для застосування копірайту). Найвідоміша з них – це закон Європейського Союзу про права на sui generis (унікальні) бази даних. Повторюємо знову, вам слід, особливо якщо ви в Європі, переконатися, що ви маєте дозвіл публікувати базу даних, отриману з якогось іншого джерела, перш ніж ви це зробите.

Очевидно, що такі обмеження не сприяють зростанню екосистеми журналістики даних (втім, це не означає, що вони загалом не є корисними для суспільства – так, вчені-соціологи та інші заявили Євросоюзу, що їхня діяльність неможлива без запровадження принципу sui generis, і наступні дослідження показали, що вони мали рацію). На щастя, будучи видавцем бази даних, ви можете зняти з неї такі обмеження (виходячи того, що в ній нема елементів, щодо яких ви не маєте дозволу на їхнє подальше поширення). Ви можете зробити це, оприлюднивши вашу базу даних під публічною ліцензію або передати її в усезагальну власність (public domain) – подібно до того, як багато програмістів оприлюднюють свій програмний код під вільною ліцензією чи ліцензією з відкритим початковим кодом, щоб інші могли писати на цій основі власний код (оскільки журналістика даних часто включає не тільки дані, але й програмний код, вам, звісно ж, слід публікувати й код також, щоб ваша підбірка даних та аналіз до них могли бути відтвореними). Є багато причин на те, щоб відкрити доступ до ваших даних. Наприклад, ваша аудиторія може створити нові візуалізації чи програми, на які ви можете дати лінк – так як зробив Guardian з їхньою візуалізацією даних Flickr pool. Ваші набори даних можна буде поєднати з іншими наборами, так, щоб читачі отримали краще розуміння теми. Те, що інші можуть зробити на основі ваших даних, може дати вам ідеї нових публікацій або ж інших проектів із журналістики даних. І безперечно, вам будуть вдячні за це.

Ілюстрація 67. Ярлики відкритих даних (Open Knowledge Foundation)

Якщо ви усвідомили, що публікація робіт під публічною ліцензією – це необхідність, виникає питання: а яка це має бути ліцензія? На це хитре питання часто дає відповідь той проект чи спільнота, на чиїй роботі ви будуєте свою, або до чиєї роботи ви хочете долучитися своєю роботою – використовуйте ту ж ліцензію, що й вони. Якщо хочете глибше з’ясувати це питання, починайте з набору вільних та відкритих ліцензій – таких, де будь-хто має дозвіл на будь-яке використання (тут може вимагатися, щоб для поширення був вказаний автор). Те, що визначення «відкритого програмного забезпечення» та «вільного відкритого коду» роблять для програмного забезпечення, визначення «відкритих знань» (Open Knowledge Definition) робить для всіх інших типів знань, включно з базами даних: воно описує, що саме робить роботу відкритою, і що відкрита ліцензія дозволяє чинити іншим користувачам.

Ви можете зайти на сайт Open Knowledge Definition і побачити актуальний набір ліцензій, які відповідають цьому визначенню. Загалом є три основні класи відкритих ліцензій.

• Передача у всезагальну власність, яка також виступає як ліцензія з максимальним обсягом дозволеного; на ці роботи не накладаються ніякі умови.

• Ліцензія на дозвіл використання, або ліцензія з вказівкою автора; єдина суттєва умова тут – це назвати автора роботи.

• Копілефт, взаємні ліцензії або ліцензії на однотипне поширення; вони також вимагають, щоб змінені роботи, якщо вони публікуватимуться, розповсюджувалися на умовах такої ж ліцензії.

Зверніть увагу: якщо ви використовуєте набір даних, опублікований кимось іншим під відкритою ліцензією, розглядайте попередній абзац як дуже коротку інструкцію про те, як виконувати умови цієї відкритої ліцензії. Ліцензії, які вам трапляться найчастіше, від Creative Commons, Open Data Commons чи різних урядових структур зазвичай включають підсумкову частину, у якій ви легко можете побачити суттєві умови використання продукту під цією ліцензією. Зазвичай ліцензію вказують на веб-сторінці, з якої можна завантажити набір даних (або «вилучити» з веб-сторінки, бо самі веб-сторінки можуть містити набори даних), або у помітному місці в самому наборі даних, залежно від формату. Там позначено й те, що вам також слід робити, якщо ви відкриваєте свої бази даних.

Повернемося до початку: а що як база даних, яку вам треба отримати, не представлена в онлайні або щодо неї діє якийсь із видів контролю доступ? Спробуйте, на додачу до запиту про доступ до вас особисто, попросити, щоб ці дані були відкриті для повторного використання. Можете вказати, які гарні речі можуть реалізуватися за допомогою їхніх даних, якщо вони це дозволять.

Якщо ви ділитеся даними зі світом, варто мати на увазі, що деякі набори даних можуть підпадати під дію законів про приватність та інші застереження чи обмеження. Дійсно, лише через те, що принцип відкритих даних усуває багато технічних перешкод та обмежень, пов’язаних з авторськими та суміжними правами, ви не повинні ігнорувати інші закони, що діють в цих ситуаціях. Але як це завжди було, існує дуже багато можливостей, а часом, і захисних норм для журналістів, якщо ваш здоровий глузд підкаже потребу розслідувати саме ці дані.

Хай щастить! Але найімовірніше, щастя радше знадобиться вам на інших етапах вашого проекту, аніж у залагодженні (низьких) правових ризиків.

— Майк Лінксваєр, Creative Commons

 
 

Коментарі 0

Для того, щоб писати свої коментарі, залогіньтесь! Якщо ви не маєте логіну, тоді спочатку зареєструйтесь, щоб його отримати!