Вісім сервісів для роботи з відкритими даними — від найпростіших до складних
Виділіть її та натисніть Ctrl + Enter —
ми виправимo
Вісім сервісів для роботи з відкритими даними — від найпростіших до складних
Під час тренінгу «Відкриті дані для журналістів», який організував сервіс моніторингу Opendatabot, тренери пояснили, що інформацію можна умовно поділити на закриту й відкриту. А відкрита інформація та відкриті дані — це різні речі. «У відкритій інформації є публічна інформація. А в публічній інформації є ще один підрозділ — відкриті дані», — розповів юрист проекту Микита Підгайний.
Одна з важливих властивостей відкритих даних — те, що вони існують у такому форматі, який дозволяє їх автоматично обробляти. Вони також є безкоштовними для використання. Наприклад, скан у PDF не є відкритими даними. Так само відкритими даними не є інформація, викладена на сторінках сайту або яка захищена «капчею» (автоматизований тест Тюринга для розрізнення комп'ютерів і людей).
Де ж шукати відкриті дані й як журналісти можуть використовувати їх у своїх матеріалах? Тренерка Дарина Даниленко поділилася своїм переліком інструментів для роботи з такими даними. Серед них — Prozorro, Clarity project, «Декларації», Edata, «Посіпаки», «Приховані інтереси», «Антикорупційна карта ремонтів» ну і, власне, сам Opendatabot.
ProzorroІнструмент складний. Це зрозуміло з першого погляду на його головну сторінку. Однак на сайті Prometheus є окремий онлайн-курс, присвячений публічним закупівлям, а сама команда Prozorro організовує та проводить тренінги щодо того, як користуватися їхньою системою. Також презентація із функціоналом Prozorro є на самому сайті системи.
Наприклад, за допомогою сайту можна швидко подивитися закупівлі в розрізі за областями, проаналізувати, хто виступає організатором торгів, яку суму коштів областям вдалося заощадити за допомогою системи, переглянути цей процес у динаміці.
У системі є окрема вкладка «Аналіз» (для того, щоби продивитися всі вкладки сайту, потрібно натиснути на значок зі стрілкою компаса в лівому верхньому кутку екрана і обрати пункт «Огляд додатка»). Тут усі закупівлі розбито за категоріями: будівельні роботи й поточний ремонт, нафтопродукти, паливо, електроенергія, транспортне обладнання, медичне обладнання тощо.
Наприклад, через цю систему я дізналася, що в моєму рідному місті за 2018 рік відбулося п’ять тендерів і всі вони стосувалися ремонту регіональної лікарні. А що стосується жалюгідного стану інфраструктури в регіоні, то тут оголошено сім тендерів на майже 695 мільйонів гривень. Prozorro може бути корисним не лише журналістам, але й тим, кому цікаво, куди й на що витрачаються кошти з бюджету. (Спойлер — далі йтиметься про ще кілька інструментів, які добре підходять для такого завдання.)
Водночас тренерка Дарина Даниленко радить спершу сформулювати тему, про яку ви хочете писати, й потім шукати під неї дані, щоб не потонути в усьому масиві інформації, яку можна знайти. Приклади журналістських матеріалів, створених на основі даних із Prozorro, можна подивитися тут.
Clarity project
Це база даних і система аналітики публічних закупівель Prozorro. Як жартує на сайті сам розробник, система вміє «сильно гальмувати і час від часу падати». Але окрім того вона шукає закупівлі за замовниками, учасниками, контрактами і скаргами. В Clarity project можна й шукати інформацію про учасників торгів і зв'язки між ними, й робити аналітику і створювати графіки.
Простіше кажучи, всі, хто «обламався» розбиратися з усіма налаштуваннями Prozorro самостійно, можуть спробувати працювати із Clarity project. Я спробувала відфільтрувати всі закупівлі, організатором у яких виступає Міністерство інфраструктури, й одразу оцінила жарт про те, що система сильно гальмує. Справді, порозумітися з нею вийшло не одразу.
Корисними будуть відео із прикладами на сторінці проекту у Фейсбуку. На прикладі розбирається, як виявити учасника торгів, який є субпідрядником іншого й використовується у схемі для перемоги першого. Наприклад, підставний субпідрядник подає дуже мало документів на тендер, не знижує ціну на аукціоні, аби мати більше шансів виграти його. Тут же й показуються інші лайфхаки роботи з Clarity project. Приміром, якщо в різних заявках згадується одна й та ж поштова адреса чи інші дані, система покаже зв’язки між ними.
Також помічним буде невеликий блог проекту на Medium. До речі, відсутність логотипу — це окрема «фішка» проекту, тому на заставці до цього інструмента просто картинка з кодом.
Декларації
Стартову сторінку проекту цікаво розглядати саму по собі: на ній зображено дві інфографіки із топ-сотнею чиновників і депутатів за статками та за доходами. Система аналізує електронні декларації за різними пошуковими запитами — можна вказати точне ім’я, а можна посаду, область чи назву відомства. У розширеному пошуку можна фільтрувати результати за типами документів, роками, типами посад чи регіонами. Сайт дуже простий і зрозумілий, довго розбиратися з принципом його роботи не доведеться.
Що цікавого можна зробити з цими даними? Безліч прикладів є на самому сайті «Декларацій». Наприклад, із даних декларацій можна скласти інфографіку із топ-десяткою чиновників, які виграли великі суми в лотерею. Або з’ясувати, що народний депутат Антон Геращенко живе у квартирі, оренда якої коштує близько трьох тисяч доларів на місяць, і оплачує її його тесть, який не має жодних доходів.
Edata
На цьому порталі можна переглянути інформацію про використання публічних коштів. Він оприлюднює всі транзакції Державної казначейської служби, інформацію про використання коштів державного й місцевих бюджетів, звітність та договори суб’єктів, які так чи інакше мають стосунок до публічних коштів.
Мапа, зображена на головній сторінці Edata, має цілком практичне призначення: на ній кольорами виділено, в яких областях відбувається найбільший рух коштів по єдиному Казначейському рахунку. А якщо клацнути на конкретну область — то можна побачити, що це за транзакції.
Окремо можна робити точніший пошук: за даними щодо платника, одержувача коштів, регіоном, датами здійснення платежів.
Якщо тема для вас нова й ви плутаєтеся в термінах — не біда, Edata пропонує окремий словничок, де все розтлумачується.
Цікаво, що Edata — державний портал, а не ініціатива журналістів чи активістів. Партнерами у створенні порталу виступили Transparency International, німецьке товариство міжнародного співробітництва Deutsche Gesellschaft für Internationale Zusammenarbeit, Open Data Incubator 1991 та низка інших організацій.
Власне, головне призначення порталу — зробити максимально доступною і прозорою інформацію про використання публічних коштів. Але журналісти теж можуть пошукати в ній щось цікаве.
Посіпаки
Маленькі жовті створіння, які еволюціювали з одноклітинних організмів і мають на меті слугувати найамбітнішим лиходіям… Ой, ні, чекайте, йдеться не про тих посіпак.
Український сайт «Посіпаки» — це відкрита база даних помічників народних депутатів України. Вона створена на основі офіційної інформації Апарату Верховної Ради України. Сайт повідомляє, що загалом йому «відомо про 75465 посiпак».
Розбиті вони на групи за скликаннями — від четвертого до восьмого. Кількість «посіпак» в одного депутата іноді досягає майже п’ятдесяти. Наприклад, у Юлії Тимошенко 47 помічників, із них вісім працюють на платній основі й решта — на громадських засадах. Також у базі є алфавітний покажчик, за яким можна знайти потрібну людину.
У базі можна подивитися, з якими депутатами раніше працював той чи інший помічник та чи працював він на платній основі. Наприклад, дружина Президента Марина Порошенко працювала помічницею в депутатів 4-го і 7-го скликань.
Окрім того, є ще й сайт «Посіпаки 2. Мініміньони» із даними про помічників депутатів обласних і місцевих рад, теж із дуже зрозумілою та зручною навігацією.
Приховані інтереси
Цей інструмент, створений ГО «Антикорупційний штаб», дозволяє здійснювати пошук по базі за іменем чиновника, назвою компанії чи кодом ЄДРПОУ. Усі дані для бази збиралися з відкритих джерел: декларацій, відкритих реєстрів, публікацій у ЗМІ тощо. На жаль, у базі поки є не всі міста, але вона поступово оновлюється.
Як пояснюється на сайті, конфлікт інтересів — це наявність суперечності між приватним інтересом депутата й інтересом суспільства. Найпростіший приклад — коли громада може втратити прибуток від продажу земельної ділянки в центрі міста, бо її в довгострокову безкоштовну оренду забрав депутат місцевої ради.
У базі є ще одна цікава вкладка — «Автоматичний аналізатор». На ній можна завантажити документ у форматі .pdf, .doc, .docx і перевірити його на збіг із документами, наявними у базі. Якщо аналіз знайде щось спільне, тоді, швидше за все, депутат, який фігурує в документах, має конфлікт інтересів.
Приклади того, як можна працювати з даними «Прихованих інтересів», можна подивитися тут.
Антикорупційна карта ремонтівСеред фільтрів для отримання точнішої інформації — категорії (житло, медицина, освіта, майданчики, інфраструктура, соціалка, дороги), замовники, підрядники, місто та сума ремонту.
Окрім того, знайти те, що вас цікавить, можна просто наблизивши карту туди, де розташований об’єкт. Наприклад, навести її на свій будинок і переглянути дані, які підтягне система. Якщо кошти на облаштування прибудинкової території виділялися, але ви точно знаєте, що ніяких робіт не було, — вітаємо, ви щойно знайшли приклад корупції!
На сайті ж можна залишити скаргу або повідомлення про ймовірну проблему з тим чи іншим об’єктом.
Opendatabot
Проект задумувався як інструмент моніторингу реєстраційних даних українських компаній та судового реєстру. Якщо раптом у реєстрі з’являться зміни, власників компаній, підписаних на сповіщення через Opendatabot, одразу буде попереджено про ризик рейдерських захоплень.
Однак із часом проект переріс у щось більше й почав додавати нові й нові дані та функції. Тепер у ньому можна знайти дані про фізичних осіб-підприємців, судові справи, декларації, кінцевих власників компаній, наявність і суму податкового боргу тощо. На основі цих даних можна робити дуже різнопланові новини та матеріали, комбінуючи їх між собою.
На сайті є окрема інструкція з того, які матеріали можна створювати за допомогою інструментарію сайту. Окрім того, журналісти можуть заповнити спеціальну форму та отримати професійний акаунт.
***
У підсумку інструменти для того, щоб займатися журналістикою відкритих даних, існують. Тепер вам залишилося знайти в собі терпіння й посидючість, аби спробувати всі ці сайти в ділі. До того ж не обов’язково це мають бути величезні лонгриди із прицілом на Пулітцера. Невеликі новини із влучно знайденою цифрою можуть принести вашому сайту непоганий трафік.