Кожен матеріал про відкриті дані є цеглинкою до побудови відкритої держави — Дарина Хіміч, OpenDataBot
Кожен матеріал про відкриті дані є цеглинкою до побудови відкритої держави — Дарина Хіміч, OpenDataBot
У 2015 році Верховна Рада України ухвалила зміни до законодавства, згідно з якими громадянам гарантується право на доступ до інформації з урахуванням принципу максимальної відкритості. Згідно з законопроектом, усі дані, які відносяться до публічного сектору, будуть вноситися в єдину базу даних data.gov.ua. Так в Україні було започатковано сферу відкритих даних.
Проте українці погано розуміють, яка їм користь від відкритих реєстрів, розповідає Дарина Хіміч, директорка з комунікацій сервісу OpenDataBot. Тому важливо дати практичні приклади того, як із цими даними працювати. Сервіс OpenDataBot збирає інформацію з відкритих державних реєстрів та надсилає її на месенджер користувача — Telegram, Facebook Messenger, Skype або Viber. У першу чергу така функція моніторингу корисна для підприємців, оскільки, підписавшись на оновлення інформації про свою компанію, вони зможуть швидко дізнатися про спробу рейдерського захоплення. Утім, отримати користь від відкритих реєстрів можуть не лише підприємці, але й журналісти — команда сервісу прагне тісніші співпрацювати з медіа.
«Ми готуємо власні матеріали на основі відкритих даних раз на тиждень, — зазначає Дарина Хіміч. — Але головна складність навіть не в тому, щоби зібрати й проаналізувати дані, а в тому, щоби придумати правильне питання — що ж ми хочемо з цих реєстрів дізнатися. Для нас це завжди брейнсторм. Тому нам дуже не вистачає питань від журналістів».
Про ідею та цільову аудиторію сервісу
Дарино, як з’явилася ідея створити OpenDataBot?
Це було пов'язано із проблемою, з якою свого часу стикалися засновники сервісу, Олексій Іванкін та Андрій Хорсєв. У 2013 році один із їхніх проектів — торговельний майданчик «Клумба» — захопили рейдери. Якби на той час реєстри були відкритими, власники «Клумби» набагато швидше дізналися б, що в реєстраційних даних відбулися зміни. Так можна було би оперативно звернутися до правоохоронних органів, здійняти розголос у ЗМІ. Оперативна реакція в такій ситуації надзвичайно важлива.
Ситуацій, у яких власник компанії може не знати, що відбувається з компанією, досить багато. Наприклад, є ймовірність підкупу людини, яка займається реєстрами, й вона може внести якісь зміни. Або проти компанії ініціюють судову справу, а кур'єр зі сповіщенням може не доїхати.
Тому в першу чергу ідея сервісу така: якщо у вас є компанія, ви маєте про неї знати більше, ніж держава. Як батьки мають знати про свою дитину більше, ніж про неї знає вчитель. Так само з компанією і державою. Щоби перевірити компанію у відкритих реєстрах, потрібна як мінімум година часу. А якщо вона не одна і треба перевірити ще контрагентів? У великих фірмах є юрист, який займається цими завданнями. Власне, це одна з причин, чому юристи люблять OpenDataBot — він автоматизує та спрощує їм увесь цей процес пошуку. Фактично можна одного юриста з компанії звільнити. (Сміється.)
Розкажіть про вашу команду. Хто працює над сервісом?
У нас склалася хороша команда — вона невелика й дуже ефективна. Ми можемо показати приклад державі, як ефективно працювати. У нашій команді п'ять осіб: я (директорка з комунікацій. — MS), юрист, програміст і два співзасновники, вони ж ідеологи проекту — Олексій Іванкін та Андрій Хорсєв. Насправді в нашій команді всі працюють у тісній зв'язці.
Ми всі прийшли з різних сфер і в чомусь це наш плюс. Я, наприклад, не дотична до ІТ, в мене журналістський бекґраунд. У роботі з айтішниками я помітила одну цікаву особливість. Вони створюють якусь нову фічу, програмну можливість чи функцію. На їхню думку, якщо про неї публічно повідомити, це має захопити всіх, здійняти хвилю. А насправді це може бути не зовсім цікаво чи просто незрозуміло широкій аудиторії. Тому дуже добре, що ми дивимося на сервіс різними поглядами: я дивлюсь, як зробити його більш медійним, наш юрист Микита дивиться на нього з юридичного погляду, Олексій та Андрій — із підприємницького — як можна його монетизувати. Така взаємодія людей на межі гуманітарних наук і технічних дає дуже цікаві результати.
Хто ваші основні користувачі? На кого ви в першу чергу орієнтувалися, коли робили цей сервіс?
У нас є три цільові аудиторії, які ми декларуємо, але фактично їх може виявитися й більше. По-перше, це підприємці, які хочуть стежити за своїм бізнесом. По-друге, це юристи, оскільки сервіс дозволяє їм оптимізувати внутрішні процеси, спростити рутинну перевірку, якою не хочеться займатися. По-третє, це журналісти. Із цією аудиторією ми тільки починаємо працювати, але нам уже є що розповісти.
OpenDataBot відкриває чимало можливостей для журналістів. Я спостерігала, як працюють із медіа інші компанії, які мають справу з відкритими даними. Наприклад, є «007» — пошуково-аналітична система, яка моніторить використання публічних коштів. У них стратегія поведінки з журналістами приблизно така: вони оголошують міні-конкурси, заохочують журналістів писати і пропонують їм свою допомогу. Є майданчик ProZorro, який теж проводить тренінги, як створювати матеріали за їхніми даними. Ми вирішили діяти трохи інакше: почати робити розслідування самостійно.
Я перетиналася з журналістикою даних ще 2013 року, в школі інфографіки «Інтерньюз». Так склалося, що журналістів лякають числа, таблиці, тим паче якщо доводиться з ними щось додатково зробити. Воно наче й нескладно посидіти, помедитувати і зрештою зробити з цього контент, але журналісти дивляться на ці дані й думають: «Гм, краще я напишу просто текст».
На щастя, в нас у команді зібралися люди, які можуть допомагати мені з числами. А я розумію, як їх можна подати журналістам, як зацікавити їх. Під час роботи в нас додавалися нові реєстри, й ми раз на тиждень методично випускали різноманітні матеріали. По суті, інтеграція з журналістикою — це великий експеримент для нас.
Якось ми побачили красиве число — за даними Мін'юсту, в Україні зареєстровано 2 млн підприємців. Перевірили інформацію в Державній службі статистики й виявили, що дані відрізняються більш ніж на 300 тисяч.
Іншого разу ми порівняли чорний список Антимонопольного комітету та учасників тендерів на ProZorro. Річ у тім, що компанія, яка потрапляє до чорного списку АМКУ, три роки не може брати участі в державних тендерах. Можна дискутувати про те, наскільки об'єктивним є цей чорний список і наскільки прозоро до нього вносяться компанії. Але тим не менш, за українським законодавством, є така заборона. І компанії з чорного списку АМКУ виграли на торгах ProZorro понад 460 мільйонів гривень за останній рік.
Ми дивилися на різні реєстри й комбінували їх, думали, що ж із них можна зробити. Коли цей процес не автоматизований — копатися в таблицях дуже складно. Завдяки боту ми можемо швидко шукати хитрі комбінації — наприклад, перевірити, скільки є компаній, які мають борги або хочуть стати банкрутами. Найскладніше в цьому процесі — поставити правильне запитання.
Журналісти мають нести свою відповідальність за неточні дані
Як журналістам знаходити ці правильні запитання?
По-перше, можна відстежувати інформаційні приводи й шукати відповіді на вже поставлені запитання. Наприклад, скільки ФОП закриється після нових змін. Так ми подивилися, що з 1 січня ФОПи (фізичні особи — підприємці. — MS.) другої та третьої групи зобов'язані платити єдиний соціальний внесок 704 гривні на місяць, навіть якщо не мають прибутку. Ситуація трохи іронічна, оскільки якщо бізнес не в стані заплатити цю суму, то є серйозні запитання до його діяльності. Тим не менш, по соцмережах це розлетілося з хештегом #зрада, мовляв, наших підприємців знищують. Ми вирішили відстежити, як змінюватиметься кількість ФОПів. Ще не почав діяти закон про новий порядок роботи фізичних осіб — підприємців, а вже за тиждень до цього було закрито 10 850 ФОПів. А коли він набув чинності, закрилися ще 128 тисяч. Щотижня ми отримуємо нові дані і збираємо їх в одній таблиці.
На жаль, у нас ані політики, ані журналісти не звикли оперативно реагувати на ситуацію. Ми стикалися з тим, що давали застарілі дані з посиланням на нас. Поки що ми обмірковуємо, чи варто втручатися, якщо журналіст вказує число, яке було актуальним три тижні тому. І період, за який було зібрані дані, при цьому часто не вказується. З одного боку, це несе репутаційні ризики для нас. З іншого — журналісти мають нести свою відповідальність.
Є чимало реєстрів, через які можна стежити, як оновлюється інформація, й це дані, які не потребують особливої обробки. Відкриття ФОПів, їх закриття, кількість підприємців в Україні, загальний обсяг податкового боргу — все це можна з них дізнатися.
Є судовий реєстр — але в ньому треба «копати». Для таких спеціальних випадків у нас є юрист, який може підказати, як знайти ту чи іншу справу — тут своя юридична кухня. Якось ми відстежували справу щодо обшуків у компанії Lucky Labs, які відбулися у квітні 2016 року. Згодом, у вересні 2016 року, були обшуки в інтернет-провайдера «В.О.К.С.». У ЗМІ ці дві справи було представлено як нападки на IT-спільноту. Ми через реєстр з'ясували, що номер справи і щодо Lucky Labs, і щодо «В.О.К.С.», — один і той же. Якщо журналіст відстежує якусь судову справу — є сенс підписатися на неї й отримувати сповіщення.
Також я би радила розібратися, які реєстри дають яку інформацію. І які реєстри представлені в нашому сервісі. Поєднуючи різні реєстри, можна знаходити історії.
Є цікаві категорії поділу за областями та галузями. У Єдиному державному реєстрі кожне підприємство закріплене за певною адресою, й там вказано його вид діяльності. Наприклад, можна через реєстр переглянути податковий борг у розрізі за областями. Це той найпростіший аналіз відкритих даних, який ми робимо. Дуже часто це цікаво для регіональних ЗМІ. Вони можуть порівняти свою область з іншими, скласти своєрідну «таблицю лідерства» по Україні й показати своє місце в ній.
Як виникла ідея об’єднувати роботу сервісу та роботу зі ЗМІ?
Я почала тісно співпрацювати з командою OpenData півроку тому. Тоді ж у нас виникла думка, що проекту потрібно більше репрезентації в медіа.
Для нас важливо пропагувати ідею відкритої держави. Кожне розслідування, кожен матеріал про відкриті дані — цеглинки в будівлі відкритої держави. Якщо люди не починають активно використовувати ці відкриті реєстри, в чиновників з'являються підстави казати, що ті не потрібні. Тому спілкування з журналістами — завдання, яким мають займатися всі, хто працює з відкритими даними. Це практичні приклади того, навіщо вони потрібні: журналіст зробив розслідування, підприємець захистився від рейдерства, компанія зберегла кошти. Чим більше подібних кейсів буде в нашій історії, тим більші наші шанси просувати прозорість у країні. Якщо не використовувати відкритих реєстрів практично, то справді дуже складно пояснити, навіщо вони потрібні й навіщо нам робити відкритими нові реєстри.
Прозорість, без сумніву, має бути. Це такий загальносвітовий виклик. Якщо держава не буде оцифровувати інформацію та викладати її в доступному вигляді, в України дуже мало шансів на розвиток.
Існує індекс відкритості бюджетів, що його створює незалежна група International Budget Partnership. Згідно з ним, Росія, яку ми часто критикуємо за цензуру, на порядок вище за нас. Тому зміни нам треба починати з себе.
Як часто до вас звертаються журналісти по аналіз даних чи візуалізацію великих обсягів інформації? Скільки часу займає така робота?
Ми тільки почали працювати в цьому напрямі. Поки що це була завжди ініціатива з нашого боку. Журналістам дещо лінь самостійно займатися подібною роботою. Та коли вони бачать хорошу інфографіку чи цікаві цифри — беруть для публікації. Крім того, ми робили й індивідуальні проекти з редакціями.
Ми готуємо власні матеріали на основі відкритих даних раз на тиждень. Головна складність навіть не в тому, щоби зібрати й проаналізувати дані, а в тому, щоби придумати правильне запитання — що ж ми хочемо з цих реєстрів дізнатися. Для нас це завжди брейнсторм. Тому нам дуже не вистачає запитань від журналістів.
Що стосується часу, то в нас немає стислих дедлайнів, тож ми нікуди не поспішаємо, коли готуємо свої невеликі новини.
Про статистику самогубств та розвиток журналістики даних в Україні
Багато дослідників — і з Reuters Press Institute, і з Nieman Lab — прогнозують, що журналістика, заснована на великих обсягах даних, відіграватиме все більшу роль. На вашу думку, яке майбутнє цієї галузі?
Я думаю, що роль цієї галузі буде першочерговою. Даних стає дуже багато. Більшість сервісів, які ви нині бачите, працює на основі великих даних. Ви вибираєте готель на Booking чи викликаєте таксі через Uber. Навіть існує медичний сервіс, який за кількома рядками з вашого анамнезу може автоматично поставити діагноз. Мова не лише про цифри, питання глибше. Рахувати можна що завгодно. Журналіст, якому потраплять у руки бази даних Google, мабуть, стане найкращим журналістом у світі. (Сміється.)
Якщо повернутися до нашого буденного життя, до того, що нині реально можуть робити журналісти, — вони можуть, як мінімум, порівнювати числа. Розгляньмо гучну справу про «групи смерті» в соцмережах та гру «Синій кит». Якби журналісти, замість грати на емоціях та брати коментарі в сумнівних експертів, подивилися на статистику, вони би дізналися, що є певна кількість підліткових самогубств щороку. І частка тих, хто вчинив самогубство та перебував у «групі смерті», серед них невелика. Є домогосподарки, які вкорочують собі віку. Є люди з посттравматичним стресовим розладом, які чинять так само. Такі явища в суспільстві є. Щоби зрозуміти масштаб, можна розглянути кількість самогубств серед дітей та підлітків і порівняти їх із кількістю смертельних випадків унаслідок ДТП. Усе це можна зрозуміти, порівнявши числа. Як мінімум, це забезпечить більшу об'єктивність. Із числами дуже складно сперечатися. Тут журналіст може опинитися на коні.
Журналістика даних — це великий тренд. Та й узагалі нині все, що пов'язане зі словом «дані» — це тренд.
Як в Україні розвивається журналістика даних?
В Україні є відомий проект — це Texty.org. Їхня технічна модель дуже цікава, проте вона мені не зовсім близька. Усі журналісти цього проекту є одночасно й дизайнерами, і програмістами, й фахівцями в іще десяти інших професіях. З одного боку, це дуже висока планка, з іншого — це сповільнює роботу. Крім того, це рідкісні випадки, коли людина готова настільки зануритися в різні сфери і зробити професійний продукт — і з погляду програмування, й дизайну, і змісту. Texty — дуже сильна команда, та якщо поглянути правді в очі, таких людей одиниці. Крім того, довготривалі проекти впираються і в суто фінансові питання. У журналіста не буде часу й ресурсів півроку робити одне складне дослідження, якщо він не має на це якогось гранту.
Українські видання намагаються потроху використовувати інфографіку, але це лише один із інструментів. Якщо у вас немає історії й ви не поставили правильного запитання, робити інфографіку немає сенсу. Є ж іще й інші знаряддя: сторітелінг, інтерактивні історії тощо. У журналістики дуже багато інструментів, які можуть допомогти зробити матеріал зрозумілішим. Та для цього потрібно напружитися й вийти із зони комфорту.
В Україні, на жаль, мало проектів із журналістики даних. Я не дуже вірю, що справа лише в недостатньому фінансуванні. Мені здається, це певного роду пострадянська криза, коли ми вважаємо, що журналістам хтось щось винен. Є поширене твердження, що журналісти працюють для суспільства. Ніхто не знає, хто це суспільство, але очікують від нього грошей за свою роботу. Більш підприємницький підхід — це коли в тебе є продукт і ти думаєш, кому він може бути цікавим, хто готовий платити за нього гроші. У цьому контексті «суспільство» — це не відповідь.
Як Open Data Bot збирається розвиватися далі?
Ми продовжимо активну медійну діяльність. Я сподіваюся, що ми потроху розворушимо наших журналістів і в нас вийде зробити багато цікавого контенту разом. Є й комерційні цілі, але ми поки не будемо їх анонсувати.