Як працює «Фейкогриз» — ловець маніпуляцій зі штучним інтелектом
Як працює «Фейкогриз» — ловець маніпуляцій зі штучним інтелектом
За даними дослідження від USAID-Internews, результати якого презентували в жовтні цього року, лише 11% українців віком 18-65 років з міст 50 тис.+, які обізнані про існування фейків, змогли їх відрізнити. При цьому 65% стверджують, що вміють відрізняти неправдиву інформацію в медіа. Тож, на думку головного редактора та співзасновника інтернет-видання Texty.org.ua Романа Кульчинського, новий інструмент «Фейкогриз» допоможе людям краще орієнтуватися в медіапросторі.
«Дехто думає, що якщо він читає три джерела і вибирає щось посередині, то таким чином розуміє, що відбувається. Насправді, таким чином неможливо нічого визначити. Якщо ви п’єте воду з трьох брудних джерел, то з неї ніколи не вийде чиста вода. Так само, коли ви почитаєте три брехливих джерела, то ви ніколи не розберетесь, де правда. Тому такий інструмент дуже корисний для медіаграмотності, для того, щоб люди розуміли, що варто читати, а що не варто», — зазначає він.
Сервіс, що постійно навчається
«Ідею нам дали наші читачі, коли ми зробили перший проект про дезінформацію, який називався “У нас погані новини”. Тоді нам запропонували подати інформацію не тільки у форматі дослідження, а зробити додаток, який буде сповіщати про дезінформацію», — розповідає аналітикиня проекту Надія Романенко.
Тоді, пригадує вона, до цієї пропозиції поставилися скептично додаток мав би працювати постійно й безпомилково. Згодом до ідеї повернулися, натренувавши штучний інтелект на більшій кількості новин.
«“Фейкогриз” — це наразі Telegram-bot і розширення для браузера Mozilla Firefox. Якщо встановити розширення і зайти на сайт, що часто публікує новини, які не відповідають журналістським стандартам, або на маніпулятивний матеріал, то користувач отримає сповіщення про це. Якщо надіслати “Фейкогризу” лінк у Telegram, то користувач отримає відповідь про те, чи новина містить порушення», — каже Надія Романенко.
Для створення «Фейкогриза» використали нейромережу, яку навчили спочатку на 7 тис. матеріалів. Їх перечитали і промаркували професійні журналісти. Потім додали ще близько 2 тис. новин уже після того, як з ними попрацював алгоритм. Ці новини вручну перевірили та виправили помилки класифікатора.
Штучний інтелект постійно навчається і стає кращим, якщо користувачі допомагають позначати маніпулятивні та фейкові новини. «Зараз ми збираємо позначки користувачів і будемо публікувати їх у “Фейкогризі” лише після модерації. Згодом плануємо цей процес покращити й частково автоматизувати. Ми не приховуємо, що використовуватимемо ці дані в очищеному вигляді для того, щоб довчати робота», — каже аналітикиня.
Розширення надсилає попередження «Підозрілий матеріал», якщо там спрацював класифікатор маніпулятивних новин, а також про маніпулятивні сайти.
«Ми додали інформацію про сайти від інших фактчекерських організацій для того, щоб об’єднати зусилля для покращення інформаційного простору. Наприклад, ми дали посилання на моніторинги “Детектора медіа” про маніпулятивний сайт “Страна.ua” та на моніторинги ІМІ про сайт Znaj.ua», — зазначає Надія Романенко.
Веб-інструмент працює майже з усіма українськими сайтами, які називають себе новинними ресурсами. «Ми орієнтуємося на українські сайти і поступово, якщо будемо розширюватися, додаватимемо російські сайти. Позначка «.ru» після назви сайту вже має нам про щось сигналізувати», — каже пані Романенко.
Версія «Фейкогриза» для браузера Chrome з’явиться найближчим часом через більш тривалий процес узгодження та перевірок з боку Chrome.
Точність штучного інтелекту — близько 95%
Більшість юзерів, за словами Надії Романенко, користуються інструментом з мобільного телефона через бота в Telegram. Вона сподівається, що після розробки бота для месенджера Facebook кількість користувачів зросте.
За даними розробників, точність класифікації «Фейкогриза» досягає 95%. Додаток уже має кількох активних користувачів, які ставлять позначки та допомагають маркувати контент. «На тому етапі, коли вплив міток користувачів буде суттєвий, ми будемо перевчати алгоритм. Я дуже сподіваюся, що цей етап настане і ми матимемо хороші позначки. Зараз частка хибно-позитивних (коли алгоритм маркує хорошу новину як таку, що містить маніпуляції) складає менше 6% на сайтах, де великий рівень маніпуляцій. Якщо ми запустимо алгоритм на новинах якісних сайтів, скажімо “Громадського”, то він на 100 новинах видасть 2-3 хибні попередження. Ми очікуємо, що користувачі допоможуть це виправити», — розповідає аналітикиня.
Для створення алгоритму розробники взяли вже готове рішення, яке адаптували до мови та самостійно натренували на виконання потрібних функцій. «Є моделі і в Google, i у Facebook. Ми взяли модель Fast.ai та самі тренували її та робили деякі зміни для того, щоб адаптувати до даних українською та російською мовою. Згодом ми залишили лише російську мову, бо українською ми не назбирали достатньо даних, щоб натренувати на високу якість класифікації. Більшість дезінформації — російською мовою. Але користувачі можуть позначати маніпуляції і на україномовних сайтах, і ми будемо тому раді. Можливо, якщо в нас назбирається достатньо дезінформації українською мовою, то ми зробимо те саме для української мови», — каже Надія Романенко.
За її словами, для цього потрібно близько 10 тис. промаркованих матеріалів. Зараз усі позначки від користувачів Надія Романенко перевіряє самостійно, за винятком ситуацій, з якими 100% точно справляється алгоритм. Скажімо, коли людина скаржиться на фейк чи емоційну подачу новини, але дає посилання на головну сторінку сайту. У майбутньому, якщо буде потреба, залучать окремого модератора.
Алгоритм має спеціальний захист від користувачів, які навмисне захочуть його заплутати, позначаючи якісні новини як маніпулятивні. Крім того, позначки для низки якісних сайтів постійно перевірятимуть вручну. «Якщо я розкажу повну схему перевірки, тоді це буде інструкція, як її обійти, і доведеться придумувати нову», — каже Надія Романенко.
Виходити за межі інфомедійної бульбашки
Розробники сервісу активно презентують його в регіонах. Після презентації в Києві, вирушили до Маріуполя, Бердянська. Заплановані презентації в Харкові та Львові. «Ми плануємо зустрічі з місцевими активістами, журналістами, щоб агітувати їх користуватися цим додатком. Ідея в тому, щоб створити мережу людей, яким було б це цікаво. Є частина людей, які по роботі читають новини, є частина людей, які просто безкінечно сидять у комп’ютері під час своєї основної роботи і теж читають новини, політично активні. Ми хочемо, щоб ці люди відзначали дезінформаційні новини. Це теж допоміжний інструмент для журналістів», — каже Роман Кульчинський.
За словами Надії Романенко, близько 80% людей, які були на заходах, написали «Фейкогризу» в Telegram. «Тобто, це класний спосіб залучити ядро користувачів, які не просто скачали якийсь незрозумілий додаток, не розібралися, не подивилися і забули, а це спосіб сформувати зв’язок зі своїми користувачами. Я думаю, що для розвитку медіаграмотності — це саме той інструмент, що треба», — зазначає вона.
Роман Кульчинський додає, що проект надалі вдосконалюватимуть. У планах — зробити додаток, який можна встановити на смартфон, бо близько половини користувачів читають тексти зі смартфонів. «Також було б непогано розробити інструмент, який позначав би маніпулятивні новини в соцмережах. Буває так, що одна й та сама дезінформація розходиться по різних сайтах і було б непогано зробити так, що, якщо ця новина позначена один раз, то й на інших сайтах позначається автоматично», — каже він.