Роботи наступають

00:00,
21 Серпня 2012
2150

Роботи наступають

00:00,
21 Серпня 2012
2150
Роботи наступають
Штучний інтелект уже навчився писати інформаційні матеріали й планує взятися за аналітику. Чи справді в журналістів з’явились електронні конкуренти?

Все частіше представники медіаспільноти обговорюють, як цифрова епоха змінює журналістику і як ефективніше діяти в нових умовах. Однак технічний прогрес просувається такими гігантськими кроками, що вже потрібно говорити не про те, як цифра змінює журналістів, а, власне, про те, що вона замінює їх. І це не фантастичні припущення, а реальність.

Ось уже протягом декількох місяців на сайті Forbes деякі матеріали – звіти про прибутки різних компаній – підписано автором із оригінальним псевдонімом – Narrative Science. Дослівний переклад: «наука, яка розповідає», а насправді – це робот, що автоматично генерує контент, без участі людини. Звісно, це не той робот, якого одразу можна уявити: не залізний термінатор, що клацає по клавіатурі, а комп’ютерна програма із чітко заданим алгоритмом дій.

Нове кібертворіння викликало занепокоєння на західному медіаринку і дискусії про те, чи зможе подібний софт із часом замінити справжніх працівників пера. Російський журналіст Євген Морозов навіть опублікував на американському сайті статтю з провокаційною назвою «Робот вкрав мою Пулітцерівську премію!».

Навряд чи дійде до того, що премію присуджуватимуть роботам, однак частину завдань у редакції ЗМІ новий винахід справді може виконати.

Narrative Science – продукт чиказької компанії з однойменною назвою, яка заснована при Північно-Західному університеті штату Іллінойс (Northwestern University). Засновники компанії й винахідники технології – Стюарт Френкель (Stuart Frankel), Крістіан Гаммонд (Kristian Hammond) і Ларі Бірнбаум (Larry Birnbaum). Крістіан Гаммонд і Ларі Бірнбаум – випускники Єльського університету, а Стюарт Френкель – один із колишніх топ-менеджерів компанії DoubleClick.

Формально компанію створено 2010 року, але перед цим були десятиліття досліджень у лабораторіях штучного інтелекту, зокрема в Intelligent Information Laboratory (InfoLab). А першу статтю «написано» 2009 року – це звіт із бейсбольної гри чиказької команди, створений на основі ігрової статистики. Нині серед клієнтів Narrative Science уже 30 компаній, серед них, як було сказано, є Forbes, The Big Ten Network (компанія, що займається висвітленням спортивних подій). Проте більшість клієнтів бажають залишитися анонімними, тому в інтерв’ю керівництво Narrative Science їх назви не розголошує.

Роботи найбільше люблять таблиці

Розробники програми прогнозують, що через 15 років 90% новин будуть створювати комп’ютери. Таке твердження викликає багато питань, однак їх головний аргумент стосується надшвидкого накопичення онлайн-даних у різних сферах: фінанси, бізнес, політика, спорт. Все більше інформації буде у вигляді цифр, які потребуватимуть пояснення. Саме дані, за словами розробників Narrative Science, – головний матеріал для роботів-журналістів.

Отже, за яким принципом працює програма? За основу беруться, наприклад, дані у таблиці: статистика спортивного змагання чи фінансовий звіт. Програма виділяє головне та другорядне, робить узагальнення та висновки, найвагоміше виносить у перший абзац і заголовок. Звісно, щоби програма виконала таку операцію, перед цим працюють журналісти та вчені, створюють критерії, за якими власне визначати важливість інформації: якщо, наприклад, ідеться про футбольний матч, то гол чи видалення гравця буде важливішою інформацією, ніж кутовий чи жовтка картка. Своя специфіка й у фінансових звітах.

Розробники програми враховують, що в кожного з клієнтів є свій формат подачі текстів та новин: стиль, тон публікації, лексика. Тому спочатку програмісти спілкуються з журналістами і вивчають вимоги до текстів. Найпростіше – визначити форму подачі власних імен, дат, виділення курсивом чи напівжирним шрифтом. Значно кладніше – кут зору подачі інформації, головну лінію матеріалу.

Звісно, в результаті виходить досить сухий текст, але принаймні це текст, а не довга таблиця. Саме в цьому творці роботів вбачають своє головне досягнення. «Можливо, для когось таблиця – це гарна річ. Проте для більшості це не так. Потрібно інше: стаття, абзац, звіт, прогноз, порада. Це більш впливові речі, і те, до чого люди вже звикли», – вважає Гаммонд. Тому, щоб запобігти когнітивному дисонансу, який викликають численні колонки і рядки, комп’ютер робить основні висновки замість людини. І робить це дуже швидко – замітка після матчу з’являється вже через декілька секунд.

Від спортивних і фінансових тем Narrative Science переходить до політики. Перший досвід – аналіз висловлювань у Twitter про лідерів Республіканської партії напередодні виборчих перегонів у США. Програма шукала й моніторила всі розмови у соціальній мережі і потім трансформувала отримані дані в новину. Як пише у своєму блозі Гаммонд: «Головна проблема повідомлень у соціальних медіа – те, що їх надто багато, і як би журналіст не намагався проаналізувати їх, там усе одно більше інформації, ніж людина може переробити».

Такий твітер-експеримент – перший крок до роботи з неструктурованими даними. Власне, розробники технології прагнуть, щоб робот і далі міг працювати з коментарями, розумів мову. Це вдосконалить також спортивні повідомлення: можна подавати не лише звіт про матч, але й включати нестатистичну інформацію, таку як травми спортсменів чи юридичні проблеми.

Персональна новина для кожного

Ще один напрям, який збираються розвивати творці штучного інтелекту, це персоналізація новин. Фактично йдеться про новини не для цільових груп аудиторії, а для кожної окремої людини. Результатом персоналізації стане те, що користувачі клікатимуть на однакову новину, але за посиланням будуть бачити дещо різні тексти, залежно від власних інтересів, які робот визначатиме автоматично.

Ця технологія на сьогодні виглядає найбільш складною. Але персоналізація контенту в інтернеті вже активно розвивається: наша онлайн-діяльність фіксується, і на основі того, що ми шукаємо, що купуємо, які новини читаємо, нам пропонують схожий контент. Звісно, враховуючи ще й країну та місце розташування. Деякі провідні експерти вважають, що персоналізація новин – головний напрям розвитку нових медіа.

Яким чином це збираються втілити у Narrative Science? Як приклад – спортивні звіти, які даватимуть додаткову інформацію про гравців вашого міста/країни. Або медичні статті, що пропонуватимуть інформацію про лікування тими ліками, якими ви цікавилися раніше.

Гаммонд не погоджується із закидами, що, мовляв, така персоналізація спотворює картину світу в читача. Адже нині також все частіше кажуть, що, наприклад, через соцмедіа читач отримує новини тільки обмеженої тематики, пов’язані з власними інтересами – таке явище називають «новинною бульбашкою» – існування у своїй власній реальності. У випадку з Narrative Science ідеться про те, що одна загальна новина буде доповнюватися локальним контекстом залежно від місця розташування користувача чи його інтересів.

Людина vs. машина

Наразі це лише плани на майбутнє, поки що Narrative Science на етапі обробки статистичної інформації. Однак розвивається компанія дуже стрімко. Чи вже час непокоїтися працівникам медіа, що їх замінять автоматичні машини? Певні переваги очевидні: робот не потребує відпусток, відпочинку і виконує все у короткі терміни. З іншого боку, «послуги» подібної програми, звісно, платні. Як повідомляла  New York Times, клієнт платить 10 доларів за матеріал у 500 слів, для компанії це дешевше, ніж оплачувати працю штатного журналіста.

Розробники технологій переконують, що вони не збираються забирати хліб у журналістів. Зрештою, найбільш вдалий варіант – співпраця машини й людини. Програма може обробити великий масив інформації, а журналіст використати отримані узагальнення для аналітичного матеріалу. Крім того, програма в першу чергу зосереджена на тих ділянках роботи, які журналістам, як правило, не вистачає часу виконувати: особливо це стосується локальної інформації по містах, мікроперсоналізації.

Цікаво те, що створенні роботами матеріали на Forbes ні в кого з читачів не викликали сумнівів щодо «людського походження» автора. Тому виникає питання: чи це штучний інтелект настільки далеко зайшов, чи «справжній інтелект» останнім часом генерує контент усе більш шаблонно? Тобто журналістські повідомлення втрачають живий погляд і справді нагадують автоматизований інформаційний сервіс – цифри й сухі висновки. Тому такі технологічні новинки можуть стати приводом для вдосконалення роботи журналіста: адже «копіювати і вставити», обчислити машини можуть, а от брати інтерв’ю, аналізувати причини та наслідки подій – ні. Принаймні, поки що.

У статті використано повідомлення з таких джерел: Wired, New York Times, The Atlantic, Forbes, Slate, The Guardian, FastCompany , AllThingsD.

ГО «Детектор медіа» понад 20 років бореться за кращу українську журналістику. Ми стежимо за дотриманням стандартів у медіа. Захищаємо права аудиторії на якісну інформацію. І допомагаємо читачам відрізняти правду від брехні.
До 22-річчя з дня народження видання ми відновлюємо нашу Спільноту! Це коло активних людей, які хочуть та можуть фінансово підтримати наше видання, долучитися до генерування ідей та створення якісних матеріалів, просувати свідоме медіаспоживання і разом протистояти російській дезінформації.
У зв'язку зі зміною назви громадської організації «Телекритика» на «Детектор медіа» в 2016 році, в архівних матеріалах сайтів, видавцем яких є організація, назва також змінена
InfoLab
* Знайшовши помилку, виділіть її та натисніть Ctrl+Enter.
Коментарі
оновити
Код:
Ім'я:
Текст:
2019 — 2024 Dev.
Andrey U. Chulkov
Develop
Використовуючи наш сайт ви даєте нам згоду на використання файлів cookie на вашому пристрої.
Даю згоду