Вірусні новини. Як медіа формували наше уявлення про ситуацію з COVID-19
Вірусні новини. Як медіа формували наше уявлення про ситуацію з COVID-19
MediaSapiens публікує результати кількісного дослідження аналітичної організації VoxUkraine. Також регулярні моніторинги висвітлення теми пандемії COVID-19 в медіа проводять, зокрема, «Детектор медіа» та Інститут масової інформації.
Протягом останніх п’яти місяців кожна четверта новина в українських онлайн-ЗМІ стосувалася пандемії COVID-19. Теми цих новин були дуже різноманітні: міжнародна статистика, темпи поширення вірусу, описи симптомів та розробка вакцин. Майже щодня виникали нові повідомлення про виявлення вірусу в публічних осіб, публікації про стан лікарень, медичні закупівлі та рекомендації про дотримання соціальної дистанції. Великі обсяги інформації та перенасиченість інформпростору повідомленнями про коронавірус стали поживним ґрунтом для розповсюдження міфів та фейків. З початку пандемії команда VoxCheck спростувала близько 300 фейків про COVID-19.
Коронавірус став одним з основних інфоприводів, про який щодня писали сотні новин. Ми проаналізували 473 527 новин з найбільших 27 онлайн-ЗМІ України протягом п’яти місяців: з лютого по червень 2020 включно. Щоб побачити приховану структуру за інформаційним шумом, ми застосували алгоритм машинного навчання LDA для аналізу великих наборів текстової інформації.
Питання термінології
Більшість людей дізнались про коронавірус на початку року, коли з’явилися новини про новий вид вірусу. Цей вірус належить до групи коронавірусів, які мають схожий хімічний склад та утворюють «корону» на глікопротеїнах.
Однак ЗМІ скоротили пояснення та назвали конкретний вірус іменем усієї групи. У результаті така назва прижилась і стала найбільш уживаною в медіа. У нашому масиві згадок саме «короно вірусу» у тілі статті – 89%, а в заголовках – 80% (від усіх текстів зі згадкою ковіду/коронавірусу/SARS тощо).
Набагато рідше ЗМІ посилаються на назву хвороби, що викликає вірус, – COVID-19. Цей термін можна зустріти в 10% текстів. У заголовках термін майже не вживається (0,15% від усіх заголовків текстів про вірус).
Офіційну назву вірусу – SARS-CoV-2 – медіа майже не використовують: 0,28% згадок в тілі статті та 0,15% у заголовках.
Напалм новин
Епідемія вірусу SARS-CoV-2 поглинула увагу суспільства. З початку пандемії й до кінця червня майже чверть усіх новин (23% або 112,5 тис. публікацій) стосувалися коронавірусу.
Пік цікавості до ковіду припав на березень-квітень, коли в Україні виявили перший випадок захворювання COVID-19 та запровадили карантинні обмеження. Порівняно з лютим частка новин зі згадкою коронавірусу зросла втричі: з 11% до 37% (37 310 новин у березні проти 9 850 у лютому).
У квітні новин зі згадкою ковіду стало трішки менше – 32% (34 204 новини), але інтерес до нього все ще тримався – можливо, через обговорення карантинних обмежень, які подовжувались кілька разів.
За два місяці карантину суспільство втомилося не тільки дотримуватись правил соціальної дистанції, а й читати новини про коронавірус. Так, у травневих стрічках новин повідомлень про коронавірус було 20% (19 655), а в червневих – 13% (11 387).
Основні теми про коронавірус
27 онлайн-ЗМІ, які потрапили до нашого моніторингу, публікували понад 3 тисячі новин на день на всі можливі теми, серед яких була і пандемія. Деякі новинні сайти щохвилини випускають по 20-30 новин. Звичайно, людина не може встигати за всіма цими новинами. Однак за допомогою алгоритму LDA з цих потоків інформації можна виокремити теми, які повторювались найчастіше (рис. 1). Саме такі теми мають шанс вплинути на громадську думку про пандемію.
LDA – це імовірнісна статистична модель, яка генералізує дані. Алгоритм LDA працює з кожним документом (у нашому випадку це стаття) у масиві даних та привласнює йому вірогідність бути частиною однієї з тем.
Рис.1 Розподіл найпопулярніших тем за місяцями
Пояснення до графіка: ми відібрали тільки найпопулярніші теми про COVID-19 і подивилися їхній розвиток у часі. З графіку видно, що про виникнення вірусу та дотримання карантину найбільше писали у квітні, а про карантинні обмеження – у березні, коли їх почали запроваджувати.
Ми відібрали шість тем, на які ЗМІ писали найбільше. Сумарно вони становлять понад половину (57%) всього масиву новин про коронавірус. Далі опишемо їх за такою структурою: що? (які слова сформували тему), де? (на яких медіа), коли? (період часу, коли тема лунала у ЗМІ найчастіше).
- Міжнародна статистика (тема 10)
До теми міжнародної статистики з ковіду увійшло найбільше статей (11% усіх статей на тему коронавірусу). Цю тему згенерували статті-повідомлення про нові випадки зараження та кількість смертей по всьому світу. Це статті про перебіг епідемії COVID-19 у країнах, які тоді були в лідерах за кількістю інфікованих: США, Італія та Іспанія. До цієї теми також увійшли повідомлення про кількість інфікованих протягом останньої доби, кількість смертей на тисячу населення та у світі загалом.
Ця тема одразу почала домінувати в інфопросторі: у лютому про неї вийшло 2 160 статей, у березні вже 3 779, у квітні 3 126. У травні інтерес до неї вщух (2 030), і продовжив падати у червні (1718).
- Карантин для всіх (тема 2)
Карантинні обмеження в Україні обговорювалися в медіа майже так само часто – 8,03% всіх статей про коронавірус. Найбільше вони обговорювалися у березні (2 993 новина) та квітні (2 446 новина), коли карантин був найсуворішим. До цієї теми увійшли повідомлення про карантинні заходи, їх дотримання чи порушення, посилення обмежень в окремих областях. Також це повідомлення про запровадження надзвичайного стану, правила відвідування публічних місць, обмеження руху транспорту. Декілька прикладів публікацій: «Дезінфекція вулиць і зупинок: як Київ бореться з коронавірусом», «На Луганщині вирішили послабити карантин попри невелику кількість зроблених тестів», «На Вінниччині посилили карантин: поновили роботу п'яти цілодобових постів».
- Регіональна статистика (тема 5)
До цієї теми увійшло 7,87% всіх статей зі згадкою коронавірусу – все, що стосується темпів поширення вірусу всередині країни, статистики захворюваності за регіонами та районами. Це новини із заголовками на кшталт «На Одещині кількість хворих на COVID-19 зросла на 20 осіб, всього – 93 заражених», «На Буковині новим коронавірусом заразилися ще 56 людей». Найбільше таких новин було у квітні – (3 396).
- Медична система (тема 17)
Про стан медичної системи, заповненість лікарень, медичні закупівлі та діяльність МОЗу опубліковано 7,3% новин, що стосуються коронавірусу. Наприклад, сюди увійшли статті про темпи захворюваності серед медиків, повідомлення та коментарі працівників медичної сфери. Цю тему сформували всі статті, які стосуються обговорення пандемії COVID-19 через призму медичної системи. Найбільше публікацій на цю тему було у березні (3 964) та квітні (2 278).
- Карантин для кожного (тема 7)
Статті цієї теми висвітлюють життя на карантині з позиції пересічного громадянина. Вони становлять 6,6% всіх статей про коронавірус. До цієї теми увійшли рекомендації про те, як адаптуватися до карантинних обмежень, нагадування про соціальну дистанцію, пояснення щодо посилених заходів особистої гігієни. Також до неї увійшли публікації про порушення карантинного режиму («У США мер міста наказав поліції ловити усіх порушників карантину: заарештували його дружину»), поради («Як сформувати графік дитини на час карантину: поради психологині», «Карантин через коронавірус: список музеїв, які можна "відвідати" онлайн»). Найбільш актуальними такі статті були у березні та квітні, тоді їх вийшла найбільша кількість: 2 610 та 2 885.
- Цікаве про коронавірус (тема 19)
Ця тема є другою за кількістю статей у ній – вона включає в себе 10% всіх новин стосовно коронавірусу. Однак ми помістили її в кінець списку, оскільки представлена вона лише декількома медіа. Алгоритм об’єднав статті в цю тему, оскільки більшість із них написані російською мовою, а великі обсяги теми пояснюються продуктивністю ресурсів, що її сформували (зокрема – «Страна.ua» та «Цензор.Нет»). Сутнісно тема є доволі широкою: її сформували статті, які пояснюють походження вірусу SARS-CoV-2, карантинні обмеження у різних країнах та державні заходи протидії поширенню ковіду. Багато новин у ній базуються на коментарях представників МОЗу та перших осіб держави. Також до цієї теми входять пояснення щодо функціонування суспільства під час карантину. Типовими для неї є такі заголовки: «Медики выяснили влияние коронавируса на первые недели беременности», «США увеличивают помощь Украине на борьбу с COVID-19 до $14,5 млн», «Поширення коронавірусу: як в різних країнах борються з епідемією». Тобто це досить широка тема, мета якої -– пояснити ситуацію навколо коронавірусу. Найбільше статей цієї теми вийшло у квітні (4 006) та березні (3 294).
Протягом розглянутого періоду «хіт-парад» коронавірусних тем не змінювався – це міжнародна та регіональна статистика, карантинні обмеження, правила соціальної дистанції та державні заходи протидії ковіду. І хоча з часом цікавість до новин про COVID-19 падає, відносна популярність цих тем залишається незмінною.
Хто пише про COVID-19 найбільше?
Рис.2 Частка новин про корону у стрічках топ-медіа
Джерело: власні розрахунки. ЗМІ відсортовані за часткою новин про коронавірус у загальному обсязі новин
Існує декілька моделей, за допомогою яких ЗМІ розповідають про епідемію COVID-19. Хтось створює окремі дайджести, деякі – сторінки відстеження статистики онлайн та тематичні розділи. Існують і такі медіа, які лише подеколи згадують про вірус у статтях.
Про COVID-19 відносно більше пишуть ті сайти, які публікують не дуже велику кількість новин (у середньому по 2 503 новини на місяць). У трійці лідерів за кількістю статей зі згадкою COVID-19 – сайт «Гордон.юа» (35% усіх новин ресурсу), «Цензор.Нет» (34%), «Громадське» (33%) та «Українська правда» (32%). Перші два медіа створили окремі ковід-розділи, УП розгорнула сторінку зі статистикою, а сайт «Громадське» тему з COVID-19 не виділив.
На противагу цим новинним сайтам, два портали з нашого списку з найбільшою кількістю опублікованих новин за день – «Політека» та «Знай» – майже не згадували у своїх стрічках коронавірус. У «Політеки» згадок ковіду найменше – 6% від усіх новин сайту, а у «Знай» – 9,5%. Портал із найбільшою загальною кількістю новин за п’ять місяців – «24 канал» – також згадує COVID-19 лише у 9,5% новин.
Улюблені теми медіа
До нашої бази увійшли новинні стрічки онлайн-ЗМІ з різними моделями подачі новин. Наприклад, такі сайти як «112», «Знай», «24 канал», «Політека» публікують по 20-30 новин на хвилину. Якісні ЗМІ, такі як «Ліга», «Радіо Свобода» чи «Фокус», публікують у рази менше контенту – в середньому по 57 новин на добу. Рис. 3 показує, як топові теми про COVID-19, описані вище, розподілені за медіа. Чи є в окремих ЗМІ теми, які вони просувають найбільш активно?
Рис.3. Розподіл публікацій, пов'язаних з коронавірусом, за темами
Пояснення до графіка: графік показує, яку частку новин про коронавірус займали новини на певну тему на кожному сайті. Окремо виділено 6 топ-тем, які описані вище, «інші категорії» включають решту 14 тем, виділених алгоритмом.
Тема міжнародної статистики поширення COVID-19 висвітлювалася всіма медіа однаково багато. Навіть більше: для половини медіа (14 з 27) ця тема є однією з найбільш обговорюваних. Частки статей кожного медіа на цю тему серед «ковідних» статей приблизно однакові та становлять в середньому 19% новин за п’ять місяців.
Тема карантину для всіх найактивніше просувалася тими медіа, які загалом небагато писали про коронавірус. До прикладу, на «Економічній правді» тільки 9% статей стосувались коронавірусу. Проте у 13% статей про коронавірус ішлося про карантинні обмеження. Багато уваги цій темі приділяло «Радіо Свобода», яке про ковід писало у 30% новин. Частка статей про карантинні обмеження тут становила 6% від усіх публікацій про COVID-19. На «Дзеркалі тижня» за розглянуті 5 місяців 30% статей стосувалися ковіду, але частка про карантин для всіх серед них – 12%.
Дзеркальна попередній тема – карантин для кожного – описує правила соціальної дистанції та особистої гігієни під час пандемії. Про індивідуальне дотримання карантину найбільше писали «Апостроф» (49% статей про ковід), «Знай» (36%) та «Політека» (37% статей).
Теми медичної системи та регіональної статистики висвітлювалися онлайн-ЗМІ майже рівномірно, якщо не брати до уваги новини російськомовних ЗМІ. Стан медичної системи обговорювався у новинах в середньому у 13% випадків, а про регіональну статистику ЗМІ писали у 14% публікацій.
До загальної картини не ввійшли статті російськомовних ЗМІ, оскільки їхні публікації алгоритм об’єднав в окрему тему – цікаве про коронавірус (рос.). Ця тема є однією з найбільших у всьому масиві, однак сформували її всього декілька російськомовних медіа: «Страна» (3 183 новин), «Ліга» (984 новин), «Украньюз» (1 768 новин), «Лівий берег» (1 077 новин), «Цензор.Нет» (2 553 новин), «Фокус» (1 707 новин).
Висновки
- За період від початку пандемії до кінця червня кожна четверта новина стосувалася COVID-19 : 112 513 новин з 473 527 публікацій.
- Найбільше про COVID-19 писали у березні (37 310 новин) та квітні (34 204 новин). Найменше – у лютому (9 850).
- Серед 27 топ-медіа відносно більше новин стосовно ковіду писали «Гордон» (35% новин), «Цензор.Нет» (34%) та «Громадське» (33%).
- Найбільш розповсюдженими темами були міжнародна статистика (12 222 новин), карантин для всіх (9 031 новина), регіональна статистика (8 852), стан медичної системи (8 217 новин), карантин для кожного (7 424 новин).
- Єдина тема рівномірно висвітлена всіма медіа – міжнародна статистика. Вона є найбільш популярною для 14 із 27 медіа. Є теми, які розвивали лише окремі ЗМІ: про карантин для кожного найактивніше писали «Апостроф», «Політека» та «Знай», а про регіональну статистику коронавірусу – УНН та «Інтерфакс».
Як ми рахували
Ми збирали новини із сайтів найпопулярніших українських ЗМІ. У визначенні популярності медіа ми спирались на рейтинги компанії TNS Group, Інтернет Асоціації України, дослідження USAID-Internews та моніторинги «Детектора медіа». Спираючись на дані цих досліджень ми сформували список з найпопулярніших онлайн-ЗМІ. До цього аналізу увійшли новинні стрічки 27 онлайн-ЗМІ:
112 канал |
Еспресо |
РБК-Україна |
Факти ICTV |
24 канал |
Інтерфакс |
Сегодня |
Фокус |
Апостроф |
Ліга |
ТСН |
Цензор.Нет |
Гордон |
Лівий берег |
Українські новини |
ZIK |
Громадське |
Обозреватель |
УНІАН |
Знай |
Дзеркало тижня |
Політека |
УНН |
Страна |
Економічна правда |
Радіо Свобода |
Українська правда |
|
На жаль, НВ не потрапило до нашої вибірки через технічні обмеження, хоча це ЗМІ посідає перші місця у рейтингах.
Ми зібрали новини з сайтів найпопулярніших українських медіа, серед них відібрали новини про коронавірус та подивилися, які теми про пандемію найгучніше лунали у ЗМІ.
За період з лютого по липень українські онлайн ЗМІ опублікували більше 470 тисяч текстових новин. Щоб визначити, що та як у них писали про ковід, ми почистили новинні статті від невалідного тексту, який міг вплинути на фінальну обробку: видалили посилання, теги, коментарі під статтями та посилання типу «читайте також» тощо. Потім ми відібрали тільки ті публікації, в яких COVID-19 згадувався не менше трьох разів. Таких новин виявилось 112 513.
На цьому масиві ми застосували алгоритм машинного навчання LatentDirichletAllocation (LDA). З його допомогою ми визначили, які теми найчастіше зустрічалися у статтях про коронавірус в українських онлайн-ЗМІ протягом п’яти місяців пандемії. LDA шукає приховані структури у великих наборах текстів. З його допомогою ми можемо «зменшити розмірність» масиву та побачити найбільш значущі меседжі у ньому.
Ця стаття опублікована в рамках Програми сприяння громадській активності «Долучайся!», що фінансується Агентством США з міжнародного розвитку (USAID) та здійснюється Pact в Україні. Зміст статті є винятковою відповідальністю Pact та його партнерів i не обов’язково відображає погляди Агентства США з міжнародного розвитку (USAID) або уряду США.
Марина Отт, лідерка проекту DataVox
Ілюстрація: freepik