Про Сатурн, роботів та Олімпійські ігри — сім неймовірних проектів із великими даними
Про Сатурн, роботів та Олімпійські ігри — сім неймовірних проектів із великими даними
Про дата-проекти на форумі розповідали Ярина Серкез, яка працює у The Wall Street Journal, та Аманда Фарнсворт із BBC. За словами Ярини, в 2006 році у світі вийшло 1,4 мільйона наукових статей. І щодев’ять років ця цифра подвоюється, тож нині у світі щороку з’являється приблизно чотири мільйони наукових статей. «У нас немає часу все це читати. У нас часто немає часу й кави випити. Але повірте, така ж ситуація й у ваших читачів. І вони розраховують на вас, що ви зробите цю роботу за них. Й поки вони будуть їхати на роботу в метро, ви поясните їм результати дослідження, яке тривало декілька десятиліть», — розповіла Ярина Серкез. Однак виходити можна не лише з великих даних, але й із маленьких. Що цікавого може стояти за кількома рядками цифр та статистики? І буденні питання або дії, які ми робимо, теж можуть дати поштовх до розвитку хорошої історії.
Наприклад, журналістка The Wall Street Journal Стефані Стем проаналізувала, скільки персональних даних ви даєте різним технологічним компаніям, якщо просто домовитеся з подругою поїсти піцу й подивитися фільм.
Водночас Аманда Фарнсворт радить не ігнорувати актуальних подій — вони можуть бути хорошим джерелом натхнення і трафіку на ваш сайт. І перш ніж бігти зі своєю ідеєю до розробників, варто подумати, як її буде реалізовано для десктоп-версії та для мобільної. «Якщо ви не знаєте, як зробити проект для мобільного, вважайте, що його немає», — каже спікерка. Аманда Фарнсворт також звертає увагу на таку важливу річ як перетин різних платформ. Наприклад, у BBC був тест «До якого класу (соціального. — MS) ви належите?». Коли журналісти BBC для телесюжету попросили різних людей на вулиці пройти тест і прокоментувати свої результати, на сторінці тесту був потужний стрибок відвідуваності. Окрім того виданню вдалося зібрати дуже цікаві соціологічні дані за допомогою цього тесту.
Cпікерки розповіли про кейси різних видань і як вони можуть бути прикладами того, що величезні обсяги даних під час роботи перетворюються на успішні дата-проекти.
Проект The New York Times про соціальну мобільність
Американське бюро перепису населення разом із науковцями з Гарварду та Стенфорду презентувало величезне дослідження, яке демонструвало, що хлопчики з афроамериканських сімей, навіть заможних, у дорослому житті все ж зароблятимуть менше, ніж білі хлопчики з таким же соціальним бекґраундом.
Для дослідження було зібрано та проаналізовано дані 20 мільйонів дітей та їхніх батьків, народжених із 1978 по 1983 рік. Тобто тепер цим дітям по 35–40 років. На сайті дослідження можна подивитися таблиці з вихідними даними; виглядають вони загрозливо:
Втім, журналісти з The New York Times показали ці дані у зрозуміліший спосіб — через анімацію. На ній жовтими й синіми квадратиками позначено 10 тис. дітей, які із загального потоку благополучних сімей потім падають у п’ять категорій — від заможного соціального класу до найбіднішого. Водночас біля кожної з категорій оновллються цифри зі статистикою. Наприклад, із цих 10 тис. дітей 39 % білих хлопчиків у дорослому житті опиняться у класі заможних людей і лише 10 % — у бідному. Для хлопчиків із афроамериканських сімей ці цифри інакші — 17 % у заможному й 21 % у бідному класі.
Така ж анімація є для 10 тис. дітей із бідних сімей, яка показує, що в білих хлопчиків більші шанси стати заможними в майбутньому, ніж в афроамериканських, та для всіх п’яти соціальних категорій, на якій видно, як перетікають діти-квадратики з однієї соціальної верстви до іншої.
«Наукові коментарі до цього дослідження є, але це цілий список наукових статей. Над ним працювала ціла команда науковців із різних університетів», — розповіла Ярина Серкез. А формат, який використала газета The New York Times, допомагає прокомунікувати й донести проблеми, викриті дослідженням, до дуже широкого кола читачів і зробити це у доступний спосіб.
Проект National Geographic про космічний апарат Кассіні — Гюйгенс
У 2017 році завершувалася програма космічного апарату Кассіні, запущена спільно NASA, Європейським космічним агентством та Італійським космічним агентством. Апарат відправили в космос для дослідження планети Сатурн, її кілець та супутників. Кассіні стартував у 1997 році, тож загалом місія тривала 20 років. За цей час науковці зібрали близько 600 гігабайт різних даних. І з цього величезного обсягу даних журналістам потрібно було вибрати найважливіше, при цьому не знудивши читачів.
Тож журнал National Geographic створив об’ємну модель, на якій показав усі стадії польоту Кассіні. Чим далі читач прогортає сторінку із лонгрідом про Кассіні, тим далі він просувається по хронологічній шкалі, яка розміщена вгорі екрана.
Великі наукові центри завжди мають багато даних, які журналісти можуть потім перетворити на дата-проекти. Тому варто стежити за їхніми публікаціями та підписуватися на розсилки від таких центрів. Також серед усіх масивів інформації важливо обирати не лише найважливіше, але й цікаві деталі. Наприклад, у розповіді про міссію Кассіні журналісти показали не лише траекторії польотів самого апарату, але також і які супутники Сатурна він досліджував, як вивчав кільця планети, як виглядає шторм на Сатурні.
Завершується проект останнім польотом Кассіні й поясненням, чому наковці вирішили знищити апарат, а не залишили його кружляти на орбіті планети.
Кассіні досліджував Сатурн протягом 13 років. Однак у космічного апарата обмежений запас палива й заправити його дистанційно немає змоги. А залишати його на орбіті науковці не захотіли, оскільки він міг зіткнутися з одним із місяців Сатурна, на якому може існувати позаземна форма життя. Тож у вересні 2017 року апарат увійшов в атмосферу Сатурна, де й знищився.
Проект Reuters про міграцію меншини рохинджа у М'янмі
У 2017 році новини про кризу у М'янмі та про масове знищення мусульманської меншини рохинджа з’явилися в усіх медіа. Але як показати весь масштаб цього явища? Агентство Reuters вирішило зробити це через дата-проект.
Сотні тисяч рохинджа мігрували в сусідній Бангладеш, рятуючись від насильства з боку військових у М'янмі. У своєму проекті Reuters пояснює, чому кількість мігрантів так швидко зростала. За перші п’ять днів до берегів Бангладеш на човнах припливли 15 мігрантів. Ще 240 прибули до табору біженців у Леді, біля річки Наф на кордоні Бангладеш та М'янми. За ті ж п’ять днів ще 1800 людей приїхали в табір Балухалі в місті Кокс-Базар.
Для кожної з цих цифр у проекті є окремий слайд. Із кожним наступним слайдом на ілюстрації стає все більше маленьких фігурок людей, що наочно показує, як зростав потік біженців. Щоб було зрозуміло, отак виглядають перший і четвертий слайди з проекту:
Далі у хронологічному порядку, тиждень за тижнем, потік біженців зростає. Більше половини з них — діти, молодше 18 років. 7 % із них — немовлята до року, 21 % — діти віком 1–5 років. На момент створення проекту загальне число біженців склало 609 тис. 459 осіб.
На одному з наступних слайдів за допомогою анімації кількість біженців порівнюється з населенням великих світових міст. Наприклад, їх більше, ніж населення міст Маямі, Цюріха чи Копенгагена.
Дані для цього проекту збиралися із джерел Управління Верховного комісара ООН у справах біженців, координаційної групи ISCG, Бюро перепису населення США та Євростату.
Проект The New York Times про стрілянину в Лас-Вегасі та вогнепальну зброю
У 2017 році 64-річний Стівен Педдок відкрив вогонь по відвідувачах музичного фестивалю Route 91 Harvest із балкона готеля в Лас-Вегасі. Він убив 58 осіб та поранив близько 500. Після того, як спецназ узяв приступом його номер, у ньому було знайдено 23 одиниці різноманітної вогнепальної зброї.
Газета The New York Times спробувала пояснити, чому Стівен Педдок зумів поцілити так багато людей, порівнюючи цей випадок з іншою масовою стріляниною у США — в нічному клубі в Орландо у 2016 році. Тоді загинуло 50 людей і ще 53 отримали поранення.
Річ у тім, що Стівен Педдок використовував пристрій, за допомогою якого він модифікував напівавтоматичну вогнепальну зброю таким чином, що вона стріляла як автоматична.
Журналісти зіставили частоту пострілів під час стрілянини в Орландо, під час стрілянини в Лас-Вегасі та звук того, як стріляє автоматична вогнепальна зброя.
На аудіо, яке супроводжує анімацію, чутно, що постріли зі зброї Стівена Педдока більш схожі на автоматичну вогнепальну зброю.
Стрілок із Орландо Омар Матін використовував принаймні два пістолети, включно з напівавтоматичною гвинтівкою AR-15. На аудіо, які було взято з реальних записів стрілянини, чути, як Омар Матін здійснив 24 постріли за 9 секунд. Водночас Стівен Педдок за 10 секунд зробив 90 пострілів. Повністю автоматична зброя робить 98 пострілів за 7 секунд.
У США пристрої, які використовуються для модернізації напівавтоматичної зброї, називають bump stock. Після стрілянини в Лас-Вегасі міністерство юстиції оголосило, що від 23 березня 2018 року вся зброя, обладнана такими пристроями, класифікується як кулемет, а отже підпадає під заборону, згідно з чинним федеральним законом.
Проект The Wall Street Journal про гендерний розрив на Олімпійських іграх
Тривалий час жінки не могли змагатися в усіх дисциплінах на Олімпійських іграх через упереджене ставлення. Лише на Літніх іграх 2012 року в Лондоні жінки могли змагатися в будь-якому виді спорту. А на Зимових іграх у Пхьончхані 2018 року жінки все ж були представлені не в усіх дисциплінах.
Міжнародний олімпійський комітет із 1991 року висуває умову для всіх країн, які хочуть приймати в себе Ігри, що у програмі обов’язково мають бути запропоновані змагання для жінок. У 2012 році вперше всі конкуруючі делегації включали принаймні одну жінку.
Отже, The Wall Street Journal у своєму дата-проекті зібрав дані про змагання для чоловіків, жінок і такі, в яких беруть участь і ті, й ті. Усі вони зібрані в одну інтерактивну карту, яка змінюється, якщо прокрутити її мишкою.
Так можна дізнатися, що 60 % змагань для чоловіків виникли до 1960-х років, а більшість жіночих та змішаних — після 1980-х. А на те, щоб жінки могли змагатися у стрибках на лижах, пішло 90 років. До цього вважалося, що цей спорт шкідливий для жіночої репродуктивної системи.
Завойовувати право на гру в хокей довелося 78 років, за марафон довелося боротися 88 років, а за бокс — цілих 108 років. Дані для гри були зібрані в Міжнародному олімпійському комітеті та на сайті Олімпійських ігор у Пхьончхані.
Проект BBC до Олімпійських ігор у Ріо в 2016 році
У базі даних Міжнародного олімпійського комітету є інформація про 11 тис. 500 спортсменів. Купуючи права на трансляцію Ігор, мережа отримала й доступ до цих даних. Тож BBC вирішили використати її для гри. У ній зібрано профайли понад 10 тис. 500 атлетів, які вказали свої точні дані про зріст, вагу та вік. Вказавши ці ж дані про себе, користувач може дізнатися, на кого зі спортсменів він схожий.
У грі також наводяться цікаві дані про учасників змагань. Наприклад, із усієї бази даних найнижчого зросту виявилася бразильська гімнастка Флавія Сараіва — 133 сантиметри. А найвищим — китайський баскетболіст Лі Мухао — 218 сантиметрів. Найлегшою серед спортсменів знову виявилася Флавія Сараіва — її вага 31 кілограм, а найважчим — румунський дзюдоїст Даніель Натеа, який важить 170 кілограмів.
За словами Аманди Фарнсворт, гра виявилася настільки вдалою, що в неї грали навіть ті люди, які не цікавляться спортом. Кумедно, що коли в неї зіграла спортсменка Джазмін Соєрз, на першому місці серед результатів вона отримала себе ж.
Проект BBC про штучний інтелект і професії
Питання штучного інтелекту хвилювало людей задовго до того, як про нього почали сперечатися Ілон Маск, Марк Цукерберг та Джон Аннандреа. У 2015 році BBC створила гру «Чи заберуть роботи вашу роботу?». За основу були взяті дані британського Управління національної статистики, дослідницької компанії Deloitte та дослідження Майкла Осборна і Карла Фрея з Оксфордського університету.
Згідно із зібраними даними, роботи з sмовірністю 99 % витіснять людей, які продають товари телефоном; 98,5 % — що вони замінять друкарів або суміжні професії, пов’язані з набором текстів; 97,6 % — що замість юрисконсультів у майбутньому також працюватимуть роботи.
Що ж стосується журналістики, то шанси, що її переберуть на себе роботи, доволі низькі — всього 8,4 %. Під найменшою загрозою професії радника з питань освіти, шкільного інспектора, бармена, менеджера або власника готелю — лише 0,4 %.