Microsoft представила нейромережу, що створює реалістичне відео за однією фотографією та аудіодоріжкою

11:20,

22 Квітня 2024

3315

Версія для друку

Інтернет

Що нового

21 Липня 2026

Хакери експлуатують критичні вразливості WordPress для зламу сайтів, — TechCrunch

21 Липня 2026

У США суд призупинив угоду про злиття Paramount і Warner Bros.

20 Липня 2026

«Одіссея» Крістофера Нолана зібрала понад 260 млн доларів у світовому прокаті за перший вікенд

19 Липня 2026

У застосунку «Армія+» зʼявився офіційний військовий документ

19 Липня 2026

У роботі фейсбуку та інстаграму стався масштабний збій по всьому світу

Що нового

Помітили помилку?
Виділіть її та натисніть Ctrl + Enter —
ми виправимo

Microsoft представила нейромережу, що створює реалістичне відео за однією фотографією та аудіодоріжкою

Юлія Поліковська

11:20,

22 Квітня 2024

3315

Версія для друку

Автори:

Юлія Поліковська

Нейромережу наразі не випускатимуть на ринок,щоб не дати зловмисникам можливості створювати за її допомогою дипфейки.

Інженери дослідного азійського підрозділу Microsoft створили нейромережу VASA-1, здатну генерувати реалістичні відео людини, яка розмовляє, з природною мімікою, використовуючи для цього лиш одне фото й аудіодоріжку. Про це повідомила компанія Microsoft.

Повідомлено, що нейромережа VASA-1 навчалася на наборі даних VoxCeleb2, який містить «понад 1 мільйон висловлювань 6112 знаменитостей» із відео на ютубі.

Головною особливістю нейромережі, у порівнянні з іншими алгоритмами, створеними конкурентами, є цілісна модель генерації лицьової міміки та рухів голови в ній. Фахівці Microsoft провели велику дослідницьку роботу, включно з оцінкою низки нових метрик. У результаті вони встановили, що новий алгоритм значно перевершує представлені раніше аналоги за багатьма параметрами.

«Наш метод не тільки забезпечує генерацію відео високої якості з реалістичною мімікою і рухами голови, а й також підтримує функцію онлайн-генерації відео 512×512 пікселів із частотою 40 кадрів на секунду з незначною початковою затримкою. Це відкриває шлях до взаємодії в реальному часі з реалістичними аватарами, що імітують поведінку людини під час розмови», — йдеться у повідомленні Microsoft.

Крім фотографій, нейромережа вміє працювати з портретами, створеними в будь-якому художньому стилі. В одному з демонстраційних роликів Мона Ліза з полотна Леонардо да Вінчі виконує реп.

Незважаючи на те, що під час ретельного перегляду рухи вуст і голови в демонстраційних прикладах на вигляд усе ще трохи роботоподібні та несинхронізовані, загалом результати доволі переконливі. Стає зрозуміло, що технологією можна зловживати для легкого та швидкого створення дипфейків.

Усвідомлюючи цей потенціал, дослідники вирішили наразі не випускати продукт на ринок, доки не будуть впевнені, що їхня технологія «використовуватиметься відповідально та відповідно до належних положень».

За їх оцінкою, попри ризики створення дипфейків, технологія може мати низку випадків корисного застосування: зокрема в освіті та для осіб, які мають труднощі з онлайн-спілкуванням і могли б створювати аватари для цього.

Нагадаємо, корпорація Microsoft доповнила сервіс Azure AI Studio, що дає розробникам змогу створювати персоналізованих ШІ-помічників на основі моделі OpenAI, інструментами, що блокують спроби налаштовувати чатботи на зловмисну, шкідливу роботу.

Фото: нейромережа VASA-1 / Microsoft

Читайте також

Колишній кореспондент CNN взяв інтервʼю в ШІ, що вдавав із себе загиблого під час стрілянини у Флориді підлітка

Microsoft випустила графічний редактор для створення ШІ-зображень на смартфонах

Microsoft через 40 років додала в «Блокнот» перевірку орфографії

Українськомовні аудіогіди доступні вже у 44 країнах світу

Папа Римський візьме участь у сесії G7, присвяченій ШІ

У США вчителя звинуватили у створенні фейкового запису з расистськими заявами директора школи

Вадим Міський: «ШІ ставить нас в умови, коли не можна вірити нічому, що ми бачимо і чуємо»

Microsoft дозволила створювати користувацькі чатботи на основі Copilot GPT

Генератори зображень від провідних розробників створюють виборчі дипфейки у понад 40% випадків, — дослідження

Українка виявила в китайських соцмережах свій клон, генерований ШІ, який видає себе за «російську красуню» і розповідає про любов до Китаю

Google поставив на паузу створення зображень людей чатботом Gemini через значні хиби

Дональда Трампа жорстко розкритикував «воскреслий» батько, змодельований за допомогою ШІ

Провладні хакери з Росії, Ірану, Китаю та Північної Кореї почали використовувати інструменти ШІ, — звіт Microsoft

Соцмережа Х заблокувала пошукові запити про Тейлор Свіфт через поширення дипфейків про неї

У фейсбуці виявили понад 100 дипфейкових відео із зображенням британського прем'єра Ріші Сунака

Microsoft запропонувала допомогу американським політикам у боротьбі з дипфейками

ГО «Детектор медіа» понад 20 років бореться за кращу українську журналістику. Ми стежимо за дотриманням стандартів у медіа. Захищаємо права аудиторії на якісну інформацію. І допомагаємо читачам відрізняти правду від брехні.
До 22-річчя з дня народження видання ми відновлюємо нашу Спільноту! Це коло активних людей, які хочуть та можуть фінансово підтримати наше видання, долучитися до генерування ідей та створення якісних матеріалів, просувати свідоме медіаспоживання і разом протистояти російській дезінформації.

Долучитись

* Знайшовши помилку, виділіть її та натисніть Ctrl+Enter.

Теги: