Nvidia представила нейромережу, що створює відео за текстовим описом

17:15,

24 Квітня 2023

3200

Версія для друку

Тренди

Що нового

04 Квітня 2026

YouTube видалив три пропагандистських державних телеканали Білорусі

04 Квітня 2026

Google дозволив змінювати нечитабельні адреси Gmail без втрати акаунту

04 Квітня 2026

Дуров закликав росіян до цифрового опору

04 Квітня 2026

У війську спростували фейки про масову мобілізацію жінок та ініціювали зміни у системі «Оберіг»

03 Квітня 2026

OpenAI придбала подкаст новин про технології TBPN

Що нового

Помітили помилку?
Виділіть її та натисніть Ctrl + Enter —
ми виправимo

Nvidia представила нейромережу, що створює відео за текстовим описом

Юлія Поліковська

17:15,

24 Квітня 2023

3200

Версія для друку

Автори:

Юлія Поліковська

Нейромережа генерує ролики тривалістю до 4,7 секунд.

Дослідницька компанія Nvidia розробила нейромережу під назвою VideoLDM, яка генерує відео за текстовим запитом користувачів.

Генератор відео використовує Stable Diffusion і наразі може синтезувати короткі ролики тривалістю до 4,7 секунди. Нейромережа генерує відео з роздільною здатністю до 1280×2048 пікселів з частотою 24 кадри за секунду і враховує близько 4,1 млрд параметрів.

Для цієї технології розробники застосовують Latent Diffusion Models (LDM). Такий підхід дає змогу синтезувати високоякісні зображення і не витрачати багато обчислювальних потужностей, адже модель тренується у стиснутому низьковимірному латентному просторі.

«Спочатку ми тренуємо LDM виключно на зображеннях, а потім перетворюємо генератор зображень на відеогенератор: додаємо часовий вимір до LDM-моделі та точно налаштовуємо послідовність закодованих зображень, тобто відео», — пояснили розробники.

Детальніше ця технологія описана на сайті Nvivdia, де компанія показала приклади згенерованих за текстовими описами відео. Серед них — «Вдягнена в костюм лисиця, що танцює в парку», «Самотній мандрівник у туманному лісі на світанку», «Снігова людина у заметілі» та багато інших.

Наразі це лише дослідницька розробка. Поки що компанія не викладає інструмент у відкритий доступ.

Нагадаємо, на початку 2023 року компанія Nvidia додала до програми Nvidia Broadcast 1.4 нову функцію «Зоровий контакт», створену за допомогою «штучного інтелекту». Опція імітує погляд людини в камеру, навіть якщо в реальному житті вона дивиться в інший бік. За інформацією розробників, функція призначена для «творців контенту, які прагнуть записати себе під час читання своїх нотаток або сценарію», коли не дивляться прямо в камеру.

Фото: Nvidia

Читайте також

OpenAI представила нейромережу Sora, яка перетворює текстові запити на реалістичні відео

Getty Images випукає власний генератор зображень на основі ШІ

Shutterstock розширює співпрацю з OpenAI у передачі даних для навчання моделей штучного інтелекту

Український стартап Reface запустив мобільний ШІ-застосунок Restyle

Застосунок для знайомств Tinder запровадив відеоверифікацію користувачів

Google навчила чатбот зі штучним інтелектом Bard створювати програмні коди

Світлина, створена за допомогою штучного інтелекту, перемогла в конкурсі фотографії. Автор відмовився від нагороди

Першу артгалерею штучного інтелекту відкрили в Амстердамі

Компанія OpenAI представила нову модель штучного інтелекту GPT-4

Google представила штучний інтелект, що створює відео за описом

ГО «Детектор медіа» понад 20 років бореться за кращу українську журналістику. Ми стежимо за дотриманням стандартів у медіа. Захищаємо права аудиторії на якісну інформацію. І допомагаємо читачам відрізняти правду від брехні.
До 22-річчя з дня народження видання ми відновлюємо нашу Спільноту! Це коло активних людей, які хочуть та можуть фінансово підтримати наше видання, долучитися до генерування ідей та створення якісних матеріалів, просувати свідоме медіаспоживання і разом протистояти російській дезінформації.

Долучитись

* Знайшовши помилку, виділіть її та натисніть Ctrl+Enter.

Теги:

відео

штучний інтелект

Більше за темою