
Google запускає нову модель для перекладу мовлення у режимі реального часу Gemini 3.5 Live Translate. Про це повідомили в блозі компанії.
Модель доступна в застосунку Google Translate для Android та iOS. Крім того, упродовж року її планують зробити основою для функції голосового перекладу в Google Meet.
Gemini 3.5 Live Translate розпізнає понад 70 мов і здатна відтворити природне звучання перекладу, зберігаючи при цьому інтонації, темп мовлення та висоту голосу співрозмовника.
«На відміну від систем, які чекають, поки оратор закінчить говорити, перш ніж відповідати, 3.5 Live Translate генерує мовлення безперервно, балансуючи між очікуванням контексту для покращення якості та миттєвим перекладом для синхронізації з оратором. Він забезпечує плавне звучання без незручних пауз і залишається лише на кілька секунд позаду оратора протягом усього сеансу», — зауважили в Google.
Під час демонстрації Google показала, як Gemini 3.5 Live Translate дублює відео в реальному часі, а також перекладає відео виступів і презентацій кількома мовами.
Згодом модель підтримуватиме понад 2 000 мовних комбінацій в одній зустрічі (раніше сервіс працював лише між англійською та іншими мовами) в Google Meet. Інтерфейс застосунку для відеозустрічей оновлять, щоб забезпечити швидший доступ до функції перекладу.
Покращений голосовий переклад в Google Meet запустять наприкінці червня у форматі закритого тестування для деяких корпоративних клієнтів Google Workspace, а пізніше розгорнуть функцію для ширшого кола користувачів.
Нагадаємо, на початку цього року OpenAI запустила окремий сервіс для перекладу текстів — ChatGPT Translate, який підтримує понад 50 мов і позиціюється як конкурент Google Translate.
Фото: Google