- Категорія
- Новини
- Дата публікації
- Змінити мову
- Читать на русском
Google додав голосовий переклад в Google Meet у реальному часі
Google оголосив про запуск Gemini 3.5 Live Translate — аудіомоделі для перекладу мовлення в реальному часі. Функція з’явиться у продуктах Google, зокрема в Google Translate на Android та iOS, а також у Google Meet для корпоративних користувачів.
Про це інформує Delo.ua з посиланням на повідомлення компанії.
Модель автоматично розпізнає понад 70 мов і генерує перекладене мовлення з природним звучанням. За даними Google, технологія зберігає інтонацію, темп і висоту голосу мовця.
На відміну від систем, які чекають завершення фрази перед перекладом, Gemini 3.5 Live Translate працює безперервно. Модель перекладає мовлення під час розмови, залишаючись лише на кілька секунд позаду мовця та зменшуючи паузи у спілкуванні.
Функцію Live Translate розгортають у кількох напрямах:
- для розробників — у публічній підготовчій версії через Gemini Live API та Google AI Studio;
- для бізнесу — приватна підготовча версія в Google Meet стартує цього місяця;
- для користувачів — через Google Translate на Android та iOS.
Gemini 3.5 Live Translate обробляє мовлення під час потокової передачі та підтримує багатомовний вхід без ручного налаштування параметрів. Модель також розрахована на роботу в шумному середовищі.
Для розробників Google пропонує використовувати Gemini Live API для створення сервісів голосового перекладу, зокрема для дзвінків, зустрічей, уроків, трансляцій та інших форматів живого спілкування.
Платформи Agora, Fishjam, LiveKit, Pipecat та Vision Agents інтегрують Gemini Live API, щоб розробники могли створювати програми для перекладу голосу без самостійної побудови складної інфраструктури потокового аудіо.
Серед партнерів, які тестують модель, Google називає Grab. Компанія перевіряє Live Translate для багатомовного спілкування між водіями та пасажирами під час посадки. За даними Google, користувачі Grab здійснюють понад 10 млн голосових дзвінків на місяць через платформу.
Для бізнесу запуск Gemini 3.5 Live Translate означає розширення інструментів для міжнародних дзвінків, зустрічей і клієнтської підтримки. Для користувачів Google Translate це має спростити живе спілкування різними мовами без окремих перекладачів або пауз між репліками.
Нагадаємо, Google розпочала впровадження штучного інтелекту Gemini у свої сервіси перекладу, зокрема в застосунок Google Translate і пошук. Оновлення спрямоване на підвищення точності та природності перекладів, особливо у випадках із багатозначними фразами, ідіомами та сленгом.