Забудьте про паузы: Gemini 3.5 переводит разговор в реальном времени

Фото: Лидия Аникина
Новая модель Gemini 3.5 Live Translate генерирует переведённую речь непрерывно, не дожидаясь окончания фразы собеседника.

Компания Google представила ИИ-модель Gemini 3.5 Live Translate, предназначенную для синхронного перевода разговоров. В ближайшее время технологию интегрируют в «Google Переводчик», а затем нейросеть появится в сервисе Google Meet, сообщил Блог Google.

Gemini 3.5 Live Translate способна автоматически распознавать более 70 языков, включая русский. Нейросеть также умеет синтезировать естественно звучащую речь, сохраняя интонацию, темп и высоту голоса говорящего человека. Ключевое отличие новой модели — она генерирует переведённую речь непрерывно, не ожидая, пока собеседник закончит фразу.

В скором времени обновление появится в «Переводчике» для iOS и Android по всему миру — развёртывание будет происходить постепенно. В Google Meet запуск состоится позднее. Для разработчиков модель уже доступна в режиме предварительного тестирования через Gemini Live API и Google AI Studio.

Технологические гиганты продолжают совершенствовать свои продукты, добавляя функции, основанные на искусственном интеллекте, которые упрощают повседневные задачи пользователей. Интернет-газета «ЖУК» сообщала, что компания Apple готовит для iOS 27 функцию, которая позволит разделять совместный счёт в ресторане по фотографии чека. После выхода обновления владельцы iPhone смогут направлять запросы на оплату людям из списка контактов.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Рейтинг
( Пока оценок нет )
Ксения Семашко/ автор статьи
Загрузка ...
Интернет-газета «ЖУК»

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: