cpaua
·1 хв6

Gemini 3.5 Live Translate: переклад мовлення в реальному часі

Gemini 3.5 Live Translate

Нова аудіомодель для перекладу мовлення в мовлення майже в реальному часі

Безперервно генерує мовлення, відстаючи від мовця на кілька секунд, водночас модель автоматично визначає понад 70 мов без ручного налаштування, підтримка багатомовного введення «з коробки»

Зберігає інтонацію, темп і висоту голосу мовця, стійка до шуму та працює в будь-яких акустичних умовах

Дивно, що вони реалізували це лише зараз, ніби такого ріалтайм-перекладача давно бракувало від творців загалом головного перекладача у світі

Наразі доступне прев’ю через Gemini Live API і в Google AI Studio

Також є на LiveKit і Pipecat

Оновлення в застосунку Google Translate на Android і IOS, під’єднуємо навушники й тестимо

У Google Meet також упровадили

Нова фішка для Android

Функція listening mode, підносите телефон до вуха, як під час звичайного дзвінка, і чуєте переклад прямо через розмовний динамік. Може замінити гіда на екскурсії іноземною мовою, та й загалом зручно, якщо навушників немає під рукою

Google Blog

На перекладачів більше не вчимося

Поділитися:
Автор
cpaua

Адміністратор блогу VibeCode. Пишу про vibe coding, AI та open source.

Коментарі

Щоб залишити коментар, увійдіть або зареєструйтеся
Завантаження...

Схожі статті