Voxtral від Mistral: відкрита альтернатива ElevenLabs для TTS
Read in EnglishЗ’явилася відкрита альтернатива ElevenLabs із відкритими вагами.
Voxtral — модель синтезу мовлення (текст-у-мовлення) від Mistral:
- лише 4 млрд параметрів
- затримка 70 мс для голосових агентів
- клонування голосу за 3 секундами аудіо
- 9 мов + кросмовне перенесення
- 68.4% перемог порівняно з ElevenLabs Flash v2.5
Відкриті ваги доступні на Hugging Face.