Voxtral від Mistral: відкрита альтернатива ElevenLabs для TTS
З’явилася відкрита альтернатива ElevenLabs із відкритими вагами.
Voxtral — модель синтезу мовлення (текст-у-мовлення) від Mistral:
- лише 4 млрд параметрів
- затримка 70 мс для голосових агентів
- клонування голосу за 3 секундами аудіо
- 9 мов + кросмовне перенесення
- 68.4% перемог порівняно з ElevenLabs Flash v2.5