Голосовую модель «Яндекса» научили узбекскому
Нейросеть не только «научили» понимать язык, но и «говорить» на нёмКомпания «Яндекс» анонсировала новую возможность в своём продукте Yandex SpeechKit — распознавание и синтез речи на узбекском языке. Это отличная новость для автоматизации колл-центров, анализа речи и разработки голосовых помощников.
Обучение модели проходило с использованием голоса настоящего диктора. Разработчики создали обширный набор данных, содержащий тысячи часов аудиозаписей и их расшифровки. Нейросеть не только способна синтезировать речь, но и воспроизводить звуковые особенности слов, что особенно полезно при произнесении сложных фамилий и заимствованных выражений.
Yandex SpeechKit учитывает особенности узбекского языка, включая произношение буквы «х». Григорий Атрепьев, директор по продуктам в YandexCloud, отмечает, что рынок речевых технологий в Узбекистане может достигать огромных масштабов, до 395 миллионов минут обработанной речи в год. Узбекский стал 16-м языком, с которым работает Yandex SpeechKit.