Сбер выпустил на Windows и Mac ИИ-программу для перевода голоса в текст и обратно
Новинка, доступная в бета-версии, позволяет пользователям, даже без навыков программирования, с легкостью синтезировать и распознавать речь, а также генерировать текст.
Приложение SaluteSpeech App предлагает разнообразные функции, включая распознавание речи из аудиофайлов разных форматов, таких как PCM, OPUS, MP3, FLAC, ALAW и MULAW.
Пользователи могут также синтезировать речь, выбирая из различных голосов и настраивая ударение, акцент и интонацию с помощью SSML-тегов. Кроме того, приложение позволяет генерировать тексты, используя токен GigaChat API.
Для работы с приложением необходимо получить токен SaluteSpeech API для синтеза и речевого распознавания или токен GigaChat API для генерации текста.
Отметим, что свежий релиз Сбера открывает новые возможности для удобного и эффективного взаимодействия с голосовыми данными, делая технологии распознавания и синтеза речи доступными ещё более широкому кругу пользователей.