Email or username:

Password:

Forgot your password?
D:\side\

🗣️ Что-то я уже давно не трогал #Rhasspy.

Выпущена ранняя версия Rhasspy 3, а в ней распознаёт речь уже Whisper (по моделям от OpenAI), а синтезирует Piper. Всё ещё без облаков.

Whisper даже без закрытого словаря показывает впечатляющую точность. Для русского языка, да.

Даже модель tiny-int8 (43Мб), пригодная для Raspberry Pi 4, довольно шустро выдаёт похожий текст. А если чётко произнести, то даже правильный.

А small (968Мб) настолько суров, что даже восстанавливает по паузам пунктуацию, бьёт на предложения и замечает (по интонации?) вопросы!

Я как-то дальнейшее развитие своей говорилки планировал из расчёта на закрытый словарь, но похоже, что он не потребуется, можно сосредоточиться на тексте.

Что до Piper — после Larynx улучшение инкрементальное, но заметное. Голос звучит куда естественнее, фонемы соединяются органичнее.
Всё ещё местами странное ударение и добавились неловкие паузы, но "чтение первого абзаца случайной статьи с Википедии" теперь вызывает куда меньшее недоумение.

2 comments
D:\side\

🏠 …и #HomeAssistant тоже растёт.

Собственно, Whisper и Piper я испытывал именно в нём, на его новом помощнике Assist. К нему, к сожалению, чисто голосом сейчас обратиться никак, хотя в сообществе придумали забавные методы типа обращения к нему по телефону (поднял трубку, сказал, услышал ответ, положил). Но интерфейс добавления названий для разных объектов — красота. Удобно и в нужном месте.

И в мобильное приложение HA его добавили как мобильного ассистента — а вот это уже может быть интересно, т. к. это готовое удалённое (!) голосовое управление. Если туда добавят ещё и слово-активатор, можно будет старые андроиды приспосабливать как голосовые терминалы. Прикольно! Причём для моей системы работает уже сейчас, и почти без настройки!

Есть вещи и помельче.

Например, он научился показывать свою приборную панель (дэшборд, окей) через медиаплееры. Со скроллом даже. Правда, на 49 дюймах всё очень огромное и масштаб я сходу не нашёл. Но штука полезная.

🏠 …и #HomeAssistant тоже растёт.

Собственно, Whisper и Piper я испытывал именно в нём, на его новом помощнике Assist. К нему, к сожалению, чисто голосом сейчас обратиться никак, хотя в сообществе придумали забавные методы типа обращения к нему по телефону (поднял трубку, сказал, услышал ответ, положил). Но интерфейс добавления названий для разных объектов — красота. Удобно и в нужном месте.

Kirill Zholnay

@dside Не врубился Rhasspy - это движок голосового чата? Типа команды давать, а он под капотом скрипты запускает?

Go Up