🗣️ Что-то я уже давно не трогал #Rhasspy.
Выпущена ранняя версия Rhasspy 3, а в ней распознаёт речь уже Whisper (по моделям от OpenAI), а синтезирует Piper. Всё ещё без облаков.
Whisper даже без закрытого словаря показывает впечатляющую точность. Для русского языка, да.
Даже модель tiny-int8 (43Мб), пригодная для Raspberry Pi 4, довольно шустро выдаёт похожий текст. А если чётко произнести, то даже правильный.
А small (968Мб) настолько суров, что даже восстанавливает по паузам пунктуацию, бьёт на предложения и замечает (по интонации?) вопросы!
Я как-то дальнейшее развитие своей говорилки планировал из расчёта на закрытый словарь, но похоже, что он не потребуется, можно сосредоточиться на тексте.
Что до Piper — после Larynx улучшение инкрементальное, но заметное. Голос звучит куда естественнее, фонемы соединяются органичнее.
Всё ещё местами странное ударение и добавились неловкие паузы, но "чтение первого абзаца случайной статьи с Википедии" теперь вызывает куда меньшее недоумение.
🏠 …и #HomeAssistant тоже растёт.
Собственно, Whisper и Piper я испытывал именно в нём, на его новом помощнике Assist. К нему, к сожалению, чисто голосом сейчас обратиться никак, хотя в сообществе придумали забавные методы типа обращения к нему по телефону (поднял трубку, сказал, услышал ответ, положил). Но интерфейс добавления названий для разных объектов — красота. Удобно и в нужном месте.
И в мобильное приложение HA его добавили как мобильного ассистента — а вот это уже может быть интересно, т. к. это готовое удалённое (!) голосовое управление. Если туда добавят ещё и слово-активатор, можно будет старые андроиды приспосабливать как голосовые терминалы. Прикольно! Причём для моей системы работает уже сейчас, и почти без настройки!
Есть вещи и помельче.
Например, он научился показывать свою приборную панель (дэшборд, окей) через медиаплееры. Со скроллом даже. Правда, на 49 дюймах всё очень огромное и масштаб я сходу не нашёл. Но штука полезная.
🏠 …и #HomeAssistant тоже растёт.
Собственно, Whisper и Piper я испытывал именно в нём, на его новом помощнике Assist. К нему, к сожалению, чисто голосом сейчас обратиться никак, хотя в сообществе придумали забавные методы типа обращения к нему по телефону (поднял трубку, сказал, услышал ответ, положил). Но интерфейс добавления названий для разных объектов — красота. Удобно и в нужном месте.