Я всё-таки пошёл копать, как устроен голос Larynx в #Rhasspy, с целью избавиться от странной аномалии, которая меня уже много месяцев донимает: произношения "шесть" как [шос].
Оказалось, что косяк случается ещё до того, как в дело вступает какой-либо машинлёрнинг. Там тупо в словаре для слова "шесть" были фонемы "ʂ oː s tʲ". Почему и откуда, вопрос тоже интересный, но для другого раза.
А что случается это *до* машинлёрнинга это *очень* хорошая новость — благодаря этому изменение несложно сделать руками в уже собранном и установленном языковом профиле, ничего тренировать не надо.
Больше никакого "шос градусов"!
Ни один SQL'ный update мне, пожалуй, ещё не приносил такого удовлетворения.
Теперь затолкать бы эту правку в проект: https://github.com/rhasspy/gruut/issues/36
@dside блин, а я так silero и не завёл у себя. Несколько дней потратил на компиляцию более свежего gcc чтоб скомпилировать pytorch 1.10. А оно мне "ATTENTION: your model computation is overflowing" при запуске синтеза хотябы простого слова "собака"...