Тем временем coqui и их text-to-speech: https://huggingface.co/spaces/coqui/xtts (демо).
Правда там всё ещё python >= 3.7, < 3.11.
Сам проект: https://github.com/coqui-ai/TTS
Тем временем coqui и их text-to-speech: https://huggingface.co/spaces/coqui/xtts (демо). Правда там всё ещё python >= 3.7, < 3.11. Сам проект: https://github.com/coqui-ai/TTS 2 comments
@th3rdsergeevich У меня была какая-то из предыдущих версий, но потом случился Debian 12 и новый питон… И мне лень скрещивать ежа с ужом :) |
@tennoseremel Уже развернул у себя на компе. Копирует голоса неплохо, есть поддержка русского. Идёт под собственной некоммерческой лицензией. Правда, в выходных файлах иногда проскальзывают куски оригинальной записи. А ещё, если громкость образца чуть выше определенного порога, то выхлоп будет с дисторсией. Лечится нормализацией/снижением громкости.