Email or username:

Password:

Forgot your password?
Top-level
D:\side\

@mo очень странно. Когда я Whisper испытывал, он русский понимал настолько хорошо, что знаки препинания расставлял в соответствии с интонацией (проверял одинаковыми предложениями).

А соотношение скорости и качества можно регулировать выбором модели. Меня small для голосовых команд устроил, но для менее контролируемых сред, вероятно, надо модельку побольше.

7 comments
Мя :sparkles_lesbian:

@dside ну я скачала готовый ggml для tiny. Без суффикса en, так что должен быть мультиязычный он кряхтел 20 секунд, грузя четыре ядра на 100%, и выдал вот это

Я (голосовым): раз-раз проверка связи
Бот: RAS RAS PROverk as VESIA
Мя :sparkles_lesbian:

@dside а vosk-ru-small за секунду выдал корректный результат. Выбор для меня оказался очевиден

D:\side\

@mo у меня использовался не whisper.cpp, а faster-whisper: github.com/SYSTRAN/faster-whis
Пишут, что на CPU он быстрее раз в 5:
github.com/SYSTRAN/faster-whis

Вот эта штука (на питоне как раз, кстати) у меня этим занималась:
github.com/rhasspy/wyoming-fas

Мя :sparkles_lesbian:

@dside быстрее раз в пять это всё ещё 4 секунды полной загрузки CPU

D:\side\

@mo ну, такая вот сейчас цена у качественного распознавания, да. Но если воск справляется, прекрасно. А то у виспера ещё и галлюцинации иногда в тишине бывают в форме имён авторов субтитров :blobcateyes:

Мя :sparkles_lesbian:

@dside окей, я воткнула эту штуку, выглядит лучше чем я ожидала. Погоняю ещё

Мя :sparkles_lesbian: replied to Мя

@dside правда мой комп тянет с приемлемой скоростью максимум tiny (8bit CPU)

VPSка ещё слабее

Go Up