Я поебалась чтобы осознать, что вхиспер работает как ебучий тормоз и не умеет в русский
Выкинула вхиспер, вкостылила vosk. Быстрое. Рабочее.
Top-level
Я поебалась чтобы осознать, что вхиспер работает как ебучий тормоз и не умеет в русский Выкинула вхиспер, вкостылила vosk. Быстрое. Рабочее. 9 comments
@dside ну я скачала готовый ggml для tiny. Без суффикса en, так что должен быть мультиязычный он кряхтел 20 секунд, грузя четыре ядра на 100%, и выдал вот это @dside а vosk-ru-small за секунду выдал корректный результат. Выбор для меня оказался очевиден @mo у меня использовался не whisper.cpp, а faster-whisper: https://github.com/SYSTRAN/faster-whisper Вот эта штука (на питоне как раз, кстати) у меня этим занималась: @dside правда мой комп тянет с приемлемой скоростью максимум tiny (8bit CPU) VPSка ещё слабее |
@mo очень странно. Когда я Whisper испытывал, он русский понимал настолько хорошо, что знаки препинания расставлял в соответствии с интонацией (проверял одинаковыми предложениями).
А соотношение скорости и качества можно регулировать выбором модели. Меня small для голосовых команд устроил, но для менее контролируемых сред, вероятно, надо модельку побольше.