@wonderfox
> для расшифровки подкаста, наверно, достаточно опции -f txt
А это где? Чо где брать, какие тулкиты есть поверх?
Мне вот встречалась такая штука под названием "Live Captions", которая наживо берёт звук, который у тебя воспроизводится и показывает субтитры в отдельном окошке:
https://github.com/abb128/LiveCaptions
https://flathub.org/apps/net.sapples.LiveCaptions
@skobkin
>А это где?
а это в самом whisper'е, ничего поверх для этого не надо. просто ввести whisper [FILE] --language [LANGUAGE] --model [MODEL] -f txt (модель лучше указывать, потому что по умолчанию он делает чуть не на самой маленькой модели и результаты хуже. я юзаю medium, она более-менее)
не знаю про тулкиты поверх, к сожалению, пользуюсь ванильным whisper. если найдёшь, скинь?
и спасибо за live captioning! оно пригодится