Я вчера таки добравлся до whisper от open ai
Нашел гайд, где используют `whisper-cpp` и `pyannote-whisper`
эта связка распознает текст, и пилит его по людям
короче это восторг! я вчера взял часовой подкаст на русском языке и сейчас отслушиваю
основные ошибки — это «нет пробела» между словами, и то, выглядит так, что это просто на границе чанков аудио
гайд — https://vas3k.club/post/18916/
пример вычитанного результата — https://docs.google.com/document/d/1G4XAzeur6hnud07ZDI3qvHKrU9-J6RofMVZas6SS-uA/edit