Вроде получилось сделать транскрипцию большого видеоролика с ютуба с помощью джемини флеш. но что то как то очень тяжко это идет.
Куски размером по 10 минут скачиваются параллельно, и так же в этих потоках транскрибируются с помощью джемини, потом всё склеивается. В теории должно работать быстро, но ютуб может отдавать медленно и куски и в целом, может скорость притушить до 1х так что даже много потоков не сильно помогут. С таймаутами непонятно, есть ли они у yt-dlp. Выглядит так будто может вообще зависнуть насмерть.
Качество как и ожидалось, выглядит лучше чем то что делает сам ютуб. Для дальнейшей суммаризации итп с помощью ИИ — идеально вообще.
telegra.ph
ИИ может взбрыкнуть, из за цензуры или еще чего запороть кусок, и не один.