что будет с памятью у линукс сервера (дохлая впс с 2гб рамы) если на ней запустить ffmpeg в много потоков(там медленное скачивание и перемалывание кусков видео с ютуба). сожрет много раз по много мбайт или только 1 раз по много
Вроде получилось сделать транскрипцию большого видеоролика с ютуба с помощью джемини флеш. но что то как то очень тяжко это идет.
Куски размером по 10 минут скачиваются параллельно, и так же в этих потоках транскрибируются с помощью джемини, потом всё склеивается. В теории должно работать быстро, но ютуб может отдавать медленно и куски и в целом, может скорость притушить до 1х так что даже много потоков не сильно помогут. С таймаутами непонятно, есть ли они у yt-dlp. Выглядит так будто может вообще зависнуть насмерть.
Качество как и ожидалось, выглядит лучше чем то что делает сам ютуб. Для дальнейшей суммаризации итп с помощью ИИ — идеально вообще. telegra.ph
ИИ может взбрыкнуть, из за цензуры или еще чего запороть кусок, и не один.
Вроде получилось сделать транскрипцию большого видеоролика с ютуба с помощью джемини флеш. но что то как то очень тяжко это идет.
Куски размером по 10 минут скачиваются параллельно, и так же в этих потоках транскрибируются с помощью джемини, потом всё склеивается. В теории должно работать быстро, но ютуб может отдавать медленно и куски и в целом, может скорость притушить до 1х так что даже много потоков не сильно помогут. С таймаутами непонятно, есть ли они у yt-dlp. Выглядит так будто может вообще...
джемини шикарные транскрипции для аудиозаписей делает. 8 минут речи меньше чем за минуту почти без ошибок, ошибки в основном совсем мелкие и не значительные
думаю попробовать делать транскрипции (и пересказ) для роликов вна ютубе у которых почему то нет субтитров(авторы сами запрещают или почему их нет?)
для этого надо каким то образом резать на части аудиофайлы, ну то есть не тупо по минутам(хотя тоже вариант, все равно получится лучше чем есть сейчас у ютуба) а как то искать паузы в заданном районе. как?
некоторые люди говорят так быстро что в 5 минут могут наговорить все 20 и тогда транскрипция этой части может не поместится в ответе джемини (до 8000, токенов в реальности еще меньше — не любят они на всю котлету отвечать). что с этим делать непонятно, резать на более мелкие куски только
джемини шикарные транскрипции для аудиозаписей делает. 8 минут речи меньше чем за минуту почти без ошибок, ошибки в основном совсем мелкие и не значительные
думаю попробовать делать транскрипции (и пересказ) для роликов вна ютубе у которых почему то нет субтитров(авторы сами запрещают или почему их нет?)
для этого надо каким то образом резать на части аудиофайлы, ну то есть не тупо по минутам(хотя тоже вариант, все равно получится лучше чем есть сейчас у ютуба) а как то искать паузы в заданном районе. как?
да сильно заметно медленнее. у обычного гугловского распознавателя речи есть мерзкая особенность, любит глотать последнее слово. джемини вроде так не делает, или делает но потом восстанавливает
добавил и сделал основным распознаватель голосовух от gemini
из плюсов — может больше 1 минуты распознать(в теории до 8000 токенов на выходе и до 1млн на входе), а обычный бесплатный гугол (андроидовский? я даже хз откуда он но не требует авторизацию и работает прилично) только минуту работает
может сразу текст обработать, исправить и облагородить, эканья убрать наверное тоже можно, экономия вызовов получается
из минусов... скорость вроде ниже но хз. приходится закачивать файл вна облако, и потом еще удалять оттуда, такое себе воркфлоу
цензура, такая же как в обычном чате, это прямо вообще печально
Теоретически можно делать пересказ больших аудиозаписей, например тех что на ютубе не имеют субтитров, но это надо скачать оттуда звук, закачать его в облако, и держать кулачки чтоб пересказ сработал.
добавил и сделал основным распознаватель голосовух от gemini
из плюсов — может больше 1 минуты распознать(в теории до 8000 токенов на выходе и до 1млн на входе), а обычный бесплатный гугол (андроидовский? я даже хз откуда он но не требует авторизацию и работает прилично) только минуту работает
может сразу текст обработать, исправить и облагородить, эканья убрать наверное тоже можно, экономия вызовов получается
из минусов... скорость вроде ниже но хз. приходится закачивать файл вна облако, и потом...
Возьмите все мои деньги: Hasbro выпустили первую официальную Монополию по Гарри Поттеру
Правила игры все те же, но теперь там каноничные локации из франшизы, а фигурками игрока стали метла, Хогвартс-Экспресс, двухэтажный автобус, мотоцикл Хагрида, Гиппогриф и Фестрал
нашел наконец нормально работающий вариант RAG для Groq. Всё в нем хорошо кроме того что текст в базу загоняется локально, с помощью какой то нейросети и происходит это очень медленно pastebin.com
хз какая скорость, что то около 20кб в минуту на моем селероне. большую книгу я не дождался, оперативки жрал 6гб+ то есть вход на хостинг ему закрыт
зы мистрал 8б подозрительно хорошо пересказывает русские тексты
сделай максимально подробный пересказ первой части, 2000 слов
В начале романа "Путеводитель по галактике для автостопщиков" Дугласа Адамса представлен мистер Проссер, сотрудник городского совета, который ответственен за надзор за строительством дороги, проходящей через дом Артура Дента. Мистер Проссер — это типичный бюрократ, который беспокоится о том, чтобы выполнить свою работу в срок, даже если это означает, что он должен изгнать Артура Дента из его собственного дома.
С другой стороны, Артур Дент — это обычный человек, который просыпается в день, когда его дом должен быть снесен, чтобы освободить место для новой дороги. Артур не знает о планах городского совета и полностью не понимает, почему его дом должен быть разрушен. Он просто хочет, чтобы ему дали шанс собрать свои вещи и найти себе новое жилье.
Мистер Проссер и Артур Дент представляют собой два разных мира, которые столкнулись друг с другом из-за планов городского совета по строительству дороги. Мистер Проссер считает, что он выполняет свой долг, следуя приказам своего начальства, в то время как Артур Дент считает, что его права нарушены, и он заслуживает уважения и сочувствия.
В то время как мистер Проссер и Артур Дент пытаются разобраться со своей ситуацией, Дуглас Адамс использует эту возможность, чтобы высмеять бюрократию и критиковать бездумное планирование, которое часто приводит к тому, что обычные люди страдают. Кроме того, автор использует юмор, чтобы развеселить читателей и сделать историю более интересной.
В конечном итоге, Артур Дент вынужден бежать от бульдозера, который направляется к его дому, и он начинает свое приключение по галактике, которое изменит его жизнь навсегда.
Всего лишь в первой части романа Дугласа Адамса "Путеводитель по галактике для автостопщиков" читатель встречается с интересными персонажами, забавными ситуациями и острым социальным сатирическим очерком.
нашел наконец нормально работающий вариант RAG для Groq. Всё в нем хорошо кроме того что текст в базу загоняется локально, с помощью какой то нейросети и происходит это очень медленно pastebin.com
хз какая скорость, что то около 20кб в минуту на моем селероне. большую книгу я не дождался, оперативки жрал 6гб+ то есть вход на хостинг ему закрыт
зы мистрал 8б подозрительно хорошо пересказывает русские тексты
"В "Майн Кампф" Гитлер использует другие термины, чтобы описать свои идеи о "расовой гигиене" и уничтожении "неполноценных" рас.
К сожалению, я не могу точно указать главу, где встречается эта цитата, так как у меня нет доступа к тексту "Майн Кампф".
Однако, я могу предположить, что она могла быть взята из глав, где Гитлер описывает свои идеи о "расовой борьбе" и "расовой гигиене", например, из глав 6-8.
Чтобы найти точное место цитаты, тебе нужно будет обратиться к тексту "Майн Кампф" и поискать ее там. "
как детектить в тексте маркдауна от ботов жирный текст выделенный одной звездочкой. это же может перепутаться с другим. с умножением например 2*2=4 на той же строке
обычно они двумя звездочками выделяют, но бывает что и 1