Email or username:

Password:

Forgot your password?
Мя :sparkles_lesbian:

Потыкав PyAV (который работает с ффмпегом напрямую) я кажется начинаю понимать, почему все популярные врапперы просто оборачивают вызов шелл-команды...

9 comments
Мя :sparkles_lesbian:

То есть моя хрень выдаёт корректно всё, но в момент когда байты передаются в либу, что-то магически портится, и выпадает ошибка

Я буквально сделала дамп содержимого BytesIO и попробовала открыть. Всё работает. Но как только этот же BytesIO просто передают дальше, декодер охреневает

Мя :sparkles_lesbian:

PyAV -> BytesIO -> file -> PyAV == OK
PyAV -> BytesIO -> PyAV == BOOM

Мя :sparkles_lesbian:

ААААААААААААААА

после записи в BytesIO курсор стоит в конце, и если не сделать seek(0) то при попытке прочитать прочитается ничего....

Мя :sparkles_lesbian:

Полтора часа на то, чтобы просто воткнуть примитивный блин фильтр ffmpeg и давить шум :blobcatgooglyholdingitsheadinitshands: :blobcattableflip:

Мя :sparkles_lesbian:

В душе не представляю, насколько эффективно он работает, но вроде многообещающий, с RNN

Мя :sparkles_lesbian:

м, с фильтром и без шума распознаёт хуже, чем без фильтра...

Мя :sparkles_lesbian:

Проблема видимо в том, что у этого фильтра есть несколько моделей, каждая из которых оптимизирована под свой тип речи+шумов

И если взять модель которая рассчитана на запись голоса в шумной обстановке, и применить на более чистую запись, она начинает срезать то, что не надо бы

Мя :sparkles_lesbian:

Полтора часа напряженной работы можно смело выкидывать нахрен 👍

Мя :sparkles_lesbian:

Почему у меня не получается так же эффективно работать за деньги, а? :'с

Go Up