Email or username:

Password:

Forgot your password?
Айсылу 🦊

у меня была теория, что обработка файлов Whisper'ом зависит от того, сколько материала на языке в него вложили (читай - более крупные языки обрабатываются быстрее)

я решила это проверить и запустила Whisper на сериях примерно одинаковой длительности и интенсивности речи на языках, которые я знаю

теория подтвердилась:
английский - 2ч 37мин
русский - 2ч 54мин
боснийский - 4ч 50мин

#whisper #РаспознаваниеРечи

5 comments
MrClon

@wonderfox видимо зависимость доли в обущающей выборке и скорости очень не линейная. При всём уважении к великому и могучему, до английского в смысле количества материала ему далеко.

Интересно бы взять какую-то короткую сцену из голливудского фильма с кучей вариантов дубляжа, и прогнать их все

Айсылу 🦊

@MrClon когда-нибудь я это сделаю
у тебя есть идеи, как достать материал для теста не вручную?

MrClon

@wonderfox на блиреях зачастую кладут дофига доуляжей. Скачать с рутрекера ремукс, вырезать из него кусок, разобрать на отдельные дороги

Айсылу 🦊

@MrClon а там разве обычно не "стопицот русских дубляжей, один оригинальный, один украинский"?

MrClon

@wonderfox не, это в рипах. А на исходных блюрей дисках 100500 разноязычных дубляжей, видимо что бы не печатать разные диски для разных стран

Go Up