Дуров, можешь объяснить, почему распознать двухсекундое аудиосообщение получается дольше, чем его тупо прослушать? Там ж все на сервере завязано