@drq Скорее всего озвучивал человек, с вербализированными паузами и нотками эмоции.

TTS на нейросетях не НАСТОЛЬКО развились по сравнению с моделями работающих с токенами. Я всё ещё жду модель что заменит и вокалоиды и дикторов.

@ZySoua