@drq @th3rdsergeevich @rf

Вообще по словам create a speech dataset находится например

github.com/MycroftAI/mimic-rec

Может в эту сторону копать?

( Full disclaimer - я вообще-то не в теме, просто гуглю вместе с вами ради интереса :) )