@AncientGood
Добро пожаловать в биоакустику.
Про закономерности следования "нот" и "фраз" существует целая наука. Семантики пока не нашли, за редкими исключениями. А вот корреляции с эмоциональным состоянием, гормонами и.т.д. - то да.
Ну и в целом повтыкать на спектрограммы прикольно... Главное FFT len выставить не слишком большим, чтобы картинка не мылилась по оси времени.
Если ещё не рекомендовал, то вот: whoBIRD на f-droid foss (но сетку берут готовую) приложуха для распознавания птиц по голосу.