@sitnik_ru и это упирается в архитектуру трансформеров: по сути это сжатый с потерями весь тренировочный корпус, который через слой с attention по переданным эмбедингам выбирает вероятные следующие токены из этого сжатого корпуса. Мне кажется что пока не появятся другие архитектуры, все эти проблемы с нестабильностью и бредом решены не будут, а значит и интерфейсы не будут нормально работать. А когда они появятся хз :(