@jilotta кто знает, кто знает... опять же, отсутствие датасета не равно отсутствию задачи. Мы можем проверять выход по какому-то параметру, и давать нейросети сигнал хорошо/плохо
Например, подать на вход состояние мира, и оценивать действия с точки зрения выживания
...при этом оценивать может вторая модель! И к чему они в этом процессе придут — очень интересно,
@mo чатгпт тоже оценивается двумя другими моделями, поэтому техника рабочая