@Xeniax дошли-таки руки прочесть статью. Непривычно базированно, бальзам на душу
«For science and freedom and composability and sexy stories and the lulz»
Этот лозунг мы напишем на наших боевых знамёнах!
Не сказал бы что идея обучать модель на фильтрованном выхлопе ChatGPT меня полностью устраивает, но это лучше чем ничего. Вообще 70к вопросов-ответов (я ведь правильно понял размер дообучающей выборки) это конечно дофига, но не прям ваще дофига. В принципе такой датасет можно набить силами сообщества (у open-assistant.io, опять же если я правильно понял, примерно столько и есть уже)