Email or username:

Password:

Forgot your password?
Top-level
Roman

@skobkin а дообучение разве не работает? Подбором датасетов под тему. Я вроде ролики на ютубе видел, народ ллм затачивает под тему кажется. Краем глаза слежу за кульбитами.

4 comments
Alexey Skobkin

@3draven
Если надо чтобы модель хорошо ориентировалась в базе знаний твоей компании, например - да, идея хорошая.
Если тебе нужно работать с информацией со всего мира - не особо подойдёт.

Roman

@skobkin а, как поисковик с мозгами. Так домашние модели врядли смогут работать, разве что кто то осилит торент для датасетов, что бы множество юзеров скрапили данные и собирался общий датасет из тысяч компов и браузеров. Но такой проект поди потяни накатать.

burbilog

@3draven @skobkin насколько я понимаю, дообучение пока не для простых смертных -- если инференс для мелких моделей можно гонять на более-менее жирных видеокартах, то чтобы дообучать надо ресурсов куда больше.

т. е. надо арендовать, а это приличные деньги

Alexey Skobkin

@burbilog @3draven
Ну, учитывая, что аренда обычно почасовая, то в зависимости от цели вполне рабочий вариант.

Go Up