@skobkin@lor.sh прост со стоковыми параметрами моя 3,1 q5 пишет в стиле я есть грут
@Worst Так может потому и пишет, что у неё инференс по пизде идёт из-за неудачной версии модели?
https://github.com/ggerganov/llama.cpp/pull/1684#issuecomment-1579252501
Попробуй Q4_K_M. И, естественно, instruct версии.
@skobkin@lor.sh
@Worst ?
@skobkin@lor.sh У меня этот чекпоинт лежит
@skobkin@lor.sh тьфу блять, какой чекпоинт...
@Worst Ну лежит и лежит. Попробуй четырёхбитную, говорю. Её по идее проще должно быть в памяти укладывать.
@skobkin@lor.sh Так у меня нет проблем с памятью Но ладно, ладно, попробую 4km
@Worst Я не знаю в чём у тебя проблема. Но я помню, что у меня модель вела себя как после лоботомии как раз когда я ошибался и стягивал не те версии весов.
@skobkin@lor.sh Так по схеме с ссылки q5km ном же должны быть
@Worst
Так может потому и пишет, что у неё инференс по пизде идёт из-за неудачной версии модели?
https://github.com/ggerganov/llama.cpp/pull/1684#issuecomment-1579252501
Попробуй Q4_K_M. И, естественно, instruct версии.