Email or username:

Password:

Forgot your password?
Top-level
Dr. Quadragon ❌

@rayslava Скорость - примерно одно-два слова в секунду. Да, может быть, хотелось бы побыстрее, но не "невозможно".

Уверен, была бы видюшка пооборотистее, было бы вообще хорошо. Наверное, надо попробовать подружить ее со своей рыксой, но я не уверен, что она держит ROCm.

9 comments
rayslava

@drq можешь поставить эксперимент вот с этой пепякой: github.com/vosen/ZLUDA
Заодно и расскажешь, как там прошло воскрешение проекта.
Моя видюха пока ко мне плывёт, поэтому сам проверить пока не могу

Dr. Quadragon ❌

@rayslava Лол, прикольно. Это, считай, WINE для интелов и AMD

rayslava

@drq йеп. Именно оно!

Alexey Skobkin

@rayslava @drq
На твоей видюхе ROCm нативно работает.

burbilog

@drq @rayslava насколько я понимаю, вопрос не то чтобы в производительности, сколько в объемах VRAM, чтобы модель туда целиком влезла. народ гоняет llama 70b на двух теслах p40, старых как говно мамонта, зато каждая по 24gb. даже запихуемо в обычный корпус, разве что охлаждение колхозить надо...

Alexey Skobkin

@drq @rayslava
Так ollama и работает с ROCm.Я так и запускаю.

Alexey Skobkin

@drq @rayslava
Ну RX по-моему все или почти все должны уметь в ROCm.

Плюс в ряде случаев можно переменной среды форсить использование нужного ядра ROCm для "похожей" видеокарты так чтобы работало на твоей. Так некоторые встройки запускали 🤷

SouceCalve

@skobkin @drq @rayslava моя 580 на 8гб дружит только со старым rocm, но в докере)

Go Up