К слову, мы тут как-то на регулярках и вне обсуждали распознавание картинок нейросеточками.
Я тогда говорил про Stable Diffusion, но совсем забыл про мультимодальные модели вроде llava.
Закрою этот недочёт показав примеры работы одного из вариантов этой мультимодалки на обоях по Interstellar.
Работает, если что, не в облаке, а на моём домашнем сервере.
#LLM #AI #ML #multimodal #ollama #selfhosting #local #video #demo
Или вот мем с Друзём.