Великим шагом для LLM'ок будет тот момент, когда они...

Blue

@drq@mastodon.ml кажется, мне нехватает эмоджи реакции "подпишусь под каждым словом"

29 Aug 2024 at 12:32 | Open on quietplace.xyz

Galactic Jew 🇮🇱

@drq 100%

29 Aug 2024 at 12:44 | Open on t51b.org

ARYLUNEIX :twittercheck:

@drq они вроде уже могут так говорить, но в более официальном тоне - "простите, но я не имею достаточной информации о теме вашего вопроса, не могли-бы вы уточнить..." и т.п. 😬

29 Aug 2024 at 12:53 | Open on mastodon.ml

lnkr_

@drq сильно зависит от задачи, как стоявшей при создании модели, так и потом поставленной для этой модели, но вообще, в случае универсальной, на все руки модели, лучше получать ответ и какую-то метрику уверенности в нём, и отсеивать-маркировать барахло уже на постобработке (на этом же этапе можно ответ заменить и на "а не знаю", если уверенность ни к черту), чем просто получить отказ и всё тут, примерно это и делала ранняя интеграция модели в bing, посреди ответа вдруг всё удаляя и заменяя на "слушай, а вообще давай не будем, а".

Где мы возьмём какую-то метрику уверенности? Уже все давно изобретено и даже доступно во многих апи и софте для инференции моделек - logprobs! https://www.refuel.ai/blog-posts/labeling-with-confidence

Почему почти никто никак не задействует это ни в одном из ходовых UIев, и только в презентациях на конференциях иногда это используется для понятности и наглядности?

Вот это для меня - страшная загадка.

@drq сильно зависит от задачи, как стоявшей при создании модели, так и потом поставленной для этой модели, но вообще, в случае универсальной, на все руки модели, лучше получать ответ и какую-то метрику уверенности в нём, и отсеивать-маркировать барахло уже на постобработке (на этом же этапе можно ответ заменить и на "а не знаю", если уверенность ни к черту), чем просто получить отказ и всё тут, примерно это и делала ранняя интеграция модели в bing, посреди ответа вдруг всё удаляя и заменяя на "слушай,...

Expand text...

29 Aug 2024 at 13:18 | Open on mastodon.ml