Мне нравится лить водичку ChatGPT. Да, может он и пишет хуже по качеству, но НИКОГО это ниибёт, потому что эту херню все делают для галочки
Top-level
Мне нравится лить водичку ChatGPT. Да, может он и пишет хуже по качеству, но НИКОГО это ниибёт, потому что эту херню все делают для галочки 12 comments
Моделька отлично перемалывает википедию в человекочитаемый формат :ageblobcat: Попробую швыряться в неё целыми статьями. Официальная дока говорит про лимит в 4 тысячи токенов (это на самом деле очень много) Хм. На русском он отказался по причине "Палехче, тут слишком много" Откопала в открытом доступе токенизер...ёмае, да там токенов больше чем символов! Как оно с таким токенизатором В ПРИНЦИПЕ умудряется выдавать что-то осмысленное на русском??? Для понимания, представьте что вы читаете текст по одной букве, и ответ формулируете тоже по одной букве. Вот как-то так с вами общается чатгпт на русском
[DATA EXPUNGED]
@mo @frssoft большая разница, обрабатывать текст корректно или некорректно @frssoft токенизация по половине символа? Крайне вряд-ли. Просто кое-кто до сих пор не может осознать тот факт, что существует жизнь за пределами US-ASCII
[DATA EXPUNGED]
@th3rdsergeevich модель не работает с байтами от слова совсем |
Процесс лития водички выглядит как-то так
1. Напиши мне в общих чертах про проблему
2. Ctrl+C, Ctrl+V
3. А теперь обоснуй актуальность, объект и предмет исследования
4. Ctrl+C, Ctrl+V
5. ну вы понели
Причем мне даже переводчик подключать не приходится, потому что там рили тривиальщина, и достаточно русскоязычной части модели