Forwarded from addmeto (Grigory Bakunov)
Обновилась статистика на чатбот-арене, можно посмотреть, какие LLM лидируют. Предсказуемо, на первом месте GPT4. Обещания Claude о том, что они новый лидер, не помогли, только третье место.
Как работает чатбот-арена: люди вводят свой промпт, показывается 2-3 варианта ответа от разных моделей, и пользователь выбирает, какой ответ лучше. После многих тысяч таких голосований на основании статистики строится лидерборд.
https://huggingface.co/spaces/lmsys/chatbot-arena-leaderboard