читаешь "Модель бьёт ChatGPT по всем бенчмаркам, кроме MMLU (фактические знания) и BBH (задачи, которые языковые модели традиционно решают плохо)."

проверяешь — модель двух слов связать не может на русском, а на английском не могу я Ж) вот и поговорили