LIBRA — первый в своем роде масштабный бенчмарк для оценки способности больших языковых моделей (LLM) работать с длинными текстами на русском языке. LIBRA единый, открытый и сложный полигон, на котором все желающие могут проверить свои модели в честном соревновании. В открытый доступ представлены сами задания, код для оценки и публичная таблица лидеров, что будет стимулировать дальнейшее развитие и совершенствование русскоязычных нейросетей.
бенчмарк
-
-
Искусственный интеллектНаука
Разработан метод оценки эффективности нейросетей в работе с длинными текстами
Автор Елизавета ПевнаяОн будет представлен в Ванкувере на одной из крупнейших мировых ИИ-конференций.

