Создан новый бенчмарк для проверки математических способностей ИИ

Новый тест FrontierMath

Группа ученых из США и Великобритании разработала новый бенчмарк для оценки математических способностей искусственного интеллекта (ИИ). Он предназначен для того, чтобы проверять, насколько эффективно ИИ может решать крайне сложные задачи, которые не под силу даже самым продвинутым моделям.