Создан новый бенчмарк для проверки математических способностей ИИ
Новый тест FrontierMathГруппа ученых из США и Великобритании разработала новый бенчмарк для оценки математических способностей искусственного интеллекта (ИИ). Он предназначен для того, чтобы проверять, насколько эффективно ИИ может решать крайне сложные задачи, которые не под силу даже самым продвинутым моделям.