OpenAI представила инструмент для оценки возможностей ИИ в инженерии
Новый бенчмарк MLE-bench стал открытым источником для разработчиковКоманда исследователей из OpenAI разработала новый инструмент для оценки возможностей в области машинного обучения — MLE-bench. Документ с описанием этого бенчмарка опубликован на предпечатном сервере arXiv.