MLE-bench: un nuovo benchmark per valutare gli agenti AI nelle sfide di ingegneria ML

MLE-bench è un nuovo benchmark innovativo progettato per valutare le competenze degli agenti AI nel campo dell'ingegneria del machine learning (ML). Composto da 75 competizioni tratte dalla piattaform

Fonte: OpenAI Blog

Leggi su Chatbot.it