Presentazione di SWE-Lancer: il benchmark per agenti AI nel software freelance

È stato presentato SWE-Lancer, un nuovo benchmark innovativo progettato per valutare se i modelli linguistici di frontiera siano in grado di operare come ingegneri del software freelance nel mondo rea

Fonte: OpenAI Blog

Leggi su Chatbot.it