Presentazione di SWE-Lancer: il benchmark per agenti AI nel software freelance
È stato presentato SWE-Lancer, un nuovo benchmark innovativo progettato per valutare se i modelli linguistici di frontiera siano in grado di operare come ingegneri del software freelance nel mondo rea