OpenAI lancia GDPval: nuovo benchmark per misurare l'impatto economico dell'AI
OpenAI ha presentato GDPval, un nuovo framework di valutazione progettato per misurare le prestazioni dei modelli di intelligenza artificiale su compiti reali e con valore economico. A differenza dei