Valutare la capacità dell'IA nella ricerca scientifica: il benchmark FrontierScience di OpenAI
OpenAI ha presentato FrontierScience, un nuovo benchmark rigoroso progettato per valutare la capacità dei modelli di intelligenza artificiale di svolgere compiti complessi di ricerca scientifica. A di