AI Agent: nuovi benchmark per valutare l'autonomia nelle operazioni aziendali
Ricercatori della Carnegie Mellon University e di Fujitsu hanno presentato tre nuovi benchmark alla conferenza AAAI 2026 per valutare l'affidabilità degli agenti AI nelle operazioni aziendali autonome