Pianificare online, apprendere offline: apprendimento efficiente tramite model-based control
La ricerca intitolata "Pianificare online, apprendere offline" introduce un approccio innovativo per migliorare l'efficienza degli agenti basati sul reinforcement learning (apprendimento per rinforzo)