Pianificare online, apprendere offline: apprendimento efficiente tramite model-based control

La ricerca intitolata "Pianificare online, apprendere offline" introduce un approccio innovativo per migliorare l'efficienza degli agenti basati sul reinforcement learning (apprendimento per rinforzo)

Fonte: OpenAI Blog

Leggi su Chatbot.it