Esplorazione UCB tramite Q-ensembles nel Reinforcement Learning

La ricerca descritta dal titolo "UCB exploration via Q-ensembles" si inserisce nel campo del Reinforcement Learning (RL), focalizzandosi sul problema fondamentale dell'equilibrio tra esplorazione e sf

Fonte: OpenAI Blog

Leggi su Chatbot.it