Apprendimento per rinforzo con ricompense basate sulla previsione (RND)
È stato introdotto Random Network Distillation (RND), un metodo innovativo basato sulla previsione progettato per incentivare l'esplorazione degli agenti di apprendimento per rinforzo attraverso un me