El algoritmo Dreamer de Google DeepMind alcanza nivel experto en Minecraft en solo nueve días
Un innovador algoritmo de Google DeepMind, llamado Dreamer, logra dominar Minecraft en solo nueve días, revolucionando el aprendizaje en inteligencia artificial.

Un equipo de investigadores de Google DeepMind, en colaboración con la Universidad de Toronto, ha desarrollado un innovador algoritmo conocido como Dreamer, capaz de auto-mejorarse jugando al popular videojuego Minecraft. En su reciente estudio, publicado en la revista Nature, los científicos Danijar Hafner, Jurgis Pasukonis, Timothy Lillicrap y Jimmy Ba demostraron que este algoritmo alcanzó un nivel experto en el juego en tan solo nueve días y sin haber recibido entrenamiento previo.
Durante los últimos años, la comunidad científica ha investigado cómo el aprendizaje profundo puede utilizarse para capacitar aplicaciones de inteligencia artificial en actividades que simulan la inteligencia humana, como responder preguntas o jugar videojuegos. Sin embargo, los avances recientes indican que un algoritmo como Dreamer puede proporcionar beneficios significativos al permitir que una aplicación de inteligencia artificial mejore sus habilidades en un corto período de tiempo. Esta capacidad podría revolucionar la forma en que los robots se entrenan para cumplir con objetivos en el mundo real.
El sistema de recompensas del algoritmo se centra en la búsqueda de diamantes dentro del juego, lo que le permite aprender las reglas de Minecraft sin necesidad de formación inicial. Para maximizar su auto-mejora, los investigadores limitaron el tiempo de juego a 30 minutos por sesión, después de lo cual el juego se reiniciaba en un nuevo universo virtual. Esta metodología permitió que Dreamer mejorara rápidamente, logrando el estatus de experto tras solo nueve días de juego.
La habilidad de Dreamer para imaginar futuros escenarios donde sus objetivos han sido cumplidos se traduce en un enfoque centrado en las tareas que realmente conducen al logro de dichas metas, aplicando este conocimiento en cada nuevo mundo virtual que enfrenta. Los investigadores sugieren que estos resultados podrían ser fundamentales para permitir que los robots aprendan a alcanzar objetivos predefinidos en entornos del mundo real.