Google DeepMind lanza DreamerV3, una IA que mina diamantes en Minecraft sin entrenamiento específico

Google DeepMind presenta DreamerV3, un innovador algoritmo que demuestra su capacidad para jugar Minecraft de manera autodidacta y eficiente.

Publicado: 03-04-2025 14:28

Google DeepMind ha presentado DreamerV3, un algoritmo innovador capaz de minar diamantes en Minecraft sin necesidad de entrenamiento específico ni de datos humanos. Este juego, conocido por su naturaleza aleatoria, representa un reto significativo para las inteligencias artificiales, ya que exige memorizar múltiples acciones complejas en un entorno que cambia constantemente.

El equipo de investigación ha utilizado la versión de investigación de Minecraft, llamada Malmo, junto con entornos del concurso MineRL, para desarrollar y probar DreamerV3. Se ha demostrado que esta solución, basada en el aprendizaje por refuerzo (reinforcement learning), simula acciones futuras y optimiza su estrategia, lo que le permite mejorar su rendimiento en diversas tareas. De hecho, DreamerV3 ha superado a varios modelos específicos de dominio, incluyendo el algoritmo Proximal Policy Optimization (PPO) de OpenAI, en diferentes entornos de prueba.

Una de las críticas comunes a las IA basadas en el aprendizaje por refuerzo es que a menudo se desempeñan excepcionalmente bien en tareas para las cuales han sido diseñadas, gracias a funciones de recompensa adaptadas. Sin embargo, según el estudio publicado en la revista Nature, DreamerV3 ha demostrado un rendimiento superior en una variedad considerable de juegos y tareas, sugiriendo su eficacia más allá de un diseño específico.

Los investigadores destacan que DreamerV3 se beneficia de técnicas de robustez como la normalización y transformaciones, lo que permite un aprendizaje estable a través de diversos dominios. Asimismo, el sistema determina las recompensas mediante funciones matemáticas predefinidas, lo que habilita a la IA a ejecutar acciones como golpear bloques repetidamente para extraer recursos.

Georg Martius, experto en aprendizaje autónomo del Max-Planck-Institut für Intelligente Systeme, ha elogiado el estudio, subrayando que modelo basado en el aprendizaje por refuerzo ha mostrado su amplio potencial y eficiencia. Sin embargo, algunos expertos como Jan Peters, profesor de sistemas inteligentes en la TU Darmstadt, han expresado dudas sobre la aplicabilidad de las heurísticas utilizadas en situaciones del mundo real, catalogándolas como "intellectualmente insatisfactorias".

En resumen, DreamerV3 representa un avance significativo en el campo de la inteligencia artificial, abriendo nuevas posibilidades para su aplicación en diferentes áreas, desde videojuegos hasta el control de robots simplificados.