Google DeepMind presenta Gemini Robotics y Gemini Robotics-ER, sus primeros modelos de robótica basados en inteligencia artificial

TecnologíaInteligencia artificial

Google DeepMind presenta Gemini Robotics y Gemini Robotics-ER, sus primeros modelos de robótica basados en inteligencia artificial

Google DeepMind revoluciona la robótica con Gemini Robotics y Gemini Robotics-ER, modelos innovadores que combinan inteligencia artificial y destreza en tareas complejas.

Descripción

Google DeepMind ha realizado avances significativos en el campo de la inteligencia artificial, introduciendo actualizaciones constantes a sus modelos como Gemini, Imagen, Veo, Gemma y AlphaFold. Recientemente, la compañía ha ingresado al sector de la robótica con dos nuevos modelos basados en Gemini 2.0: Gemini Robotics y Gemini Robotics-ER.

Gemini Robotics es un modelo avanzado de visión-lenguaje-acción que incorpora acciones físicas como una nueva modalidad de salida para controlar robots. Este modelo ha demostrado ser capaz de comprender situaciones nunca antes vistas durante su entrenamiento, superando en rendimiento a otros modelos de última generación en un benchmark de generalización.

Además, Gemini Robotics cuenta con habilidades avanzadas de comprensión del lenguaje natural en varios idiomas, lo que le permite entender mejor los comandos dados por las personas. En cuanto a destreza, Google asegura que este modelo puede manejar tareas complejas que requieren una manipulación precisa, siendo capaz de realizar acciones como el plegado de origami o colocar un bocadillo en una bolsa Ziploc.

Por otro lado, Gemini Robotics-ER se centra en el razonamiento espacial y permite a los robóticos conectarlo con controladores de bajo nivel, facilitando su integración en proyectos existentes. Este enfoque proporciona a los ingenieros todas las herramientas necesarias para controlar un robot desde el principio, abarcando desde la percepción hasta la generación de código.

Google está colaborando con Apptronik en la construcción de robots humanoides basados en los modelos de Gemini 2.0 y trabajando con testers seleccionados, como Boston Dynamics y Agility Robotics, para dar forma al futuro de Gemini Robotics-ER. Con estas innovaciones, Google DeepMind está allanando el camino hacia un futuro donde los robots puedan integrarse sin problemas en diversas facetas de nuestra vida cotidiana.