
Con motivo de aplicar la inteligencia artificial al mundo físico, Google DeepMind presentó una nueva versión de IA para robots humanoides: Gemini Robotics. Bajo un modelo de visión-lenguaje-acción (VLA), la implementación de Gemini 2.0 presuntamente brindará la capacidad de tomar decisiones más complejas y adaptar su uso a una gran amplitud de contexto.
Tras los aprendizajes con el primer modelo de Gemini, diseñado para competir contra OpenAI, Google desarrolló las capacidades de su IA multimodal con nuevas aplicaciones para la robótica. A través de una alianza con Apptronik, Agile Robots, Agility Robots, Boston Dynamics y Enhanced Tools, la tecnológica llevó a cabo avances para robots humanoides especializados en tareas cotidianas.
De acuerdo con la información de DeepMind consultada por NotiPress, Gemini 2.0 está orientada al trabajo mecánico con capacidades de adaptación y aprendizaje controlado. Entre los prototipos señalados en la documentación, Google mostró un par de brazos mecánicos con la capacidad de seleccionar ropa de otro tipo de objetos y resolver rompecabezas.
"Para operar en nuestro mundo físico dinámico, los robots deben ser capaces de interactuar con personas y su entorno sin problemas, así como adaptarse a cambios sobre la marcha", informó Google DeepMind.
Voceros de Google informaron que la innovación en robótica requiere la cooperación de sectores críticos para su desarrollo: la industria, la academia, y los órganos reguladores. Respecto a la seguridad de los modelos de información e instrucciones de operaciones, la plataforma ASIMOV dataset permite a los investigadores consultar las bases de datos y elegir los sistemas adecuados.
A diferencia de los modelos de IA generativa para bots conversacionales (chatbots), los robots humanoides necesitan medidas adicionales de seguridad para interactuar con el mundo físico sin afectar su estabilidad de movimiento. En este contexto, Gemini 2.0 brinda los modelos de entrenamiento para evitar colisiones, limitar el uso de fuerza de contacto, y añadir controles de seguridad con sensores.
No obstante, la seguridad y responsabilidad en el desarrollo de robots humanoides potenciados con inteligencia artificial requiere las consideraciones de uso de información y gobernanza del sector IA. De acuerdo con la Organización de las Naciones Unidas para la Educación, la Ciencia y la Cultura (UNESCO), la gobernanza en materia de inteligencia artificial representa uno de los desafíos más importantes del sector tecnológico global.
Por la dependencia de la IA de Google, entre cuyas capacidades resaltó los modelos semánticos necesarios para casos como seleccionar una prenda de ropa entre una pila de otros objetos, el uso de la información sensible cobró importancia. Al respecto, ISS Insights subrayó en marzo de 2024 que la empresa matriz de Google, Alphabet, fue objeto de brechas de seguridad donde se revelaron grandes cantidades de datos de usuarios y organizaciones. (Notipress)