Era solo cuestión de tiempo antes de que la IA de Google Gemini terminara en robots humanoides reales. A los fanáticos de la ciencia ficción no les gustará esto.
La empresa tiene reveló Un par de modelos de IA con sede en Gemini 2.0 que, según dice, «sentará las bases para una nueva generación de robots útiles» que pueden «realizar una gama más amplia de tareas del mundo real que nunca».
PS5 y Assassin’s Creed Shadows Bundle
Cuando usa el código WHL64, puede reducir el precio en este paquete de PS5 de £ 534 a solo £ 458.10, lo que efectivamente lo obtiene Assassin’s Creed Shadows sin costo adicional.
- Muy
- Use el código WHL64
- Ahora solo £ 458.10
El primero se llama Géminis Robotics y ni siquiera necesita ser entrenado en una situación para entenderlo y actuar en consecuencia. «Aprovecha la comprensión del mundo de Gemini para generalizarse a situaciones novedosas y resolver una amplia variedad de tareas fuera de la caja, incluidas las tareas que nunca antes había visto en el entrenamiento».
Google dice que este modelo de acción en idioma de visión es «intuitivamente interactivo» y más dextros que los modelos anteriores y «representa un paso sustancial en el rendimiento en los tres ejes, lo que nos acerca a robots de propósito verdaderamente generales».
Un video muestra a Gemini Robotics respondiendo a los comandos para «mover la pluma para ir con otros lápices» o «recoger el baloncesto y golpearlo».
Google también muestra cómo el modelo puede responder a entornos que cambian rápidamente. Cuando se le pide que pusiera plátanos en un contenedor transparente, el robot puede llevar a cabo las tareas incluso cuando el humano se equivoca moviendo el contenedor por toda la mesa.
El blog de Google muestra la robótica de Géminis jugando tic-tac-toe, deletreando palabras de las letras en la mesa, jugando a las cartas y empacando un almuerzo.
El segundo modelo se llama Gemini Robotics-Er (que significa razonamiento incorporado), que según la compañía ofrece «comprensión espacial avanzada, lo que permite a los robotistas ejecutar sus propios programas utilizando las habilidades de razonamiento incorporado (ER) de Gemini».
La compañía agrega: «Gemini Robotics-ER se destaca en las capacidades de razonamiento incorporadas, incluida la detección de objetos y apuntar a las partes de los objetos, encontrar puntos correspondientes y detectar objetos en 3D».
Sin destino pero lo que hacemos
Esto es muy impresionante y una progresión natural para Géminis. Google dijo que está procediendo con estas iniciativas de manera responsable consultando con expertos y consejos internos y externos y otras cosas. De alguna manera no nos hace sentir mucho mejor al respecto. Skynet probablemente también tuvo una o dos charlas con esos muchachos, ¿verdad?

