Este cuadrúpedo que se tambalea equilibrado sobre una pelota de ejercicios es un experimento divertido de ver, pero en el fondo demuestra que las IA como GPT-4 pueden entrenar a robots para que realicen tareas complejas en el mundo real con mucha más eficacia que los humanos.
DrEureka, un nuevo paquete de software de código abierto, se utiliza para entrenar robots para que realicen tareas del mundo real utilizando grandes modelos lingüísticos (LLM) como ChatGPT 4. Es un sistema “sim-to-reality”, lo que significa que enseña a los robots en un entorno virtual utilizando física simulada, antes de implementarlos en el espacio carnal.
El Dr. Jim Fan, uno de los desarrolladores de DrEureka, utilizó un robot cuadrúpedo Unitree Go1 para saltar a los titulares. Se trata de un robot de “bajo coste” y de código abierto, lo cual es muy útil, porque incluso con IA, las mascotas robot son susceptibles de sufrir caídas. En cuanto al “bajo coste”, bueno… Se vende en Amazon por 5.899 dólares y tiene una valoración de 1 estrella.
Robots que son mejores que nosotros en casi todos
La “Dr” de DrEureka significa “Domain randomization”, es decir, aleatorización de variables como la fricción, la masa, la amortiguación, el centro de gravedad, etc. en un entorno simulado.
Con unas pocas indicaciones en un LLM como ChatGPT, la IA puede escribir código que cree un sistema de recompensa/penalización para entrenar al robot en el espacio virtual, donde 0 = fallo, y todo lo que sea superior a 0 es una victoria. Cuanto mayor sea la puntuación, mejor.
Puede crear parámetros minimizando y maximizando los puntos de fallo/rotura en áreas como el rebote de la pelota, la fuerza motriz, el grado de libertad de sus extremidades y la amortiguación, por nombrar algunas. Como LLM, no tiene ningún problema en crearlos en grandes volúmenes para que el sistema de entrenamiento los ejecute simultáneamente.
Después de cada simulación, GPT también puede reflexionar sobre lo bien que lo ha hecho el robot virtual y cómo puede mejorar. Exceder o violar los parámetros, por ejemplo, sobrecalentando un motor o intentando articular una extremidad más allá de sus capacidades, dará como resultado un 0… Y a nadie le gusta obtener cero puntos, ni siquiera a una IA.
¿Qué tal lo hizo? Mejor que nosotros. DrEureka fue capaz de superar a los humanos en el entrenamiento del robot, con una ventaja del 34% en la velocidad de avance y del 20% en la distancia recorrida en terrenos mixtos del mundo real.