Este robot hace mejor yoga que tú

Este cuadrúpedo que se tambalea equilibrado sobre una pelota de ejercicios es un experimento divertido de ver, pero en el fondo demuestra que las IA como GPT-4 pueden entrenar a robots para que realicen tareas complejas en el mundo real con mucha más eficacia que los humanos.

ChatGPT DESCARGAR

DrEureka, un nuevo paquete de software de código abierto, se utiliza para entrenar robots para que realicen tareas del mundo real utilizando grandes modelos lingüísticos (LLM) como ChatGPT 4. Es un sistema “sim-to-reality”, lo que significa que enseña a los robots en un entorno virtual utilizando física simulada, antes de implementarlos en el espacio carnal.

El Dr. Jim Fan, uno de los desarrolladores de DrEureka, utilizó un robot cuadrúpedo Unitree Go1 para saltar a los titulares. Se trata de un robot de “bajo coste” y de código abierto, lo cual es muy útil, porque incluso con IA, las mascotas robot son susceptibles de sufrir caídas. En cuanto al “bajo coste”, bueno… Se vende en Amazon por 5.899 dólares y tiene una valoración de 1 estrella.

We trained a robot dog to balance and walk on top of a yoga ball purely in simulation, and then transfer zero-shot to the real world. No fine-tuning. Just works.

I’m excited to announce DrEureka, an LLM agent that writes code to train robot skills in simulation, and writes more… pic.twitter.com/kuG14LmSOh
— Jim Fan (@DrJimFan) May 3, 2024

Robots que son mejores que nosotros en casi todos

La “Dr” de DrEureka significa “Domain randomization”, es decir, aleatorización de variables como la fricción, la masa, la amortiguación, el centro de gravedad, etc. en un entorno simulado.

Con unas pocas indicaciones en un LLM como ChatGPT, la IA puede escribir código que cree un sistema de recompensa/penalización para entrenar al robot en el espacio virtual, donde 0 = fallo, y todo lo que sea superior a 0 es una victoria. Cuanto mayor sea la puntuación, mejor.

Puede crear parámetros minimizando y maximizando los puntos de fallo/rotura en áreas como el rebote de la pelota, la fuerza motriz, el grado de libertad de sus extremidades y la amortiguación, por nombrar algunas. Como LLM, no tiene ningún problema en crearlos en grandes volúmenes para que el sistema de entrenamiento los ejecute simultáneamente.

Después de cada simulación, GPT también puede reflexionar sobre lo bien que lo ha hecho el robot virtual y cómo puede mejorar. Exceder o violar los parámetros, por ejemplo, sobrecalentando un motor o intentando articular una extremidad más allá de sus capacidades, dará como resultado un 0… Y a nadie le gusta obtener cero puntos, ni siquiera a una IA.

ChatGPT DESCARGAR

¿Qué tal lo hizo? Mejor que nosotros. DrEureka fue capaz de superar a los humanos en el entrenamiento del robot, con una ventaja del 34% en la velocidad de avance y del 20% en la distancia recorrida en terrenos mixtos del mundo real.

Author: Chema Carvajal Sarabia

{ "de-DE": "Journalist, spezialisiert auf Technologie, Unterhaltung und Videospiele. Über das zu schreiben, was mich begeistert (Gadgets, Spiele und Filme), ermöglicht es mir, bei Verstand zu bleiben und mit einem Lächeln im Gesicht aufzuwachen, wenn der Wecker klingelt. PS: Das stimmt nicht 100% der Zeit.", "en-US": "Journalist specialized in technology, entertainment and video games. Writing about what I'm passionate about (gadgets, games and movies) allows me to stay sane and wake up with a smile on my face when the alarm clock goes off. PS: this is not true 100% of the time.", "es-ES": "Content Manager - Periodista especializado en tecnología, entretenimiento y videojuegos. Escribir sobre lo que me apasiona (cacharros, juegos y cine) me permite seguir cuerdo y despertarme con una sonrisa cuando suena el despertador. PD: esto no es cierto el 100 % de las veces.", "fr-FR": "Journaliste spécialisé dans la technologie, le divertissement et les jeux vidéo. Écrire sur ce qui me passionne (gadgets, jeux et films) me permet de rester sain d'esprit et de me réveiller avec le sourire aux lèvres quand le réveil sonne. PS : cela n'est pas vrai 100 % du temps.", "it-IT": "Giornalista specializzato in tecnologia, intrattenimento e videogiochi. Scrivere di ciò che mi appassiona (gadget, giochi e film) mi permette di mantenere la sanità mentale e di svegliarmi con un sorriso sul viso quando suona la sveglia. PS: questo non è vero al 100% del tempo.", "ja-JP": "", "nl-NL": "", "pl-PL": "", "pt-BR": "Jornalista especializado em tecnologia, entretenimento e videogames. Escrever sobre o que me apaixona (gadgets, jogos e filmes) me permite manter a sanidade e acordar com um sorriso no rosto quando o despertador toca. PS: isso não é verdade 100% do tempo.", "social": { "email": "chemacs91@gmail.com", "facebook": "", "twitter": "https://twitter.com/chematopetazo", "linkedin": "" } } View all posts by Chema Carvajal Sarabia