AMD se lance pleinement dans l'IA avec son premier LLM

AMD a présenté sa première série de grands modèles de langage (LLM) de 1 milliard de paramètres et en open source, appelée AMD OLMo, destinée à diverses applications et préentraînée sur les GPU Instinct MI250 de la société. Les LLM open source d’AMD visent à améliorer la position de l’entreprise dans l’industrie de l’IA et à permettre à ses clients (et à tout le monde) d’implanter ces modèles open source avec le matériel d’AMD.

En rendant publics les données, les poids, les recettes d’entraînement et le code, AMD vise à permettre aux développeurs non seulement […]

AMD a présenté sa première série de grands modèles de langage (LLM) de 1 milliard de paramètres et en open source, appelée AMD OLMo, destinée à diverses applications et préentraînée sur les GPU Instinct MI250 de la société.

Les LLM open source d’AMD visent à améliorer la position de l’entreprise dans l’industrie de l’IA et à permettre à ses clients (et à tout le monde) d’implanter ces modèles open source avec le matériel d’AMD.

En rendant publics les données, les poids, les recettes d’entraînement et le code, AMD vise à permettre aux développeurs non seulement de reproduire les modèles, mais aussi de s’en inspirer pour continuer à innover.

Au-delà de l’utilisation dans les centres de données, AMD a permis le déploiement local de modèles OLMo sur des PC AMD Ryzen AI équipés d’unités de traitement neuronal (NPUs), permettant aux développeurs de tirer parti des modèles d’IA sur des appareils personnels.

Tout ce que nous savons sur le LLM d’AMD

Les modèles AMD OLMo ont été entraînés sur un vaste ensemble de données de 1,3 billion de tokens sur 16 nœuds, chacun équipé de quatre GPU AMD Instinct MI250 (64 processeurs au total). La gamme de modèles OLMo d’AMD a été entraînée en trois étapes.

Dans les propres tests d’AMD, les modèles OLMo d’AMD ont montré des performances impressionnantes par rapport à des modèles open source de taille similaire, tels que TinyLlama-1.1B, MobiLlama-1B et OpenELM-1_1B dans des tests de référence standard pour les capacités de raisonnement général et de compréhension multitâche.

Le modèle SFT à deux phases a connu des améliorations significatives en termes de précision, avec une augmentation de 5,09 % des scores MMLU et de 15,32 % dans GSM8k, ce qui démontre l’impact de l’approche d’entraînement d’AMD.

Le modèle final AMD OLMo 1B SFT DPO a surpassé d’autres modèles de chat open source d’au moins 2,60 % en moyenne lors des tests comparatifs.

ChatGPT TÉLÉCHARGER

De plus, AMD a testé des évaluations d’IA responsables, telles que ToxiGen (qui mesure le langage toxique, où un score plus bas est meilleur), crows_pairs (qui évalue les biais) et TruthfulQA-mc2 (qui évalue la véracité des réponses). Et il a été constaté que les modèles OLMo d’AMD étaient à la hauteur de modèles similaires dans la gestion de tâches d’IA éthiques et responsables.

Author: Chema Carvajal Sarabia

{ "de-DE": "Journalist, spezialisiert auf Technologie, Unterhaltung und Videospiele. Über das zu schreiben, was mich begeistert (Gadgets, Spiele und Filme), ermöglicht es mir, bei Verstand zu bleiben und mit einem Lächeln im Gesicht aufzuwachen, wenn der Wecker klingelt. PS: Das stimmt nicht 100% der Zeit.", "en-US": "Journalist specialized in technology, entertainment and video games. Writing about what I'm passionate about (gadgets, games and movies) allows me to stay sane and wake up with a smile on my face when the alarm clock goes off. PS: this is not true 100% of the time.", "es-ES": "Content Manager - Periodista especializado en tecnología, entretenimiento y videojuegos. Escribir sobre lo que me apasiona (cacharros, juegos y cine) me permite seguir cuerdo y despertarme con una sonrisa cuando suena el despertador. PD: esto no es cierto el 100 % de las veces.", "fr-FR": "Journaliste spécialisé dans la technologie, le divertissement et les jeux vidéo. Écrire sur ce qui me passionne (gadgets, jeux et films) me permet de rester sain d'esprit et de me réveiller avec le sourire aux lèvres quand le réveil sonne. PS : cela n'est pas vrai 100 % du temps.", "it-IT": "Giornalista specializzato in tecnologia, intrattenimento e videogiochi. Scrivere di ciò che mi appassiona (gadget, giochi e film) mi permette di mantenere la sanità mentale e di svegliarmi con un sorriso sul viso quando suona la sveglia. PS: questo non è vero al 100% del tempo.", "ja-JP": "", "nl-NL": "", "pl-PL": "", "pt-BR": "Jornalista especializado em tecnologia, entretenimento e videogames. Escrever sobre o que me apaixona (gadgets, jogos e filmes) me permite manter a sanidade e acordar com um sorriso no rosto quando o despertador toca. PS: isso não é verdade 100% do tempo.", "social": { "email": "chemacs91@gmail.com", "facebook": "", "twitter": "https://twitter.com/chematopetazo", "linkedin": "" } }