Lors de sa première saison des ouragans, l’IA révolutionnaire Deepmind de Google n’a pas seulement égalé des décennies d’expérience humaine, mais a également surpassé les résultats de deux des modèles de superordinateurs les plus avancés au monde.
Alors que le Centre National des Ouragans et les agences de prévision météorologique mondiales traitent les données de vérification finales, la question n’est plus de savoir si l’IA peut faire des prévisions météorologiques, mais combien de temps les méthodes traditionnelles mettront à s’adapter ou à disparaître complètement.
Alors que la saison des ouragans de l’Atlantique 2025 touche à sa fin, les premières évaluations des performances des modèles révèlent un changement dans la fiabilité des prévisions qui pourrait redéfinir la météorologie.
L’IA peut résoudre de véritables défis technologiques et sauver des vies
Le Laboratoire Météorologique de Google DeepMind, qui a commencé à émettre des prévisions de cyclones tropicaux en juin, a largement surpassé les modèles traditionnels basés sur la physique utilisés par les agences météorologiques nationales.
Les météorologues et les chercheurs qui examinent les données préliminaires affirment que les résultats représentent le premier défi sérieux en décennies à la domination mondiale des systèmes de prévision météorologique numérique, comme le Système de Prévision Globale du Service Météorologique National des États-Unis.
Le climatologue de l’Université de Miami, Brian McNoldy, a analysé la précision des prévisions de 13 tempêtes nommées durant cette saison.
Sa comparaison préliminaire montre que le modèle d’IA de DeepMind a systématiquement produit des erreurs de position moyennes inférieures à celles du GFS des États-Unis sur des intervalles de prévision allant jusqu’à 5 jours. Selon ses calculs, l’erreur de suivi de DeepMind à 120 heures était en moyenne de 165 milles nautiques, contre 360 milles nautiques pour le GFS, ce qui représente une différence de plus du double.
Le contraste est particulièrement significatif si l’on prend en compte les approches techniques qui sous-tendent chaque système. Le GFS repose sur des équations physiques explicites qui simulent le mouvement atmosphérique en trois dimensions, et il s’exécute sur des superordinateurs à grande échelle de la NOAA avec des cycles fréquents d’assimilation des données.
Le système de DeepMind, en revanche, est un réseau de neurones entraîné avec des décennies de données météorologiques archivées, ce qui lui permet d’inférer des motifs atmosphériques de manière statistique plutôt qu’à partir de principes physiques de base. Son architecture peut fournir des prévisions en quelques minutes sur des clusters de GPU standard, éliminant ainsi le besoin d’une infrastructure informatique massive.
Le modèle de DeepMind a non seulement surpassé les résultats individuels du modèle GFS, mais il a également dépassé les prévisions officielles générées par des humains et les modèles de consensus comme TVCN et HCCA, qui combinent les résultats de plusieurs modèles pour réduire le biais.
Si l’on vérifie avec les statistiques finales du Centre National des Ouragans, ces résultats représenteraient la première fois qu’un système d’IA dépasse à la fois les prévisions automatisées et les prévisions de consensus humaines dans le bassin atlantique.
La performance exceptionnelle du système de DeepMind soulève des questions sur le rôle à long terme de la prévision numérique traditionnelle du temps. Les modèles basés sur la physique, comme le GFS, doivent intégrer des équations qui décrivent la dynamique des fluides, le transfert de radiation et la thermodynamique à des millions de points de la grille.
Ce processus nécessite une grande puissance de calcul et, souvent, introduit des erreurs d’arrondi numérique. En revanche, les modèles neuronaux basés sur des données déduisent la dynamique sous-jacente directement à partir de jeux de données de réanalyse globale, sans avoir besoin d’équations explicites.
Ces architectures appartiennent à une classe de méthodes d’IA connues sous le nom de « modèles génératifs profonds », capables d’apprendre des motifs de haute dimension. On pense que le cadre de DeepMind utilise des fonctions d’encodeur-décodeur optimisées pour la prédiction spatio-temporelle, ce qui lui permet de gérer à la fois le suivi et la prédiction de l’intensité au sein d’une seule architecture de réseau.
Durant cette saison des ouragans, il a également montré une performance fiable dans l’estimation des vitesses maximales du vent et des fluctuations de pression, des tâches que même les systèmes sophistiqués basés sur la physique continuent de gérer de manière incohérente.
En attendant, la performance du GFS cette année a déconcerté les météorologues. Bien que le modèle ait subi une importante mise à jour en 2019 avec le noyau dynamique Finite-Volume Cubed-Sphere (FV3), la transition semble avoir produit une régression plutôt qu’une amélioration.
Lowry et d’autres suggèrent que les lacunes dans les données d’observation, possiblement liées aux coupes budgétaires fédérales, pourraient avoir aggravé le problème, bien que cela reste une spéculation. Le Service météorologique national n’a pas encore publié son évaluation interne.