Les rumeurs étaient vraies. Il y a quelques jours, OpenAI a officiellement présenté « Project Strawberry », qui s’est avéré être une nouvelle version de son modèle de langage GPT-4o. « Il y a un nouveau modèle GPT-4o dans ChatGPT depuis la semaine dernière », a annoncé la société dans un tweet publié lundi. « Nous espérons que vous l’apprécierez et, si ce n’est pas encore fait, jetez-y un coup d’œil : nous pensons que vous l’aimerez ». Cependant, OpenAI n’a donné aucun détail sur les nouveautés apportées par ce modèle.
Dans une réponse à un autre tweet, OpenAI a précisé que le nouveau modèle GPT-4o est disponible à la fois pour les utilisateurs abonnés (ChatGPT Plus) et pour ceux qui utilisent la version gratuite, bien qu’avec des limitations sur le nombre de messages. De plus, la société a confirmé que le nouveau GPT-4o n’est pas le même que le GPT-4o-2024-08-06, lancé la semaine dernière.
Avant l’annonce officielle, plusieurs utilisateurs de ChatGPT ont déjà remarqué des différences dans le comportement du chatbot. Selon un rapport de VentureBeat, certains utilisateurs ont remarqué que le modèle fonctionnait de manière plus efficace et que les capacités de génération d’images natives semblaient avoir été activées. D’autres ont souligné une amélioration du raisonnement multi-étapes, une technique qui décompose les problèmes complexes en étapes plus petites et gérables.

Cependant, OpenAI a démenti qu’il s’agissait d’une amélioration du raisonnement en plusieurs étapes . Au lieu de cela, la société a décrit la mise à jour comme une série de « corrections d’erreurs et d’améliorations de performances » préférées par les utilisateurs de ChatGPT, selon les résultats de plusieurs expériences et commentaires qualitatifs. Malgré cela, OpenAI a admis qu’il est encore difficile de communiquer de manière précise le comportement du nouveau modèle.
Malgré le manque de clarté sur les améliorations exactes, le nouveau modèle, appelé ChatGPT-4o-latest, a fait ses preuves. Dans les tests réalisés par Chatbot Arena, ce modèle s’est classé premier, dépassant ses concurrents, tels que Gemini 1.5 de Google, avec un score élevé dans des domaines techniques tels que le codage, le suivi des instructions et la résolution de questions difficiles.