{"id":155007,"date":"2025-05-09T09:20:49","date_gmt":"2025-05-09T08:20:49","guid":{"rendered":"https:\/\/sftarticles.wpenginepowered.com\/es\/?p=354516"},"modified":"2025-06-11T19:59:03","modified_gmt":"2025-06-11T18:59:03","slug":"les-derniers-modeles-de-chatgpt-ne-cessent-detonner-est-ce-la-fin-de-lia","status":"publish","type":"post","link":"https:\/\/cms-articles.softonic.io\/fr\/les-derniers-modeles-de-chatgpt-ne-cessent-detonner-est-ce-la-fin-de-lia\/","title":{"rendered":"Les derniers mod\u00e8les de ChatGPT ne cessent d&#039;\u00e9tonner : est-ce la fin de l&#039;IA ?"},"content":{"rendered":"\n<p>L&#8217;intelligence artificielle (IA) continue de montrer des avanc\u00e9es sans pr\u00e9c\u00e9dent dans ses capacit\u00e9s et son raisonnement, bien que ces progr\u00e8s soient \u00e9galement accompagn\u00e9s d&#8217;un ph\u00e9nom\u00e8ne inqui\u00e9tant : l&#8217;augmentation des taux d&#8217;hallucination dans certains mod\u00e8les.<\/p>\n\n\n<p>En particulier,<strong> les mod\u00e8les les plus r\u00e9cents d&#8217;OpenAI, comme le o3<\/strong> et le o4-mini<strong>, ont enregistr\u00e9 des taux d&#8217;hallucination significativement \u00e9lev\u00e9s<\/strong>, ce qui contraste fortement avec les d\u00e9veloppements de concurrents comme Google, dont les mod\u00e8les Gemini maintiennent des taux inf\u00e9rieurs \u00e0 1%.<\/p>\n\n\n<figure class=\"wp-block-embed is-type-rich is-provider-twitter wp-block-embed-twitter\"><div class=\"wp-block-embed__wrapper\">\n<blockquote class=\"twitter-tweet\" data-width=\"550\" data-dnt=\"true\"><p lang=\"ja\" dir=\"ltr\">\u307f\u3066\u30fc\u3001\u3053\u306e Gemini \u306e\u30cf\u30eb\u30b7\u30cd\u30fc\u30b7\u30e7\u30f3\u7387\u3002\u751f\u6210 AI \u306f\u5618\u3064\u304f\u304b\u3089\u306a\u30fc\u3068\u60a9\u3093\u3067\u308b\u305d\u3053\u306e\u3042\u306a\u305f\u3001Gemini \u3092\u691c\u8a0e\u3057\u3066\u307f\u3066\u306f\uff1fw<a href=\"https:\/\/t.co\/KeIPCCMgwX\">https:\/\/t.co\/KeIPCCMgwX<\/a> <a href=\"https:\/\/t.co\/ohTlG4uEWv\">pic.twitter.com\/ohTlG4uEWv<\/a><\/p>&mdash; Kimihiko Kitase \u2668\ufe0f \u5317\u702c \u516c\u5f66 (@kkitase) <a href=\"https:\/\/twitter.com\/kkitase\/status\/1920382674411118929?ref_src=twsrc%5Etfw\">May 8, 2025<\/a><\/blockquote><script async src=\"https:\/\/platform.twitter.com\/widgets.js\" charset=\"utf-8\"><\/script>\n<\/div><\/figure>\n\n\n<h2 class=\"wp-block-heading\">Un test montre que le mod\u00e8le o3 d&#8217;OpenAI a un taux d&#8217;hallucinations de 6,8 %<\/h2>\n\n\n<p>Le benchmark \u00ab Hallucination Leaderboard \u00bb, r\u00e9cemment mis \u00e0 jour, r\u00e9v\u00e8le que certains des mod\u00e8les les plus avanc\u00e9s ont non seulement r\u00e9ussi \u00e0 obtenir un faible taux d&#8217;hallucinations, mais contredisent \u00e9galement l&#8217;id\u00e9e que plus le progr\u00e8s technologique est important, plus ces indices sont \u00e9lev\u00e9s.<\/p>\n\n\n<p>Par exemple, des mod\u00e8les comme Google Gemini-2.0-Flash-001 et Vectara Mockingbird-2-Echo ont montr\u00e9 des taux d&#8217;hallucination de 0,7 % et 0,9 %, respectivement, tandis que <strong>le mod\u00e8le o3 d&#8217;OpenAI pr\u00e9sente un taux alarmant de 6,8 % selon le professeur Ethan Mollick de Wharton.<\/strong><\/p>\n\n\n<p>Cette situation soul\u00e8ve un dilemme dans l&#8217;innovation de l&#8217;IA : les mod\u00e8les qui poss\u00e8dent de plus grandes capacit\u00e9s de raisonnement sont, ironiquement, ceux qui rencontrent des difficult\u00e9s significatives en mati\u00e8re de fiabilit\u00e9 et de pr\u00e9cision.<\/p>\n\n\n<figure class=\"wp-block-embed is-type-video is-provider-youtube wp-block-embed-youtube wp-embed-aspect-16-9 wp-has-aspect-ratio\"><div class=\"wp-block-embed__wrapper\">\n<iframe loading=\"lazy\" title=\"Why Large Language Models Hallucinate\" width=\"840\" height=\"473\" src=\"https:\/\/www.youtube.com\/embed\/cfqtFvWOfg0?feature=oembed\" frameborder=\"0\" allow=\"accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share\" referrerpolicy=\"strict-origin-when-cross-origin\" allowfullscreen><\/iframe>\n<\/div><\/figure>\n\n\n<p><strong>Bien qu&#8217;OpenAI ait \u00e9t\u00e9 pionni\u00e8re dans la cr\u00e9ation de technologies d&#8217;IA sophistiqu\u00e9es, le d\u00e9fi persiste \u00e0 \u00e9quilibrer performance et pr\u00e9cision.<\/strong> Alors que les entreprises rivalisent pour atteindre une intelligence artificielle g\u00e9n\u00e9rale (AGI), cette course a conduit \u00e0 des d\u00e9veloppements plus puissants, bien que la fiabilit\u00e9 reste un \u00e9l\u00e9ment critique encore \u00e0 r\u00e9soudre.<\/p>\n\n\n<p>OpenAI est conscient de ces probl\u00e8mes et travaille \u00e0 corriger les taux \u00e9lev\u00e9s d&#8217;hallucination dans ses syst\u00e8mes. <strong>Cette reconnaissance pourrait \u00eatre cl\u00e9 pour s&#8217;assurer que les avanc\u00e9es en capacit\u00e9s ne compromettent pas la qualit\u00e9<\/strong> de ses mod\u00e8les \u00e0 l&#8217;avenir, soulignant ainsi l&#8217;importance de la fiabilit\u00e9 dans l&#8217;\u00e9volution de l&#8217;IA g\u00e9n\u00e9rative.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>L&#8217;intelligence artificielle (IA) continue de montrer des avanc\u00e9es sans pr\u00e9c\u00e9dent dans ses capacit\u00e9s et son raisonnement, bien que ces progr\u00e8s aient \u00e9galement \u00e9t\u00e9 accompagn\u00e9s d&#8217;un ph\u00e9nom\u00e8ne inqui\u00e9tant : l&#8217;augmentation des taux d&#8217;hallucination dans certains mod\u00e8les. En particulier, les mod\u00e8les les plus r\u00e9cents d&#8217;OpenAI, comme le o3 et le o4-mini, ont enregistr\u00e9 des taux d&#8217;hallucination significativement \u00e9lev\u00e9s, ce qui contraste fortement avec les d\u00e9veloppements de concurrents comme Google, dont les mod\u00e8les Gemini maintiennent des taux inf\u00e9rieurs \u00e0 1%. Un test montre que le mod\u00e8le o3 d&#8217;OpenAI a un taux d&#8217;hallucinations de 6,8%. Le benchmark &#8216;Hallucination Leaderboard&#8217;, r\u00e9cemment mis \u00e0 jour, r\u00e9v\u00e8le que certains [&#8230;]<\/p>\n","protected":false},"author":9317,"featured_media":155008,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":"","wpcf-pageviews":0},"categories":[16761],"tags":[17093],"usertag":[],"vertical":[],"content-category":[17507],"class_list":["post-155007","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-news","tag-inteligencia-artificial","content-category-ia"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/cms-articles.softonic.io\/fr\/wp-json\/wp\/v2\/posts\/155007","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/cms-articles.softonic.io\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/cms-articles.softonic.io\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/cms-articles.softonic.io\/fr\/wp-json\/wp\/v2\/users\/9317"}],"replies":[{"embeddable":true,"href":"https:\/\/cms-articles.softonic.io\/fr\/wp-json\/wp\/v2\/comments?post=155007"}],"version-history":[{"count":1,"href":"https:\/\/cms-articles.softonic.io\/fr\/wp-json\/wp\/v2\/posts\/155007\/revisions"}],"predecessor-version":[{"id":156845,"href":"https:\/\/cms-articles.softonic.io\/fr\/wp-json\/wp\/v2\/posts\/155007\/revisions\/156845"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/cms-articles.softonic.io\/fr\/wp-json\/wp\/v2\/media\/155008"}],"wp:attachment":[{"href":"https:\/\/cms-articles.softonic.io\/fr\/wp-json\/wp\/v2\/media?parent=155007"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/cms-articles.softonic.io\/fr\/wp-json\/wp\/v2\/categories?post=155007"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/cms-articles.softonic.io\/fr\/wp-json\/wp\/v2\/tags?post=155007"},{"taxonomy":"usertag","embeddable":true,"href":"https:\/\/cms-articles.softonic.io\/fr\/wp-json\/wp\/v2\/usertag?post=155007"},{"taxonomy":"vertical","embeddable":true,"href":"https:\/\/cms-articles.softonic.io\/fr\/wp-json\/wp\/v2\/vertical?post=155007"},{"taxonomy":"content-category","embeddable":true,"href":"https:\/\/cms-articles.softonic.io\/fr\/wp-json\/wp\/v2\/content-category?post=155007"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}