Nvidia a eu hier une présentation spéciale. Brève, mais avec beaucoup de fanfare, ils ont fait une présentation spéciale pour des médias spécialisés en technologie très sélectionnés, présentant leur nouvelle technologie de mise à l’échelle : le DLSS 5. Tout le monde l’attendait avec grand intérêt car, avec ses défauts, le DLSS est un excellent outil. Il permet à des ordinateurs avec des capacités inférieures de faire tourner des jeux vidéo de pointe avec des résolutions supérieures à celles qu’ils pourraient normalement gérer avec des compromis minimes.
Le problème, c’est que le DLSS 5 n’a pas été cela. Ce qu’ils ont présenté est quelque chose de très différent du DLSS 4.5 et qui, de manière pratiquement universelle, a été détesté pour ses résultats. Mais pourquoi cela a-t-il été le cas ? Pour cela, nous devons comprendre ce qu’est et ce que n’est pas le DLSS. Et ce qu’ils essaient de nous vendre.
Qu’est-ce que le DLSS ?
Le DLSS, Deep Learning Super Sampling ou Superéchantillonnage par Apprentissage Profond, est une technologie qu’Nvidia a lancée en septembre 2018 comme caractéristique clé des GPU de la série GeForce RTX 20. Sa plus grande contribution était la capacité, grâce à l’apprentissage profond, d’élever des images de résolution inférieure à une résolution plus élevée sans perdre de fidélité ni de qualité graphique. Cela permettait d’augmenter les configurations graphiques et les FPS, en pouvant établir une résolution relativement basse avec laquelle le système se sentait à l’aise, l’élevant jusqu’à la résolution de la télévision ou du moniteur que nous utilisons.
Chaque nouvelle itération a introduit de nouveaux éléments. La 2.0 a introduit son propre antialiasing, ce qui adoucissait les bords dentelés de la première itération. La 3.0 a introduit la capacité d’inventer des images entre les images existantes pour gagner en fluidité dans l’image. Et la 4.0 a réduit à la fois l’utilisation de la mémoire et a mis en avant le détail de la lumière, notamment grâce à l’utilisation du ray tracing.
Bien que le DLSS présente des avantages évidents, en permettant à des ordinateurs relativement modestes de faire tourner des jeux actuels, il a également quelques inconvénients qui ne peuvent pas être ignorés. La génération de frames provoque un input lag, ce qui signifie que les commandes que nous donnons à la manette mettent un certain nombre de frames à se traduire en images, ce qui peut être fatal tant pour les jeux compétitifs que pour ceux qui nécessitent des réflexes ou de la précision. Et parce que le DLSS est capable de faire un très bon travail pour faire tourner le jeu, de nombreux développeurs ont cessé d’optimiser efficacement leurs jeux, comptant sur le DLSS ou d’autres formes de technologies de mise à l’échelle pour faire le travail à leur place.
C’est pourquoi il y avait un grand enthousiasme à savoir ce que la nouvelle version de DLSS apporterait. Chaque nouvelle version a amélioré la précédente, même si à partir de la 3.0, il y a eu quelques problèmes qui n’ont peut-être pas été discutés avec le détail qu’ils méritent. Et maintenant, lors de la présentation de la 5.0, les gens ont explosé.
Le désastre de DLSS 5
Nvidia a présenté le DLSS 5 avec une série de vidéos et d’explications qui peuvent se résumer au fait que la nouveauté du DLSS est qu’il est moins efficace, plus exigeant en ressources et que sa contribution consiste à ajouter un filtre d’IA générative sur les jeux. Bien qu’ils aient couru pour affirmer que les développeurs gardent le contrôle sur leurs images, ce n’est ni ce qui a été vu dans la vidéo de présentation ni ce qui nous a été vendu : le DLSS 5 change complètement les scènes, nous faisant jouer à un jeu très différent. Et pour la grande majorité du public, un jeu beaucoup plus moche.
Ce qui est le plus évident, ce sont les visages. En présentant sa technologie avec Resident Evil Requiem, Hogwarts Legacy, Starfield et EA FC 26, entre autres,si quelque chose a vraiment marqué toute la présentation, c’est qu’en activant le DLSS 5, les personnages semblaient différents. Cela modifiait leurs traits physiques, réinterprétait leur apparence et offrait une version supposément hyperréaliste, mais qui ne l’est pas.
L’hyperréalisme est une forme d’art très spécifique. C’est une recréation méticuleuse d’une photo ou d’une scène de la réalité à laquelle on ajoute des détails inexistants dans la réalité pour mettre en valeur les qualités narratives de celle-ci. L’hyperréalisme est, par définition, non réaliste : il ne cherche pas à reproduire la réalité, mais à extraire ce qui est caché dans la réalité, trahissant les petits détails de celle-ci. Mais le DLSS 5 n’est pas cela. Le DLSS 5 est une couche d’IA générative qui fait une approximation basée sur des algorithmes pour modifier les images selon ce qui est, essentiellement, un calcul aléatoire : il n’y a pas d’intention derrière les changements. Il ne met pas en valeur ce qui est caché à travers sa reproduction réelle, ni ne se base sur quoi que ce soit qui existe dans la réalité ; ce n’est pas hyperréaliste, c’est juste moche.
C’est pourquoi tous les visages semblent identiques et sont, très clairement, des visages générés par l’IA. Parce qu’elle a des biais. Parce qu’elle ne cherche pas à mettre en valeur ce qui existe déjà. Elle transforme toutes les femmes en modèles avec un visage infantilisant et tous les hommes en sujets avec des os marqués et des muscles définis. Si quelqu’un a la peau, les cheveux ou les yeux foncés, elle les éclaircit, et si un homme est jeune ou une femme adulte, elle les vieillit ou les rajeunit en raison de ses biais. Parce qu’elle n’interprète pas et ne comprend pas. Elle applique seulement les biais qui lui ont été donnés.
C’est pourquoi ce n’est pas mieux quand nous parlons des effets d’éclairage ou des décors, quelque chose que certaines personnes ont davantage défendu. L’éclairage manque d’ombrage et n’est pas cohérent, chaque élément de la scène semble éclairé par son propre projecteur LED, et au lieu d’être réaliste, cela semble autre chose : comme filmé dans un studio photo.
C’est pourquoi cela produit l’effet de vallée dérangeante et pourquoi il a eu une réception si négative. Il n’y a rien ici qui soit attrayant, tape-à-l’œil ou intéressant. Les visages sont étranges, identiques les uns aux autres ; les scènes sont antinaturelles, comme des maquettes très, très détaillées filmées dans un studio. Mais en plus, ce n’est même pas cohérent. Le visage de Grace Ashcroft, protagoniste de Resident Evil Requiem, apparaît trois fois pendant la présentation, et les trois fois c’est un visage différent lorsque le DLSS 5 est activé. Lorsqu’il n’est pas activé, Grace Ashcroft n’a qu’un seul visage. Celui de Grace Ashcroft.
Une terrible réception
Bien que Nvidia l’ait présenté avec tout le battage possible, même en invitant Digital Foundry dans ses bureaux pour qu’ils publient en même temps une vidéo de quinze minutes louant la technologie —et même ainsi, ne pouvant éviter d’affirmer qu’elle ne faisait pas un bon travail avec les visages—, la réception a été désastreuse. Et tout le monde s’est mis à faire des efforts pour limiter les dégâts.
Selon Nvidia, ce n’est qu’un prototype, ils y travaillent et cela s’améliorera, car les artistes continueront à avoir le contrôle sur le résultat final. Ils pourront décider de l’agressivité du filtre. De plus, ce n’est pas vraiment avoir le contrôle, car ils ne pourront littéralement pas décider comment les changements sont effectués et dans quelle mesure, cela ne nous laisse qu’une incertitude. Pourquoi l’ont-ils présenté alors ? Si ce n’est qu’un prototype, si c’est mauvais, si les artistes auront plus de contrôle, s’ils savent tout cela, pourquoi l’ont-ils présenté ? Parce qu’ils pensaient que les gens allaient l’applaudir. Parce qu’Nvidia a des intérêts là-dedans.
Ils y ont pensé, en partie, parce que le DLSS a été célébré presque sans critique jusqu’à présent. C’est une technologie avec des inconvénients qui, plus souvent qu’autrement, méprise toute critique qui lui est faite. Cela leur a donné confiance pour lancer ce produit. Mais Nvidia, grâce à l’IA, est maintenant l’entreprise avec la plus grande valeur boursière au monde. Si quelqu’un a intérêt à introduire l’IA et à faire triompher l’IA dans tous les aspects de la vie, y compris le gaming, c’est Nvidia. Son entreprise et sa supériorité sur le reste de l’humanité en dépendent. C’est pourquoi cela ne devrait pas nous surprendre : nous leur avons donné sur un plateau la possibilité de faire ce qu’ils veulent et en plus, ils ont toutes les raisons de le faire.
Mais il est normal que les gens aient réagi de manière virulente contre le DLSS 5. Il fait que les jeux ont l’air pire, nécessite un investissement obscène —à ce jour, il fonctionne avec deux 5090, une seule dédiée au DLSS 5 ; mais Nvidia a aussi pensé à cela, pourquoi ne pas utiliser son service de jeu dans le cloud, Geforce NOW ?— et en plus, il salit une technologie qui plaisait à tout le monde. Mais c’est pourquoi nous devons être plus critiques. Et c’est pourquoi nous ne devons pas refuser d’écouter quand les autres parlent des problèmes potentiels d’une technologie ou d’une entreprise. Parce que le DLSS 5 est un désastre, mais c’est un désastre qui était prévisible.