Alors que la plupart des modèles vidéo d'IA peinent à assurer la continuité, Sora 2 comprend les causes et les effets de l'environnement. Les ombres se déplacent de manière réaliste. L'eau ondule lorsque quelque chose bouge près d'elle. Les reflets apparaissent dans le verre et les flaques d'eau, et non pas sous des angles aléatoires.
OpenAI décrit Sora 2 comme capable de générer des "scènes complexes avec plusieurs personnages, des mouvements spécifiques et des arrière-plans détaillés qui restent cohérents dans le temps" C'est vrai, même si le terme "cohérent" est encore très relatif dans ce monde.
Prompt 1 : Le duel de Central Park qui a échoué
Le premier test était délibérément ambitieux :
"Un après-midi paisible à Central Park, à New York. Les touristes se promènent sous un doux soleil. Soudain, une personne vêtue d'une robe active un bâton d'énergie lumineux et exhorte les gens à se mettre à l'abri. Une autre personne, vêtue d'une robe sombre, émerge des arbres et tient une arme rouge. La foule se disperse tandis que les deux personnages s'affrontent dans des mouvements élégants et dansants, des arcs de lumière se reflétant sur l'eau à proximité. La caméra tourne autour d'eux en permanence, tandis que les feuilles d'automne tourbillonnent dans l'air"
Le résultat était visuellement saisissant : tons dorés et doux, rotation fluide de la caméra et reflets convaincants. Mais le chaos est arrivé. Les bâtons lumineux (sabres laser) ont vacillé, se sont déformés et ont pris des formes étranges. Les corps des combattants perdaient l'équilibre, les membres s'entrechoquaient comme des polygones fantomatiques sortis d'un jeu vidéo des années 90. La chorégraphie a dérivé vers une danse interprétative surréaliste plutôt que vers un combat cinématographique.
Et ce défaut n'est pas propre à mon test. OpenAI a reconnu que Sora 2 "a des difficultés avec les combats humanoïdes soutenus et physiquement plausibles ou les chorégraphies d'armes", une limitation qui devient rapidement évidente dès que les armes commencent à bouger.
Néanmoins, le monde environnant semble suffisamment réel pour que l'on puisse presque le pardonner. La scène semble cinématographique, même si l'action ne l'est pas.
Top 10
» Le Top 10 des PC portables multimédia
» Le Top 10 des PC portables de jeu
» Le Top 10 des PC portables de jeu légers
» Le Top 10 des ordinateurs portables bureautiques
» Le Top 10 des PC portables bureautiques premium/professionnels
» Le Top 10 des Stations de travail mobiles
» Le Top 10 des Ultraportables
» Le Top 10 des Ultrabooks
» Le Top 10 des Convertibles
» Le Top 10 des Tablettes
» Le Top 10 des Tablettes Windows
» Le Top 10 des Smartphones
» Le Top 10 des PC Portables á moins de 300 euros
» Le Top 10 des PC Portables á moins de 500 euros
» Le Top 25 des meilleurs écrans d'ordinateurs
Prompt 2 : La rédemption du duel de Central Park
Sora 2 a plutôt bien répondu à l'énoncé suivant.
"Un après-midi paisible dans le Central Park de New York. Les touristes se promènent et prennent des photos sous la lumière douce et dorée du soleil. Soudain, un personnage en robe claire active un bâton d'énergie lumineux et appelle d'urgence les gens à se mettre à l'abri. Un autre personnage en robe sombre surgit des arbres, tenant une arme à énergie rouge. La foule se disperse tandis que les deux personnages entament un duel précis et cinématographique - des mouvements élégants et dansants, des arcs de lumière se reflétant sur l'eau à proximité. La caméra tourne autour d'eux en un seul plan continu, tandis que les feuilles d'automne tourbillonnent dans l'air. Aucun contact ou blessure n'est montré - seulement une chorégraphie habile et un mouvement dynamique."
Cette fois, cela a réellement fonctionné. Les mouvements ont l'air ancrés, fluides et étonnamment humains, avec un coup final qui coule si naturellement qu'il est facile d'oublier que vous regardez quelque chose généré par l'IA.
Ébauche 3 : Oiseaux et lions au point d'eau
Pour un test plus calme, je me suis tourné vers la faune. L'énoncé :
"Créez une scène de vie sauvage dans laquelle des oiseaux et des lions s'abreuvent naturellement à un point d'eau. Chaque animal doit bouger de manière réaliste et la scène doit être hyperréaliste."
Ici, Sora 2 était dans son élément. Les oiseaux volaient et plongeaient avec des mouvements d'ailes crédibles. La lumière du soleil scintille à la surface de l'eau et les reflets réagissent naturellement lorsque les animaux changent de position. Les textures - fourrure, plumes, boue ondulante - étaient proches de la qualité d'un documentaire sur la nature.
Pourtant, les bizarreries du modèle se sont encore glissées dans le décor. L'un des lions s'est retrouvé maladroitement placé au bord de la boue, semblant boire directement dans la terre plutôt que dans l'eau. C'est un détail mineur mais révélateur : Sora 2 réussit à reproduire la scène dans son ensemble, mais perd parfois de vue l'interaction entre l'objet et la surface.
Malgré tout, il s'agit là du résultat le plus convaincant, et d'un indice de la véritable force de Sora 2 : le réalisme de l'environnement.
Prompt 4 : La poursuite futuriste sur les toits
Pour le test final, j'ai poussé le mouvement, l'éclairage et l'atmosphère à leurs limites :
"Un paysage urbain futuriste tentaculaire à l'aube. Un coursier cyberpunk vêtu d'une veste sombre sprinte sur les toits, portant une mallette de données lumineuse. Un drone qui le poursuit se faufile entre les antennes et les bouches d'aération, les propulseurs s'allumant en bleu.
La caméra suit le coureur de l'arrière et de la droite, à la main, alors qu'il franchit une brèche. Le drone est rattrapé en plein vol ; le flou de lentille et le flou de mouvement complètent la scène"
Le résultat est stupéfiant et étonnamment cinématographique.
L'éclairage a été déterminant : le lever du soleil qui scintille sur les tours en verre, les reflets sur les surfaces métalliques et le subtil lens flare pendant le saut. Les mouvements étaient fluides et pesants. La poursuite par drone introduit une véritable tension, tandis que la faible profondeur de champ imite celle d'une caméra 35 mm.
C'est Sora 2 qui fait feu de tout bois : complexe, cohérent et crédible. S'il s'agissait d'un teaser pour un jeu ou un film, la plupart des spectateurs ne soupçonneraient pas l'implication de l'IA au premier coup d'œil.
La belle imprévisibilité de Sora 2
Au fil de ces tests, une vérité s'est imposée : Sora 2 est constamment incohérent. Parfois, il réussit tout ce qu'il entreprend. Other times, it births something so bizarre that you can’t stop laughing. Cette imprévisibilité fait partie de son charme.
Sur Reddit, un utilisateur l'a parfaitement résumé :
"Sora 2 vous donne soit l'énergie de Pixar, soit l'énergie de la fièvre, pas d'entre-deux."
- r/AIGuild
Le modèle déforme parfois les objets, change de couleur en plein milieu de la scène ou interprète mal les instructions de manière délicieusement absurde. L'invite "deux animaux en peluche marchant côte à côte" a déjà produit des créatures qui ressemblaient à moitié à des ours en peluche et à moitié à des ballons gonflables. Ce n'est pas exact, mais c'est mémorable.
Ce chaos peut être un handicap pour les professionnels qui ont besoin de fiabilité, mais pour l'expérimentation créative, c'est de l'or en barre. Sora 2 se comporte parfois plus comme un collaborateur à l'imagination débordante que comme une machine prévisible.
Réalisme contre réalité : Comprendre les forces de Sora 2
Lorsque Sora 2 fonctionne, on a l'impression qu'il est magique. Mais ce n'est pas de la magie : c'est une machine qui interprète vos mots grâce à l'apprentissage des probabilités et des formes visuelles. Il s'appuie sur le contexte, et non sur la précision. Donnez-lui un sens aigu du lieu (direction de l'éclairage, mouvement de caméra, tonalité) et il remplira le reste de manière convaincante. Demandez-lui une chorégraphie basée sur la précision ou une interaction motrice fine, et il s'essoufflera.
Ce schéma correspond à ce que d'autres ont observé sur Reddit et dans les groupes de test Discord. Les créateurs notent que les actions humaines les plus simples (marcher, regarder, faire des gestes) sont crédibles, mais que les séquences complexes (se battre, s'étreindre, jouer d'un instrument) s'effondrent rapidement. Cela suggère que la modélisation physique d'OpenAI traite encore le corps humain comme un ensemble de groupes de mouvements indépendants plutôt que comme une unité unique. C'est assez réaliste pendant quelques secondes, puis l'entropie prend le dessus.
Un contexte plus large : La créativité à l'ère des algorithmes
Ce qui rend Sora 2 fascinant, ce n'est pas seulement son progrès technique... C'est le changement culturel qu'il représente.
Pendant des décennies, la création vidéo était coûteuse, prenait du temps et était limitée par l'accès au matériel ou au talent. Aujourd'hui, quiconque a une bonne idée et un paragraphe de texte peut produire quelque chose de visuellement convaincant.
Cette démocratisation est puissante, mais elle brouille aussi la paternité de la création. Lorsqu'un modèle "imagine" une partie de la scène de manière incorrecte, s'agit-il d'un échec ou d'une interprétation ?
Dans mon duel à Central Park, les armes déformées ont gâché le réalisme mais ont introduit une qualité onirique. Ce n'était pas ce que je voulais, mais cela laissait entrevoir une esthétique surréaliste et picturale, plus proche du cinéma expérimental que de l'action hollywoodienne.
C'est peut-être là la leçon la plus profonde : La réalisation d'un film d'IA n'est pas une question de contrôle. Il s'agit de négocier.
Limites techniques et éthiques
OpenAI est consciente de l'enthousiasme et du malaise que suscite cet outil. L'entreprise continue à en limiter l'accès, invoquant les risques d'utilisation abusive et la nécessité de protéger le contenu.
Le gouvernement japonais a récemment demandé à OpenAI de veiller à ce que Sora 2 n'enfreigne pas les droits d'auteur des anime et des mangas, ce qui rappelle que la portée créative de l'IA s'accompagne de conséquences juridiques concrètes. Il y a aussi la question de l'originalité. Les résultats de Sora 2 peuvent sembler nouveaux, mais ils sont formés à partir d'un grand nombre de médias existants. Plus le jeu devient réaliste, plus il est difficile de distinguer l'hommage de la reproduction. C'est pourquoi, malgré ses merveilles, Sora 2 se situe à la croisée des chemins entre l'art et l'automatisation.
Les problèmes audio sont très visibles
La plupart des clips de Sora 2 ont encore des problèmes de son. Alors que les images sont souvent époustouflantes, le son a tendance à être médiocre, plat, étouffé ou peu naturel. La Sora 2 essaie de générer des bruits ambiants, des effets et des dialogues en même temps, mais elle ne parvient pas à les séparer comme le ferait un véritable concepteur sonore. Le résultat est un son surcompressé, métallique ou étrangement équilibré qui correspond rarement à la qualité cinématographique des images. Pour l'instant, le meilleur moyen de faire sonner les vidéos de Sora 2 est d'ajouter le son en post-production, en superposant les ambiances, les effets et la musique du monde réel pour donner vie à la scène.
Un aperçu du futur, rendu imparfait
Après plusieurs jours de tests, Sora 2 m'a impressionné, amusé et quelque peu déstabilisé. C'est à la fois une merveille d'ingénierie et un rappel que le mouvement humain, l'émotion et la narration restent d'une complexité unique.
Points forts : les environnements, l'éclairage, l'atmosphère, les mouvements dynamiques et le réalisme des courtes séquences.
Points faibles : Le contact humain, la physique des armes, les distorsions surréalistes occasionnelles.
Sora 2 est-il vraiment à la hauteur ?
Sora 2 est un pas décent vers la réalisation de films assistés par l'IA... Mais ne vous attendez pas encore à un réalisme parfait. De plus, les vrais cinéastes restent les vrais artistes dont nous avons besoin... Sora 2 a encore du mal à déplacer l'antimoine d'un être humain, ainsi que des animaux, de manière naturelle.
Comme l'a dit un Redditor :
"Sora 2, c'est comme regarder le futur apprendre à rêver."
- r/OpenAI
Ce résumé est tout à fait approprié. Sora 2 ne se contente pas de simuler la réalité... Il l'expérimente. Et pour ceux d'entre nous qui observent le déroulement de cette expérience, c'est à la fois passionnant et profondément humain... Mais avec une qualité audio extrêmement mauvaise.





