OpenAI a officiellement dévoilé Sora 2, son dernier modèle phare de génération vidéo et audio, le positionnant comme une avancée majeure dans la création de contenu alimenté par l'IA. Le nouveau modèle offre une physique plus réaliste, une plus grande contrôlabilité et introduit des dialogues synchronisés et des effets sonores environnementaux, apportant un nouveau niveau d'immersion au contenu généré par l'IA. Sora 2 fait ses débuts en même temps qu'une nouvelle application sociale, Sora, qui vise à transformer la façon dont les gens interagissent avec les médias générés par l'IA. Le déploiement commence aujourd'hui, le 30 septembre 2025, aux États-Unis et au Canada.
OpenAI décrit la version originale de Sora (publié début 2024) comme une étape cruciale pour la vidéo générative, similaire à l'impact de GPT-1 sur le traitement du langage naturel. Sora 2, en revanche, est décrit comme atteignant un "moment GPT-3.5" pour la vidéo, établissant une nouvelle barre pour la compréhension par l'IA de la réalité physique et de la simulation du monde.
Selon l'OpenAI, Sora 2 représente un changement de cap dans la capacité de "simulation du monde". Alors que les systèmes précédents déformaient souvent la réalité pour satisfaire une demande, Sora 2 est conçu pour modéliser des résultats plausibles - y compris les ratés et les rebonds dans une scène de basket-ball - plutôt que de téléporter des objets pour les faire correspondre au script. Le modèle peut désormais restituer des scénarios qui ont toujours été difficiles à réaliser pour les systèmes précédents, tels que des routines de gymnastique de niveau olympique, des saltos arrière précis sur l'eau qui modélisent la dynamique de la flottabilité et de la rigidité, ou même un triple axel pendant qu'un chat s'accroche pour survivre. Ces progrès s'étendent également à l'audio du système : Sora 2 génère des ambiances sonores, des paroles synchronisées et des effets sonores qui s'alignent parfaitement sur l'action à l'écran, ajoutant ainsi une nouvelle dimension de réalisme.
L'une des fonctions phares de Sora 2 est la possibilité de "se télécharger soi-même" Les utilisateurs peuvent enregistrer une courte vidéo et un échantillon audio, ce qui permet à Sora 2 de les insérer (ou d'insérer des amis, des animaux ou tout autre objet du monde réel) dans n'importe quelle scène générée, avec une représentation visuelle et vocale extrêmement précise.
Pour démontrer les capacités de Sora 2, OpenAI lance une nouvelle application iOS appelée Sora. Cette application permet aux utilisateurs de créer et de remixer de courtes vidéos, de découvrir le contenu de la communauté dans un flux personnalisable et de jouer dans des scènes générées par l'IA grâce à la fonction "cameos". Les caméos nécessitent un bref processus de vérification pour garantir le contrôle et le consentement de l'utilisateur, avec des options complètes de confidentialité et de suppression du contenu.
OpenAI positionne la nouvelle application Sora comme étant axée sur la création plutôt que sur l'engagement. Le flux par défaut donne la priorité aux personnes que vous suivez et aux contenus susceptibles d'inspirer vos propres créations ; l'entreprise précise qu'elle n'optimise pas le temps passé. Les comptes d'adolescents sont soumis à des limites de visionnage quotidiennes et à des autorisations plus strictes pour les caméos, tandis que les contrôles parentaux (via ChatGPT) permet de désactiver la personnalisation algorithmique ou de limiter le défilement infini. OpenAI renforce également la modération humaine pour lutter contre le harcèlement et les autres risques d'abus.
Top 10
» Le Top 10 des PC portables multimédia
» Le Top 10 des PC portables de jeu
» Le Top 10 des PC portables de jeu légers
» Le Top 10 des ordinateurs portables bureautiques
» Le Top 10 des PC portables bureautiques premium/professionnels
» Le Top 10 des Stations de travail mobiles
» Le Top 10 des Ultraportables
» Le Top 10 des Ultrabooks
» Le Top 10 des Convertibles
» Le Top 10 des Tablettes
» Le Top 10 des Tablettes Windows
» Le Top 10 des Smartphones
» Le Top 10 des PC Portables á moins de 300 euros
» Le Top 10 des PC Portables á moins de 500 euros
» Le Top 25 des meilleurs écrans d'ordinateurs
Sora 2 est lancé aujourd'hui aux États-Unis et au Canada, et il est prévu de l'étendre à d'autres régions. L'application est lancée sur invitation uniquement afin d'encourager l'utilisation collaborative entre amis. L'utilisation du modèle est initialement gratuite, avec des "limites généreuses", sous réserve des contraintes de calcul. Les utilisateurs de ChatGPT Pro peuvent accéder au modèle de haute qualité Sora 2 Pro d'abord via ChatGPT, avec une prise en charge dans l'application Sora à venir. OpenAI prévoit également de diffuser Sora 2 via l'API pour une intégration plus large. Le contenu généré avec Sora 1 Turbo restera accessible dans les bibliothèques des utilisateurs.
OpenAI considère Sora 2 comme une étape importante vers le développement de simulateurs de monde à usage général et, à terme, de la robotique avancée. L'entreprise considère que les améliorations apportées aux modèles d'intelligence artificielle natifs de la vidéo ouvrent la voie non seulement à des outils créatifs, mais aussi à des systèmes capables de mieux comprendre le monde physique, d'interagir avec lui et, en fin de compte, de fonctionner au sein de celui-ci.