Economy

Sora est une intelligence artificielle qui réalise des vidéos étrangement réalistes

L’IA générative entre dans sa prochaine étape de développement. Et bien plus vite que nous le pensions.

Jusqu’à récemment, la possibilité de créer des vidéos textuelles véritablement réalistes était encore considérée comme une possibilité lointaine. Mais ici, c'est déjà possible.

OpenAI, la société derrière ChatGPT, a dévoilé son nouvel algorithme Sora, qui peut « créer » une vidéo à partir d'une simple description textuelle.

« Sora est capable de créer des scènes complexes avec plusieurs participants, des types de mouvements spécifiques et des détails fins sur les objets et l'arrière-plan », a annoncé OpenAI dans un communiqué officiel.

n'importe lequel. Cette vidéo que vous voyez ci-dessous n'est pas réelle, mais a été entièrement créée par l'intelligence artificielle :

La société note également que le modèle peut comprendre comment « les choses existent dans le monde physique » ainsi que « interpréter avec précision n'importe quel décor et créer des personnages convaincants qui expriment des émotions vives ».

Le PDG d'OpenAI, Sam Altman, a également défié ses abonnés sur le réseau social X avec l'idée de présenter les capacités de Sora. Il a demandé des suggestions de vidéos aussi détaillées et détaillées que possible, et a reçu toutes sortes de suggestions en réponse.

« Moitié canard, moitié dragon volant contre un magnifique coucher de soleil avec un hamster portant un sac à dos rempli de matériel d'aventure », a écrit un utilisateur sur X. Voici le résultat :

Il y en a d'autres, cela semble bien plus réaliste.

Un autre utilisateur a écrit : « Tutoriel de cuisine de gnocchis faits maison animé par une grand-mère sur les réseaux sociaux, dans le contexte d'une cuisine de campagne de style toscan avec un éclairage cinématographique », et le résultat est plus qu'impressionnant.

Oui, cette grand-mère n'est pas une personne réelle, mais une image inventée, « dessinée » et animée par Sora.

La société note que Sora en est encore aux premiers stades de développement. Pour l’instant, l’algorithme ne sera pas accessible à tout le monde, en raison de préoccupations concernant le potentiel d’utilisation abusive de la technologie.

Au lieu de cela, un accès anticipé est accordé aux graphistes, aux créateurs de contenu et aux cinéastes qui ont besoin de donner leur avis.

Le modèle a la capacité de créer des vidéos d’une minute maximale et d’une résolution de 1080p. Il crée également des clips à partir de photos prêtes à l'emploi ou remplit les images manquantes dans des vidéos existantes.

Sora n'est certainement pas le premier modèle de ce type pour convertir une vidéo en texte, mais il semble être le plus performant à ce jour.

Ainsi, il est basé sur le chatbot ChatGPT et l'algorithme d'image en texte Dall-E 3 introduit en septembre dernier. Tout comme les deux autres programmes OpenAI AI, Sora est très basique.

L'utilisateur n'a qu'à décrire en quelques phrases le résultat qu'il souhaite obtenir et à choisir si la vidéo doit être dans un style réaliste ou animé.

Tout le reste est fait par Sora en quelques minutes, et les clips semblent dynamiques, fluides et surtout réalistes.

La création de ces vidéos peut prendre des heures ou des jours (et beaucoup d’argent) à une équipe professionnelle.

Cela suscite un certain nombre de craintes quant au fait que SORA et d’autres modèles similaires pourraient perturber un certain nombre de carrières et exacerber l’énorme problème de la propagation de la désinformation et des fausses nouvelles.

Il sera beaucoup plus facile d’inventer et de créer des événements, et l’espace en ligne sera rempli de contenus dans lesquels réalité et manipulation sont indiscernables.

Ce ne sont pas les stars qui l’ont inventé, mais les ordinateurs.  Et d'ailleurs, cela s'applique totalement à votre vie (les images sont également alimentées par l'IA – créées avec DALL-E via le navigateur Bing)

L'équipe OpenAI admet ouvertement qu'elle ne peut pas prédire toutes les utilisations potentielles de Sora. Ils affirment que les vidéos créées par leur générateur contiendront des filigranes et qu'ils travaillent avec différentes organisations pour trouver une réglementation appropriée.

Sora rejettera certainement toute demande de vidéos violentes ou sexuelles.

« Nous engagerons les politiciens, les éducateurs et les artistes du monde entier pour comprendre leurs préoccupations et identifier les cas d'utilisation positifs de cette nouvelle technologie », a déclaré OpenAI.

Ils admettent également que Sora fait encore beaucoup d'erreurs. Il lui est difficile de faire la distinction entre la gauche et la droite, entre la cause et l’effet. Autrement dit, nous pourrions voir un clip de quelqu'un prenant une bouchée d'un cookie, mais sans laisser de traces de dents sur le cookie.

Cependant, il est peu probable qu’OpenAI mette beaucoup de temps à résoudre ces problèmes.

En attendant, voyez ce que Sora peut faire maintenant. Et n'oublions pas qu'à partir de maintenant, la vidéo générée par l'IA ne fera que s'améliorer :

Beaumont-Lefebvre

"Food lover. Alcohol advocate. Problem solver. Coffee expert. Internet maven for hipsters."

Articles similaires

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Bouton retour en haut de la page
Fermer
Fermer