Notebookcheck Logo

Google introduit Gemini 2.5 Flash Image "nano-banane" avec une plus grande cohérence d'édition

Le modèle "nano-banane" de Google DeepMind permet d'éditer des images avec précision (Source de l'image : Gemini)
Le modèle "nano-banane" de Google DeepMind permet d'éditer des images avec précision (Source de l'image : Gemini)
La nouvelle image Flash Gemini 2.5 de Google DeepMind, surnommée "nano-banane", promet un contrôle plus fin de l'édition d'images par l'IA. Il assure la cohérence des personnages d'une scène à l'autre, permet des modifications en plusieurs tours et mélange les images avec des instructions en langage naturel, tout en ajoutant des filigranes visibles et invisibles à des fins de sécurité.

Google DeepMind lance sur https://blog.google/intl/en-mena/product-updates/explore-get-answers/nano-banana-image-editing-in-gemini-just-got-a-major-upgrade/ Gemini 2.5 Flash Image, également appelée "nano-banane", pour l'application Gemini et pour les développeurs via l'API Gemini, Google AI Studio et Vertex AI. Cette mise à jour répond à une plainte fréquente concernant les outils d'image de l'IA : les petites modifications qui finissent par changer l'ensemble de l'image. Google décrit cette version comme une amélioration de la qualité et du contrôle par rapport aux versions précédentes.

La principale caractéristique est la cohérence des personnages. Vous pouvez faire en sorte qu'une personne, un animal de compagnie ou un produit conserve la même apparence dans différentes scènes, même si vous changez de tenue, de coiffure, de période ou de décor. Le modèle peut également combiner plusieurs images en une seule, apporter des modifications spécifiques à l'aide d'instructions en langage naturel et utiliser la connaissance du monde de Gemini lors de la création et de l'édition d'images.

Vous pouvez utiliser cet outil pour placer le même personnage dans différents décors, présenter un produit sous différents angles ou assurer la cohérence des images de marque d'une campagne à l'autre. L'édition multi-tours vous permet de continuer à apporter des modifications, comme l'ajout de meubles et de décors dans une pièce pour tester des idées. Vous pouvez également mélanger des dessins, ajouter un motif d'une image à un objet d'une autre image ou fusionner une personne et un animal de compagnie dans une nouvelle scène.

Les prix sont transparents pour les développeurs : Gemini 2.5 Flash Image coûte 30 dollars par million de jetons de sortie. Chaque image compte pour 1 290 jetons de sortie, soit environ 0,039 $ par image. Les autres modalités d'entrée et de sortie suivent la tarification standard de Gemini 2.5 Flash.

Pour la sécurité, les images générées comprennent une marque AI visible et un filigrane numérique SynthID invisible. Google précise que SynthID peut encore être détecté après des modifications courantes, ce qui devrait permettre de vérifier l'origine des images, les médias synthétiques étant de plus en plus difficiles à reconnaître.

Selon Google, les premiers aperçus indiquent qu'il s'agit là d'un modèle d'édition d'images de premier plan. L'édition intégrée de l'application Gemini permet désormais de conserver les détails subtils de vos photos. Vous pouvez télécharger une photo, demander des modifications, combiner des images avec votre animal de compagnie, changer d'arrière-plan pour essayer un nouveau fond d'écran ou vous placer dans différentes scènes. Vous pouvez également utiliser l'image modifiée dans Gemini pour créer une courte vidéo.

Source(s)

Google (en anglais)

Please share our article, every link counts!
Mail Logo
> Revues et rapports de ordinateurs portatifs et smartphones, ordiphones > Archives des nouvelles 2025 08 > Google introduit Gemini 2.5 Flash Image "nano-banane" avec une plus grande cohérence d'édition
Nathan Ali, 2025-08-28 (Update: 2025-08-28)