Google DeepMind lance sur https://blog.google/intl/en-mena/product-updates/explore-get-answers/nano-banana-image-editing-in-gemini-just-got-a-major-upgrade/ Gemini 2.5 Flash Image, également appelée "nano-banane", pour l'application Gemini et pour les développeurs via l'API Gemini, Google AI Studio et Vertex AI. Cette mise à jour répond à une plainte fréquente concernant les outils d'image de l'IA : les petites modifications qui finissent par changer l'ensemble de l'image. Google décrit cette version comme une amélioration de la qualité et du contrôle par rapport aux versions précédentes.
La principale caractéristique est la cohérence des personnages. Vous pouvez faire en sorte qu'une personne, un animal de compagnie ou un produit conserve la même apparence dans différentes scènes, même si vous changez de tenue, de coiffure, de période ou de décor. Le modèle peut également combiner plusieurs images en une seule, apporter des modifications spécifiques à l'aide d'instructions en langage naturel et utiliser la connaissance du monde de Gemini lors de la création et de l'édition d'images.
Vous pouvez utiliser cet outil pour placer le même personnage dans différents décors, présenter un produit sous différents angles ou assurer la cohérence des images de marque d'une campagne à l'autre. L'édition multi-tours vous permet de continuer à apporter des modifications, comme l'ajout de meubles et de décors dans une pièce pour tester des idées. Vous pouvez également mélanger des dessins, ajouter un motif d'une image à un objet d'une autre image ou fusionner une personne et un animal de compagnie dans une nouvelle scène.
Les prix sont transparents pour les développeurs : Gemini 2.5 Flash Image coûte 30 dollars par million de jetons de sortie. Chaque image compte pour 1 290 jetons de sortie, soit environ 0,039 $ par image. Les autres modalités d'entrée et de sortie suivent la tarification standard de Gemini 2.5 Flash.
Pour la sécurité, les images générées comprennent une marque AI visible et un filigrane numérique SynthID invisible. Google précise que SynthID peut encore être détecté après des modifications courantes, ce qui devrait permettre de vérifier l'origine des images, les médias synthétiques étant de plus en plus difficiles à reconnaître.
Selon Google, les premiers aperçus indiquent qu'il s'agit là d'un modèle d'édition d'images de premier plan. L'édition intégrée de l'application Gemini permet désormais de conserver les détails subtils de vos photos. Vous pouvez télécharger une photo, demander des modifications, combiner des images avec votre animal de compagnie, changer d'arrière-plan pour essayer un nouveau fond d'écran ou vous placer dans différentes scènes. Vous pouvez également utiliser l'image modifiée dans Gemini pour créer une courte vidéo.
Source(s)
Google (en anglais)
Top 10
» Le Top 10 des PC portables multimédia
» Le Top 10 des PC portables de jeu
» Le Top 10 des PC portables de jeu légers
» Le Top 10 des ordinateurs portables bureautiques
» Le Top 10 des PC portables bureautiques premium/professionnels
» Le Top 10 des Stations de travail mobiles
» Le Top 10 des Ultraportables
» Le Top 10 des Ultrabooks
» Le Top 10 des Convertibles
» Le Top 10 des Tablettes
» Le Top 10 des Tablettes Windows
» Le Top 10 des Smartphones
» Le Top 10 des PC Portables á moins de 300 euros
» Le Top 10 des PC Portables á moins de 500 euros
» Le Top 25 des meilleurs écrans d'ordinateurs