
Guide : Voici comment générer gratuitement des images sur votre PC
CheckMag
Vous souhaitez générer des images sur votre PC sans dépendre de services en ligne ? Ce guide vous aide à configurer des outils gratuits et open-source pour un contrôle créatif total sans aucun abonnement.Rohith Bhaskar, ✓ Rohith Bhaskar (traduit par Ninh Duy) Publié 🇺🇸 🇵🇱 ...
Les outils de génération d'images sont de plus en plus capables de créer des images photoréalistes de pointe. Malheureusement, la plupart d'entre eux sont bloqués en ligne derrière un mur payant. Et si je vous disais qu'il existe un moyen de les utiliser localement avec beaucoup plus de souplesse que les outils en ligne ?
Conditions préalables
1) Une carte graphique Nvidia avec un minimum de 8 Go de VRAM. (RTX 3060 ou mieux recommandée )
2) Un minimum de 16 Go de mémoire système DDR4. (Plus vous en avez, mieux c'est )
3) Windows 10/11 (64-bit OS nécessaire )
4) Au moins 100-150 Go d'espace libre sur le disque dur pour tout configurer et télécharger les modèles.
5) Une connexion internet pour la configuration initiale. (Nécessaire uniquement pour télécharger et installer les interfaces utilisateur et les modèles d'images )
Remarque : les GPU AMD ou Intel ne sont pas officiellement pris en charge par la plupart des interfaces utilisateur et nécessitent des solutions de contournement pour fonctionner.
La première chose à faire est de vous assurer que vous utilisez les derniers pilotes studio de Nvidia pour votre carte graphique. Si vous n'êtes pas sûr du GPU Nvidia que vous avez installé, faites un clic droit n'importe où sur le bureau et cliquez sur "Panneau de configuration NVIDIA" dans le menu contextuel.
Top 10
» Le Top 10 des PC portables multimédia
» Le Top 10 des PC portables de jeu
» Le Top 10 des PC portables de jeu légers
» Le Top 10 des ordinateurs portables bureautiques
» Le Top 10 des PC portables bureautiques premium/professionnels
» Le Top 10 des Stations de travail mobiles
» Le Top 10 des Ultraportables
» Le Top 10 des Ultrabooks
» Le Top 10 des Convertibles
» Le Top 10 des Tablettes
» Le Top 10 des Tablettes Windows
» Le Top 10 des Smartphones
» Le Top 10 des PC Portables á moins de 300 euros
» Le Top 10 des PC Portables á moins de 500 euros
» Le Top 25 des meilleurs écrans d'ordinateurs
Cherchez maintenant "Informations sur le système" tout en bas de la page qui s'ouvre. Vous devriez voir le nom de votre carte graphique sur la gauche, ainsi que d'autres informations si nécessaire.
Ouvrez le dépôt officiel de pilotes de Nvidia icicherchez Nvidia Studio Drivers et cliquez sur Download. Une page s'ouvrira pour vous permettre de télécharger le dernier pilote. Il convient maintenant de vérifier si votre produit Nvidia est pris en charge par le pilote. Vous pouvez le faire en cliquant sur "Produits pris en charge" juste en dessous du bouton de téléchargement. Installez les pilotes et redémarrez votre PC.
Remarque : cette opération écrasera les pilotes Game Ready si vous les avez installés. Si votre système est principalement destiné aux jeux, il se peut que vous constatiez une baisse des performances dans les jeux.
C'est très bien ! La première étape est maintenant terminée. Nous pouvons maintenant passer aux choses amusantes, comme le téléchargement des interfaces utilisateur. Je vous recommande vivement de télécharger et d'installer Stability Matrix. Il s'agit d'un outil de maintenance tout-en-un qui prend en charge plusieurs interfaces utilisateur et les maintient automatiquement à jour. Il crée même des dossiers partagés pour les modèles et les résultats que vous pouvez consulter en un seul endroit.
Sur la page GitHub de https://github.com/LykosAI/StabilityMatrix?tab=readme-ov-file#%EF%B8%8F-one-click-install-and-update-for-stable-diffusion-web-ui-packagesfaites défiler la page jusqu'à la section readme et recherchez votre système d'exploitation. Stability Matrix propose également des téléchargements pour Linux et Mac. Pour les besoins de ce guide, nous utiliserons la version Windows.
Cliquez sur le bouton du système d'exploitation, et vous devriez être invité à télécharger un fichier .zip. Celui-ci doit être placé sur le disque où vous souhaitez installer Stability Matrix. Assurez-vous que vous disposez d'au moins 100 à 150 Go d'espace libre sur le disque. Il ne s'agit pas seulement d'installer Stability Matrix, mais aussi de télécharger les modèles requis, les encodeurs de texte et d'autres fichiers système. Ces fichiers s'accumulent rapidement.
Une fois le fichier téléchargé, décompressez-le et exécutez le fichier StabilityMatrix.exe situé dans le dossier extrait. Il devrait télécharger automatiquement tous les fichiers nécessaires et configurer l'interface pour vous.
Génial ! Nous disposons maintenant d'une interface pour télécharger et installer plusieurs interfaces utilisateur.
Il est maintenant temps de choisir l'interface que vous souhaitez utiliser. Un frontal est une interface utilisateur graphique (GUI) qui vous permet d'interagir avec les modèles d'images, de manipuler les paramètres et, plus important encore, de générer des images.
Voici une liste rapide des options proposées sur Stability Matrix.
1) WebUI Forge pour la diffusion de la stabilité
2) Stable Diffusion WebUI Forge - Classic
4) Foooocus
5) Fooocus - mashb1t's 1-Up Edition
7) SwarmUI
8) Cogstudio
10) RuinedFooocus
11) SD.Next
12) SDFX
13) InvokeAI
Personnellement, je vous recommande vivement d'utiliser ComfyUI. Il s'agit d'une application visuelle, basée sur des nœuds, qui peut sembler un peu intimidante au début mais qui est étonnamment facile à prendre en main. N'oubliez pas que Stability Matrix peut gérer plusieurs frontends, vous n'êtes donc pas obligé de vous limiter à un seul. Vous pouvez expérimenter et trouver celui qui vous convient le mieux.
Utilisez la liste ci-dessus et naviguez vers les pages GitHub de chaque paquet. Prenez votre temps et apprenez-en plus sur chaque paquet avant de faire votre choix.
Pour les besoins de ce guide, je vais vous aider à télécharger et à installer ComfyUI, ainsi que quelques extensions utiles qui devraient vous être utiles.
Installation et configuration de ComfyUI
Ouvrez Stability Matrix et cliquez sur le bouton "Add Package". Trouvez "ComfyUI" dans la liste des paquets proposés et cliquez dessus. Sur la page qui s'ouvre, assurez-vous que "master" est sélectionné dans la liste déroulante. La version "master" est la version la plus stable et est recommandée pour la plupart des utilisateurs.
Une fois que vous aurez cliqué sur Installer, Stability Matrix commencera à télécharger le paquet pour vous. Attendez qu'il se termine. Le téléchargement peut prendre quelques minutes, n'hésitez donc pas à continuer à utiliser votre système pendant ce temps. Si la boîte de téléchargement se ferme ou si vous appuyez accidentellement sur "Cacher", utilisez le bouton de téléchargement en bas de page pour voir l'état de votre téléchargement en cours.
Une fois qu'il est installé, vous devriez voir une notification pop-up dans la barre des tâches vous informant que ComfyUI est prêt à être utilisé.
Retournez à Packages, et vous verrez la tuile ComfyUI sur la page, mais ne la lancez pas tout de suite. ComfyUI est configuré pour se lancer en mode Normal VRAM pour les GPU avec 12GB VRAM ou plus par défaut. Si vous avez une carte avec 8 Go de VRAM, c'est le moment de forcer Comfy à se lancer en mode Low VRAM.
Ensuite, nous devons installer le ComfyUI Manager. Il s'agit d'un composant essentiel qui vous permet d'installer et de gérer divers nœuds personnalisés dans l'application. Cliquez sur l'icône Jigsaw à droite et tapez "ComfyUI-Manager" dans la section "Extensions disponibles". Sélectionnez-le et cliquez sur Installer en bas. Une fois l'installation terminée, vous devriez voir " (installé) " à côté. Nous sommes maintenant prêts à lancer ComfyUI.
Lancez ComfyUI et laissez-le s'exécuter pendant le processus de démarrage. Une fois que c'est fait, il s'ouvrira automatiquement dans un nouvel onglet de votre navigateur par défaut. Si ce n'est pas le cas, retournez dans l'onglet Packages et cliquez sur WebUI sur la tuile verte de ComfyUI.
Nous vous félicitons ! Vous avez maintenant rempli toutes les conditions préalables. Passons maintenant aux choses sérieuses : le téléchargement et l'utilisation des modèles d'images.
Téléchargement et utilisation de votre premier modèle d'image
Avant de commencer à télécharger des modèles d'images, nous allons passer en revue un glossaire de termes avec lesquels vous devez vous familiariser.
1) UNET/Checkpoint/Modèle de diffusion/Diffuseurs - Le grand patron. C'est le cerveau de l'opération. Imaginez qu'il s'agit de l'artiste qui peint à l'aide de vos mots.
2) Tokenizer - Le chronométreur. Il convertit vos invites en jetons à intégrer avant que les encodeurs de texte ne prennent le relais. Selon le modèle, vous serez limité à un certain nombre de jetons (mots) que vous pourrez utiliser.
3) Encodeurs de texte/CLIP - Les gros bras. Ils convertissent vos invites textuelles en entrées numériques que l'UNET peut comprendre.
4) Échantillonneurs - Le chef d'orchestre. Ils guident de manière itérative le processus de génération d'images en affinant l'image à partir du bruit jusqu'à la sortie finale.
5) VAE - L'équipe de nettoyage. Elle nettoie le bruit après l'étape de génération et aide à améliorer la qualité de l'image.
Vous rencontrerez d'autres termes au cours de votre voyage, mais il s'agit là des notions de base qui définiront tout à partir de maintenant. Ne vous souciez pas trop d'entrer dans les détails pour l'instant.
Une fenêtre s'ouvre alors, présentant des exemples de flux de travail déjà configurés pour vous. Cliquez sur "Basics" et ensuite sur "Image Generation" Vous verrez immédiatement une erreur à l'écran vous informant qu'il manque des modèles. En effet, nous n'avons pas encore téléchargé de modèle d'image. C'est ce que nous allons faire. Cliquez sur télécharger.
Pendant que le fichier se télécharge, attardons-nous sur les différences entre les divers modèles que vous verrez. Ce que nous téléchargeons en ce moment est le modèle de base Stable Diffusion 1.5 modèle de base. Dans le canevas de ComfyUI, vous avez peut-être remarqué trois connexions distinctes à partir du tout premier nœud "Load Checkpoint". Une pour MODEL, une pour CLIP et une pour VAE.
En effet, ces trois éléments sont inclus dans ce point de contrôle de base et vous n'avez pas besoin d'utiliser des CLIP et des VAE distincts pour ce modèle particulier.
Les modèles d'images plus récents, cependant, comme Flux ou HiDreamnécessitent que vous les téléchargiez séparément, alors gardez cela à l'esprit. Heureusement, ils ont des modèles d'exemple comme celui-ci, vous n'avez donc pas à vous soucier de tout configurer. Nous en reparlerons plus tard. Pour l'instant, générons notre première image.
Si vous cliquez sur le bouton Exécuter en bas à droite, vous remarquerez que ComfyUI vous donne toujours une erreur. C'est parce que le modèle doit être placé dans le bon dossier pour que Comfy le reconnaisse. Maintenant, allez dans le dossier où vous avez téléchargé le modèle dans l'Explorateur de fichiers et copiez-le.
Vous remarquerez que le nom du fichier a une extension ".SAFETENSORS,". Il s'agit du format utilisé par le fichier. En règle générale, ne téléchargez que des fichiers portant l'extension .safetensors. Ne téléchargez pas les tenseurs pickle ou .pth. Faites-moi confiance!
Ouvrez le dossier dans lequel vous avez installé Stability Matrix, et cherchez un dossier appelé "Models" Double-cliquez dessus, et cherchez un sous-dossier appelé "StableDiffusion", collez le fichier .safetensors à l'intérieur.
Pour référence future. Les modèles comprenant CLIPS et VAE doivent être placés dans le dossier "StableDiffusion". Les modèles contenant uniquement l'UNET (sans CLIP ni VAE) seront placés dans le dossier "DiffusionModels". Les encodeurs de texte (T5, Llama, CLIP L, CLIP G) doivent être placés dans le dossier "TextEncoders". Enfin, vos fichiers VAE sont placés dans le dossier "VAE".
Comme vous pouvez le constater, il y a beaucoup plus de dossiers que ces trois-là. Je vous conseille de vous y retrouver lorsque vous y arriverez. Pour l'instant, occupons-nous de notre image.
Actualisez la page web de ComfyUI dans votre navigateur. Cliquez sur la boîte de dialogue dans le nœud "Load Checkpoint" et sélectionnez votre fichier téléchargé.
Comme il s'agit d'un modèle, tout est déjà configuré pour vous. Cependant, il est utile de connaître les bases pour vos futurs flux de travail. Commençons par la gauche. Nous avons déjà parlé du nœud Load Checkpoint, et à côté de lui se trouvent deux nœuds "CLIP Text Encode (Prompt)".
Le nœud supérieur correspond aux invites positives, c'est-à-dire à ce que vous voulez voir dans l'image. En dessous se trouve l'entrée pour les invites négatives ou ce que vous ne voulez pas voir dans la sortie finale. La génération d'images est l'équilibre de ces deux nœuds combinés. Vous créez une image, vous vérifiez ce que vous n'aimez pas à son sujet et vous l'entrez dans l'invite négative. Pour l'instant, ces données sont déjà saisies pour nous, alors cliquons sur "Exécuter"
ComfyUI est une interface visuelle, ce qui signifie que vous pouvez voir le processus se dérouler nœud par nœud. Une fois que votre texte est encodé, il est envoyé au "KSampler", qui commence à itérer l'image. Passons rapidement en revue tous les paramètres de ce nœud.
1) Seed : Considérez-le comme l'adresse de l'image. La même invite positive + l'invite négative + les mêmes paramètres + la même graine = la même image. Utile pour recréer et itérer sur une image.
2) Contrôle après la génération : Détermine si la graine sera randomisée après chaque génération ou si elle doit rester fixe.
3) Pas : Le nombre d'étapes pour lesquelles le KSampler doit itérer. La plupart des modèles sont fournis avec des pas recommandés.
4) CFG : La réactivité du modèle à votre invite. Des valeurs élevées = respect strict des invites mais moins de créativité. Valeurs plus faibles = résultats plus créatifs au détriment du respect de l'invite.
5) Sampler_name : le nom de l'échantillonneur que vous utilisez actuellement. Cliquez sur la liste déroulante pour plus d'options. Expérimentez différents paramètres et échantillonneurs pour obtenir des résultats variés.
6) Scheduler (Planificateur) : Considérez-le comme le second responsable qui propose des stratégies approuvées par le chef d'orchestre. Là encore, expérimentez différents échantillonneurs et programmateurs pour trouver celui qui vous convient le mieux.
7) Débruitage : Détermine la quantité de bruit ajoutée au début du processus de génération. Ce bruit est éliminé de manière itérative par l'échantillonneur. La valeur ne peut être supérieure à 1,00, et les valeurs inférieures (0,45 ou 0,65) sont principalement utilisées dans les flux de travail image à image, de raffinage ou d'inpainting.
L'entrée latent_image située à gauche du nœud KSampler détermine la taille de votre image. Dans le flux de travail, elle est connectée à un nœud "Empty Latent Image" avec une résolution de 512x512 et une taille de lot (le nombre d'images générées en une seule fois) de 1.
Regardez-moi ça ! Notre toute première image. Si vous êtes arrivé jusqu'ici, félicitations ! Vous connaissez maintenant les bases qui vous permettront de commencer votre voyage dans la génération d'images. Plus vous expérimenterez, plus vous découvrirez de choses, et ce trou de lapin est profond. Amusez-vous bien.
Liens utiles
CivitAI: Votre guichet unique pour télécharger des modèles, des LoRAs, des embeddings, et bien plus encore. (Attention : contient du contenu NSFW, utilisez les filtres de site intégrés)
Monzon Media: Une ressource fantastique pour les tutoriels ComfyUI pour débutants et avancés.
ComfyUI Wiki: Pour tous vos besoins de dépannage.
Liste de ressources Bad ASS ComfyUI: Liens pour tous les modèles de base, CLIPs, et VAEs dont vous pourriez avoir besoin en un seul endroit.
Workflows Comfy: Une communauté dédiée au partage et au téléchargement de flux de travail.