Apple dévoile sa baguette magique IA : modifier des photos avec des mots, pas avec des logiciels

Imaginez transformer vos photos avec de simples phrases ! Apple et des chercheurs de l’Université de Californie à Santa Barbara ont présenté un modèle d’IA révolutionnaire appelé MGIE qui fait exactement cela. Oubliez les logiciels de retouche complexes : décrivez vos modifications en langage naturel, et MGIE s’occupe du reste.

MGIE, pour MLLM-Guided Image Editing, est votre éditeur photo IA de poche. Vous voulez recadrer, redimensionner, retourner une image ou ajouter des filtres ? Il suffit d’écrire vos instructions. Et ce n’est pas tout ! Cette IA est capable de modifications plus complexes, comme remodeler des objets ou éclaircir des zones spécifiques. Par exemple, dire « rends le ciel plus bleu » suffit pour que MGIE ajuste uniquement la luminosité du ciel.

Comment cela fonctionne-t-il ?
MGIE maîtrise deux langages : le texte et l’image. D’abord, il comprend vos instructions écrites, puis il « visualise » la modification. « Rends la pizza plus saine » peut se traduire par l’ajout de garnitures de légumes, tandis que « plus de contraste pour un Sahara plus lumineux » peut illuminer une photo de désert avec davantage de soleil.

Les chercheurs expliquent : « MGIE va au-delà des instructions vagues et comprend précisément l’intention visuelle de l’utilisateur, ce qui permet des retouches exceptionnelles. Nous l’avons testé sur de nombreuses tâches et il offre des résultats impressionnants tout en restant efficace. Nous pensons que cette approche guidée par les modèles multimodaux ouvre la voie à de futures avancées en recherche vision-langage. »

Prêt à l’essayer ? Cliquez ici : https://huggingface.co/spaces/tsujuifu/ml-mgie or here https://github.com/apple/ml-mgie?tab=readme-ov-file

Apple propose MGIE en téléchargement sur GitHub et met également à disposition une démonstration en ligne sur Hugging Face Spaces. L’entreprise n’a pas encore révélé ses projets futurs, mais les perspectives sont prometteuses.

Bien sûr, Apple n’est pas seule dans le domaine de l’édition d’images par IA. Des plateformes comme DALL·E 3 d’OpenAI proposent déjà des fonctionnalités similaires de génération et modification d’images à partir de texte, et Adobe Firefly permet de créer des arrière-plans pour les photos. Même si Apple n’a pas été aussi présente que Microsoft, Meta ou Google dans l’IA générative, son PDG Tim Cook a laissé entendre que davantage de fonctionnalités IA arriveraient sur les appareils de la marque cette année. Le lancement de MGIE, ainsi que le framework open-source MLX pour entraîner des modèles sur les puces Apple, montre que l’entreprise prend très au sérieux sa participation à la révolution de l’IA.

Préparez-vous à abandonner les logiciels de retouche traditionnels et à adopter la puissance des mots ! Avec MGIE d’Apple, transformer vos photos devient aussi simple que d’écrire une phrase. Le futur de la retouche d’image est là… et il est magique !

Source : The Verge

Sommaire

Partager l'article:

Vous aimeriez aussi

Ce site est enregistré sur wpml.org en tant que site de développement. Passez à un site de production en utilisant la clé remove this banner.