¡Imagina transformar tus fotos con simples frases! Apple y investigadores de la Universidad de California en Santa Bárbara han presentado un modelo de inteligencia artificial revolucionario llamado MGIE que hace exactamente eso. Olvídate de los complejos programas de edición: describe los cambios que deseas en lenguaje natural y MGIE se encarga del resto.
MGIE, abreviatura de MLLM-Guided Image Editing, es tu editor de fotos con IA de bolsillo. ¿Quieres recortar, redimensionar, voltear o añadir filtros? Solo escribe tus instrucciones. ¡Y no se detiene ahí! Esta IA también puede realizar ediciones más complejas, como remodelar objetos o aclarar áreas específicas. Por ejemplo, decir “haz el cielo más azul” basta para que MGIE ajuste únicamente el brillo del cielo.
¿Cómo funciona?
MGIE domina dos lenguajes: el texto y la imagen. Primero entiende tus instrucciones escritas y luego “visualiza” la edición. “Haz la pizza más saludable” puede convertirse en añadir ingredientes de verduras, mientras que “más contraste para un Sahara más brillante” puede iluminar una foto del desierto con más luz solar.
Los investigadores explican: “MGIE va más allá de las instrucciones vagas y comprende la intención visual específica del usuario, lo que permite ediciones excepcionales. Lo hemos probado ampliamente en diversas tareas y ofrece resultados impresionantes manteniéndose eficiente. Creemos que este enfoque guiado por modelos multimodales abre el camino a futuros avances en la investigación de visión y lenguaje”.
¿Listo para probarlo? Haz clic aquí: https://huggingface.co/spaces/tsujuifu/ml-mgie o aquí: https://github.com/apple/ml-mgie?tab=readme-ov-file
Apple ofrece MGIE para descarga en GitHub e incluso proporciona una demostración web en Hugging Face Spaces. La compañía aún no ha revelado sus planes futuros, pero las posibilidades son emocionantes.
Por supuesto, Apple no está sola en el campo de la edición de imágenes con IA. Plataformas como DALL·E 3 de OpenAI ofrecen funciones similares de manipulación de imágenes mediante texto, y Adobe Firefly genera fondos para fotografías.
Aunque Apple no ha sido un actor principal en la IA generativa como Microsoft, Meta o Google, el CEO Tim Cook ha insinuado que llegarán más funciones de IA a los dispositivos de la marca este año. El lanzamiento de MGIE, junto con su framework de código abierto MLX para entrenar modelos en chips de Apple, sugiere que la empresa se toma en serio su entrada en la revolución de la IA.
¡Prepárate para dejar atrás los programas de edición y abrazar el poder de las palabras! Con MGIE de Apple, transformar tus fotos es tan fácil como escribir una frase. El futuro de la edición de imágenes ya está aquí… y es mágico.