Google DeepMind ha anunciado el lanzamiento de Gemini 2.5 Flash Image, un modelo de inteligencia artificial de última generación diseñado para transformar la manera en que los creadores, desarrolladores y usuarios interactúan con las imágenes.
Este lanzamiento oficial pone fin a semanas de especulación en la comunidad de IA, donde el modelo era conocido internamente y en plataformas de prueba como «nano-banana», un apodo que rápidamente se hizo popular por su rendimiento sobresaliente.
Con un enfoque en la velocidad y la eficiencia, Gemini 2.5 Flash Image está listo para potenciar la próxima era de aplicaciones visuales, ofreciendo una solución robusta y accesible a través de la API de Gemini y la plataforma Google AI Studio, según detalla la empresa en su blog.
“Nano-banana” un nombre de prueba para una potencia creativa
El apodo «nano-banana» fue el nombre en clave utilizado en la plataforma competitiva LMArena.ai, donde el modelo fue sometido a exhaustivas pruebas y votaciones por la comunidad global de inteligencia artificial.
En este entorno, Gemini 2.5 Flash Image demostró su superioridad, logrando récords en puntuaciones Elo y recibiendo millones de votos, lo que lo catapultó al primer lugar en las tablas de clasificación de edición y generación de imágenes. La comunidad incluso lo apodó el «asesino de Photoshop» por su capacidad para realizar ediciones complejas con simples instrucciones de texto.


Características clave que rompen moldes en la edición de imágenes
Gemini 2.5 Flash Image va más allá de la simple generación de imágenes a partir de texto. Su verdadera innovación reside en sus capacidades avanzadas de edición y control, que permiten una manipulación de imágenes intuitiva y precisa.
- Coherencia de Personajes y Objetos: A diferencia de otros modelos, esta IA puede mantener la identidad y el estilo de un personaje u objeto a través de múltiples imágenes y escenarios. Esto permite a los usuarios colocar el mismo personaje en diferentes poses, fondos o situaciones, abriendo un abanico de posibilidades para la creación de narrativas visuales consistentes.
- Edición Basada en Instrucciones: El modelo permite a los usuarios realizar ediciones locales y transformaciones complejas con solo una indicación de texto. Acciones como eliminar un objeto del fondo, cambiar la pose de una persona o agregar un elemento específico son ahora tan sencillas como escribirlas.
- Fusión de Imágenes: Permite combinar hasta tres imágenes de entrada para crear una nueva composición coherente, ideal para la creación de arte surrealista o la mezcla de elementos de diferentes fotografías.
El éxito de «nano-banana» en LMArena no fue casualidad. Su rendimiento en las pruebas de la comunidad demostró que es un modelo excepcionalmente capaz de comprender instrucciones complejas y mantener detalles contextuales. Este enfoque en la usabilidad y la eficiencia lo convierte en una herramienta invaluable para desarrolladores que buscan integrar capacidades visuales avanzadas en sus aplicaciones sin sacrificar la velocidad o la calidad.
Gemini 2.5 Flash Image está disponible de manera oficial para desarrolladores a través de la API de Gemini, Google AI Studio y Vertex AI.
ultimasnoticias.com.ve
Ver fuente