JOIN OUR TELEGRAM CHANNEL • NO ADS • EXCLUSIVE TIPS
JOIN
WHY JOIN THE CHANNEL?
All perks — zero noise • 100% free
JOIN FOR FREE — GET STEAM CONTESTS & EXCLUSIVE CODES

Comparación entre Nano Banana 2 y Nano Banana Pro: más grande no siempre es mejor

Google acaba de lanzar Nano Banana 2, su último modelo de generación de imágenes basado en Gemini 3.1 Flash Image. Google afirma que combina las capacidades de nivel profesional de Nano Banana Pro con la eficiencia y velocidad de sus modelos Flash. Entonces, para probar la afirmación, hemos comparado Nano Banana 2 con Nano Banana Pro en este enfrentamiento visual. En ese sentido, verifiquemos qué modelo de generación de imágenes gana.

Probando el conocimiento del mundo real

Para mi primera prueba, comencé con conocimientos del mundo real, ya que Nano Banana 2 ahora viene con acceso web, al igual que el modelo Nano Banana Pro más grande. Simplemente les pedí a ambos modelos de imágenes que generaran una imagen del edificio actual más alto del mundo y etiquetaran el nombre del edificio.

El modelo Nano Banana 2, a pesar de ser menos costoso y de tamaño pequeño, hizo un trabajo fenomenal y etiquetado Burj Khalifa correctamente. Por otro lado, Nano Banana Pro renderizó correctamente la imagen, pero agregó un pequeño cuadro de texto en la parte inferior izquierda. En mi opinión, Nano Banana 2 ganó esta ronda fácilmente.

Crea una infografía detallada

A continuación, pedí a ambos modelos de imágenes que generaran una infografía detallada sobre la puerta trasera XZ Utils que se descubrió en Linux en 2024. Como era una operación compleja, quería ver cómo manejan y explican el ataque altamente sofisticado. Y me asombré al ver que Nano Banana 2 casi tengo todos los detalles correctos con una excelente línea de tiempo de todos los desarrollos importantes, superando a Nano Banana Pro. Entonces, también en términos de generación de infografías, Nano Banana 2 tiene una ventaja.

Prueba de representación de texto

Google dice que Nano Banana 2 es mucho mejor en la representación de textoasí que lancé un montón de texto denso y pedí a ambos modelos que generaran una imagen de un libro que contuviera el texto. Leí el texto de ambas imágenes y son legibles, pero la imagen generada mediante Nano Banana 2 tiene legibilidad mejorada gracias a un mejor espaciado. También está bien formateado, lo que mejora la experiencia de lectura. Entonces, para la representación de texto, Nano Banana 2 es el modelo de imagen líder en el mercado en este momento.

Instrucciones de prueba siguientes

Después de eso, pasé a probar las siguientes instrucciones en ambos modelos. Sabemos que los modelos de imágenes tienen dificultades con la representación del reloj y los dedos. Entonces pedí a Nano Banana 2 y Nano Banana Pro que generaran una imagen con los dedos claramente visibles, una copa de vino llena hasta el borde con vino tinto y un reloj de pared que marcaba las 7:42.

Aquí, Ambos modelos no siguieron las instrucciones. y no pude renderizar el reloj correctamente. Además, tampoco mostraron la copa de vino llena. Y los dedos solo eran visibles en la imagen generada por Nano Banana 2. En general, diría que superar el sesgo de entrenamiento del modelo es un problema desafiante en AI/ML, y Google tendrá que trabajar para solucionar este problema al seguir las instrucciones.

Probando el fotorrealismo

Ahora, para probar el fotorrealismo y las imágenes de alta fidelidad, pedí a ambos modelos de imágenes que generaran un retrato fotorrealista de un pescador anciano en la hora dorada. En mi opinión, Nano Banana 2 generó una imagen más realista con piel arrugada, océano retroiluminado y coherencia ambiental. La foto también parece algo creíble, así que mi punto es para Nano Banana 2.

Prueba de traducción en imágenes

A continuación, para probar la traducción de la imagen manteniendo la coherencia general de la imagen, subo un póster de Claude en inglés y les pedí a ambos modelos que lo tradujeran al francés. En esta prueba, tanto Nano Banana 2 como Nano Banana Pro no se pudo traducir todo el texto en la imagen. Más allá del titular, no se tradujo nada del texto. Dicho esto, Nano Banana Pro intentó traducir la descripción, pero de alguna manera falló a mitad del camino.

Prueba de coherencia de caracteres

Para evaluar la coherencia del personaje, subí una imagen de una mujer con un rostro claro y pedí a ambas modelos que mostraran diferentes emociones. Incluía una variedad de emociones como felicidad, tristeza, enojo, sorpresa, disgusto y miedo. Como afirmó Google, Nano Banana 2 efectivamente produjo mejores resultados y mantuvo el personaje consistente en todas las salidas. El la expresión facial también es mejor renderizado por Nano Banana 2.

Diseño de personajes de anime

Finalmente, probé el diseño de personajes de anime en ambos modelos de imagen. Les pedí que generaran una hoja de personaje de anime de cuerpo completo de una samurái. Como puede ver, la imagen generada por Nano Banana 2 tiene mejores acentos rojos y mantiene la consistencia del carácter desde múltiples ángulos. La armadura también es bien detalladoy los primeros planos de la cara son más emotivos.

¿Cuál es mejor: Nano Banana 2 vs Nano Banana Pro?

En resumen, Google ha hecho un trabajo encomiable entrenando el modelo más pequeño Nano Banana 2 (Gemini 3.1 Flash Image) con detalles tan intrincados. En mis pruebas, descubrí que es mejor en casi todas las áreas que el modelo Nano Banana Pro más grande (basado en Gemini 3 Pro Image). También significa que Google tiene una base sólida en lo que respecta a la destilación del conocimiento de sus modelos más grandes a otros más rápidos y eficientes.

La familia Flash de modelos de lenguaje ha brindado consistentemente un rendimiento de vanguardia a menor costo y latencia. Y ahora también estamos obteniendo el mismo avance en la generación de imágenes de IA. Con todo, Nano Banana 2 es actualmente mi modelo de imagen favorito y creo que sólo la próxima variante Pro podrá superarlo.

Retrato de Arjun Sha
Arjun Sha

Apasionado por Windows, ChromeOS, Android, temas de seguridad y privacidad. Tener predilección por resolver problemas informáticos cotidianos.