Nano Banana es la herramienta de Google, integrada en Gemini, para la generación de imágenes, pero además permite realizar tareas de edición y transformación. Para saber como usar Nano Banana y que realice la tarea que necesitamos es fundamental seguir una estructura de prompt bien definida. La estructura será diferente en función de lo que estemos buscando. A continuación vamos a ver 3 ejemplos de prompts para generar una imagen, editarla o componerla.
Estructura para la generación de imágenes
Esta fórmula es muy útil para saber como usar Nano Banana en la generación de imágenes completamente nuevas a partir de una instrucción de texto. La estructura recomendada consta de los siguientes elementos en orden:
1. Sujeto y descripción de dicho sujeto: Quién o qué es el foco de la imagen.
2. Acción que está realizando el sujeto: Si el sujeto está realizando alguna actividad.
3. Fondo de la imagen: El entorno o background. Aquí describimos donde se situará la acción, la escena de nuestra imagen.
4. Estilo artístico: Puede ser fotografía (con especificación de la cámara), ilustración, tinta negra, acuarela, o estilo cómic, entre otros muchos.
5. Iluminación: Especificaciones como iluminación suave, iluminación de estudio, o iluminación dramática o cinematográfica.
6. Detalles: Cualquier información adicional que enriquezca la imagen (por ejemplo, cálida y detallada o colores saturados).
Ejemplo de uso
Para generar una imagen de un joven con gafas, el prompt podría estructurarse así: «Sujeto: Un hombre joven con gafas de montura fina. Acción: Concentrado, escribiendo en un portátil. Fondo: En una biblioteca moderna con estanterías altas y luz tenue. Estilo: Fotografía con cámara Sony Alpha a7R IV. Iluminación: Luz ambiental cálida y focos puntuales. Detalles: Ambiente intelectual y sereno.».
En el ejemplo hemos especificado cada componente del prompt, pero cuando lo vayamos a usar debemos escribir el prompt sin especificar cada parte.

Estructura para la Edición de Imágenes
Antes de saber como usar Nano Banana en la edición es necesario seleccionar la imagen principal (la imagen base) y realizar modificaciones sobre ella. Se pueden subir otras imágenes como referencia para guiar los cambios. La fórmula o estructura para la edición de imágenes es la siguiente:
1. Acción o cambio a realizar. Las cinco mejores palabras de acción son: Añade – Cambia – Genera – Elimina – Reemplaza
2. Elemento específico a cambiar: Aquí debemos indicar el componente de la imagen que será modificado o removido. Si hay múltiples elementos (como varias personas), es crucial identificar claramente el elemento a cambiar (ej. «el vestido de la mujer de amarillo»).
3. Elemento nuevo, estilo o efecto deseado: Lo que se desea introducir, o el estilo/efecto que se busca aplicar (ej. un peinado de pelo corto rosa inspirado en los años 80, por un cielo azul claro con nubes blancas esponjosas).
4. Detalles relevantes: Especificaciones adicionales sobre la calidad o el estilo deseado para el resultado (ej. fotorrealista).
Esta estructura permite tareas como corregir el balance de blancos, eliminar acné o marcas de piel, quitar objetos, añadir objetos, cambiar la vestimenta (usando referencias), cambiar estilos de peinado, reemplazar elementos específicos (como un cuadro por un estilo Joan Miró), o cambiar la iluminación de la escena (ej. a atardecer).
Ejemplo de uso para edición: Añade la lata de refresco en la imagen donde se ve al chico delante de un ordenador portátil. Añade la lata sobre la mesa, detrás del portátil.

Estructura para la Composición de Imágenes
A diferencia de la edición, la composición de imágenes no parte de una única imagen principal a modificar, sino que utiliza varias imágenes de referencia para generar una imagen completamente nueva que integra elementos de todas ellas.
La fórmula para la composición es:
1. Tipo de imagen: Generalmente, composición fotográfica.
2. Descripción de la imagen a generar + imágenes de referencia: La descripción del escenario o escena deseada, seguida de una mención clara a las imágenes de referencia que la IA debe utilizar para integrar los elementos.
3. Detalles relevantes: Especificaciones sobre el resultado, como perfecta integración del personaje en el fondo, proporciones adecuadas, o iluminación dramática.
Consideraciones para referencias múltiples: Es vital indicar con precisión las imágenes de referencia a utilizar. Si hay múltiples elementos en alguna de las referencias, se debe hacer referencia a colores o formas para identificar el elemento exacto que se desea usar. Por ejemplo, para componer una imagen de una persona (de la Imagen A) vistiendo una chaqueta (de la Imagen B), se describe: «en el que aparece el personaje de la imagen [A] que lleva puesta la cazadora de la imagen [B]».
Casos de uso para composición: Generar una nueva imagen de una persona usando una prenda de vestir de otra imagen, o generar una imagen donde una persona sostiene un producto específico en un entorno detallado (como una playa paradisíaca), utilizando referencias para la persona y la lata. Esta técnica es un sustituto para los procesos de entrenamiento de modelos (como Lora) al pasarle múltiples referencias de una misma persona para generar imágenes consistentes.
Categoría/s: Diseño gráfico









Deja una respuesta