Google lanza herramienta para convertir fotos en videos animados con inteligencia artificial en Gemini

Google ha dado un nuevo paso en la evolución de la inteligencia artificial creativa con el lanzamiento de una innovadora función en su aplicación Gemini: la posibilidad de transformar fotos estáticas en videos dinámicos. Esta herramienta, disponible inicialmente para suscriptores de los planes Google AI Ultra y Pro en Argentina y otras regiones seleccionadas, promete revolucionar la forma en que los usuarios crean contenido audiovisual sin requerir experiencia técnica previa.

¿Cómo funciona esta nueva función?

La funcionalidad está integrada en la caja de instrucciones de Gemini, bajo la pestaña “herramientas”. Desde allí, el usuario debe seleccionar la opción “video” y subir una fotografía. A continuación, puede describir el tipo de movimiento que desea aplicar, así como el audio que imagina acompañando la escena. Esto incluye diálogos, efectos de sonido y ruidos ambientales sincronizados con la imagen.

El resultado es un clip de 8 segundos de duración, en resolución 720p, formato MP4 horizontal 16:9, y con audio incorporado. Esta nueva capacidad convierte imágenes fijas en experiencias visuales envolventes, sin la necesidad de software de edición avanzado.

Integración con Flow y expansión a móviles

Aunque inicialmente el despliegue se ha realizado a través de la versión web de Gemini, se espera que la herramienta esté disponible también en dispositivos móviles en el transcurso de la semana. Además, Google ha actualizado Flow, su plataforma para la creación de películas con inteligencia artificial, que ahora también soporta funciones de imagen a video con audio, ampliando aún más las posibilidades de creación.

Tecnología de punta: Veo 3 como motor creativo

Detrás de esta tecnología se encuentra Veo 3, el modelo de generación de video más avanzado de Google lanzado en mayo de 2025. Gracias a esta poderosa inteligencia artificial, tanto Gemini como Flow han facilitado la creación de más de 40 millones de videos en las últimas siete semanas.

Los usos que han reportado los usuarios van desde reinterpretaciones modernas de cuentos de hadas hasta videos ASMR que exploran sonidos únicos. Según David Sharon, líder de generación multimodal de Gemini Apps, “Puedes ser creativo animando objetos cotidianos, dándole vida a tus dibujos y pinturas, o añadiendo movimiento a escenas de la naturaleza”.

Potencial creativo sin barreras técnicas

Una de las principales ventajas de esta función es que permite a cualquier usuario participar en la creación de contenido audiovisual complejo. Basta con tener una imagen y una idea de lo que se quiere transmitir, tanto en movimiento como en sonido. La IA se encarga del resto, generando un video con coherencia narrativa y visual.

Este enfoque democratiza la producción multimedia y amplía el alcance de la inteligencia artificial como una herramienta expresiva en campos como el arte digital, la educación, la publicidad y el entretenimiento.

Seguridad y transparencia

Google ha puesto especial atención en la seguridad y la ética del uso de esta tecnología. La función cuenta con un robusto proceso de verificación denominado “red teaming”, destinado a identificar y mitigar posibles riesgos o abusos, como la generación de contenido inseguro o engañoso.

Cada video generado incluye:

Una marca de agua visible, que indica que fue creado mediante inteligencia artificial.
SynthID, una marca digital invisible que permite rastrear el origen del contenido.

Estas medidas buscan promover la transparencia, evitar la manipulación informativa y garantizar la trazabilidad del contenido creado con inteligencia artificial.

Además, los usuarios tienen la posibilidad de dar retroalimentación directa sobre los resultados a través de botones de “pulgar arriba” o “pulgar abajo”, contribuyendo así al perfeccionamiento del sistema y sus políticas de seguridad.

¿Dónde probar esta función?

Los interesados pueden acceder y probar la herramienta en línea desde la dirección:
👉 gemini.google.com/veo

También pueden experimentar las mismas capacidades dentro de la plataforma Flow, ideal para proyectos cinematográficos y narrativas más elaboradas.

La nueva función de Google Gemini representa un hito en la integración de imagen, audio y movimiento mediante inteligencia artificial. Al facilitar la creación de videos animados a partir de fotos estáticas, abre nuevas puertas a la creatividad, la comunicación y el arte digital. Gracias a herramientas como Veo 3, Gemini y Flow, Google está consolidando su liderazgo en el campo de la generación de contenido audiovisual con IA, haciendo que este tipo de tecnología sea cada vez más accesible, segura y poderosa para usuarios de todos los niveles.