
Google estaría preparando una actualización significativa para las funciones multimedia de Gemini con Omni, un nuevo modelo de inteligencia artificial (IA) para crear video que, presuntamente, superaría las capacidades de Veo.
Según reportan medios especializados como 9to5Google, el supuesto algoritmo fue detectado por un usuario de Reddit identificado como “Zacatac_391”, quien al abrir la aplicación de Gemini observó una notificación push que lo invitaba a probar el nuevo motor de video.
De acuerdo con las capturas de pantalla compartidas, el modelo permitiría a los usuarios remezclar clips preexistentes, realizar ediciones mediante indicaciones de texto y desarrollar proyectos desde cero a partir de plantillas sugeridas.
Los primeros reportes apuntan a que Omni se integraría directamente en la experiencia de uso de Gemini como una extensión de Veo. Así, el sistema podría generar videos hiperrealistas con audio a partir de instrucciones escritas o conjuntos de imágenes fijas. No obstante, se espera que la nueva IA incorpore mejoras relevantes en áreas donde otros modelos similares suelen presentar fallas, como ajustes de iluminación, creación de reflejos, continuidad entre escenas o generación de texto legible dentro del video.
Estas capacidades habrían sido probadas por Zacatac_391, quien supuestamente generó al menos dos videos que destacaron por reproducir con gran precisión las instrucciones enviadas al chatbot.
En un primer ejercicio, el usuario pidió al sistema crear un video en el que apareciera un profesor escribiendo una expresión matemática de identidades trigonométricas en una pizarra tradicional mientras explicaba el paso correspondiente de la ecuación.
En el segundo ejemplo, la instrucción fue más detallada y compleja: “crea una escena con dos hombres sentados a una mesa en la terraza de un restaurante elegante junto al mar. Están en una mesa redonda con un bonito mantel blanco y todos los accesorios elegantes: cubiertos, servilletas de lujo y un centro de mesa. Uno de ellos es un hombre distinguido: un afroamericano maduro de unos 50 años, con barba corta y porte seguro, vestido con un traje sofisticado y a medida. El otro es su amigo. Ambos se acercan a la mesa para comer un plato de espagueti. Al principio, intercambian breves saludos y comienzan a comer espagueti con tranquilidad, conversando entre bocado y bocado”.
