Manus ahora forma parte de Meta, llevando la IA a empresas en todo el mundo

Otro·viernes, marzo 06

Probé Google Veo 3 y aquí está mi reseña honesta

Como redactor de contenido en Manus, probar nuevas herramientas de AI es básicamente parte de la descripción del trabajo. Cuando se lanzó Google Veo 3, internet se volvió loco con las demos. Cabezas parlantes realistas, audio sincronizado, imágenes cinematográficas, todo a partir de un solo prompt de texto. He visto suficientes ciclos de hype sobre AI para saber que las demos están cuidadosamente seleccionadas y los resultados en el mundo real son una historia completamente diferente.
Así que decidí pasar algo de tiempo usando realmente Google Veo 3, sometiéndolo a cuatro prompts distintos diseñados para llevarlo al límite, y documentando todo honestamente.
Este no es un resumen de los materiales de marketing de Google. Esta es una reseña práctica de Google Veo 3 basada en mi experiencia real, incluidas las partes que me impresionaron, las partes que me frustraron y las partes que simplemente no funcionaron. Al final de este artículo, sabrás exactamente en qué es bueno Veo 3, dónde falla, si vale la pena el precio y cómo se compara con la competencia.


¿Qué es Google Veo 3? (¿Y qué hay de nuevo en Veo 3.1?)

Google Veo 3 es un modelo avanzado de generación de video con AI que crea clips de video de alta calidad a partir de un solo prompt de texto. Admite diálogos sincronizados, efectos de sonido ambiental y música de fondo, todo a partir de un solo prompt, y rápidamente se ha ganado la reputación de producir algunas de las grabaciones de cabezas parlantes generadas por AI más realistas que existen.
Veo 3 se anunció por primera vez en Google I/O a mediados de 2025 y rápidamente se convirtió en uno de los generadores de video con AI más comentados del año. La actualización más reciente, Veo 3.1, trajo mejoras significativas: mayor estabilidad, sincronización labial más precisa, generación de personajes más consistente y escalado a 1080p y 4K. Es accesible a través de algunos productos de Google — Google Flow, una herramienta de producción cinematográfica de nivel profesional creada para editar y secuenciar escenas más largas y complejas, y Google Whisk, una herramienta experimental centrada en la generación rápida de imagen a video y clips cortos. Para esta reseña, realicé las pruebas a través de la aplicación Gemini, donde simplemente seleccioné la píldora de herramienta "Crear video" y ejecuté los cuatro prompts desde allí.


Mi proceso de pruebas prácticas

Para hacer una prueba adecuada, no quería simplemente lanzarle prompts simples y terminar el día. Le pedí a Manus que me ayudara a diseñar cuatro prompts específicos para evaluar diferentes capacidades: diálogo y sincronización labial, atmósfera cinematográfica, consistencia de producto y acción dinámica. Así es como transcurrió ese proceso en realidad.

Cómo obtuve acceso (y cómo puedes hacerlo tú también)

Obtener acceso a Veo 3 es honestamente un poco confuso al principio, y creo que vale la pena explicarlo porque es un punto de dolor común.
Captura de pantalla de la interfaz de cuenta gratuita de Gemini

Empecé con la cuenta gratuita. La interfaz es bastante genérica, similar a otras herramientas de AI, con una caja de prompt y algunas píldoras de herramientas para elegir. No había ninguna opción de generación de video visible en ninguna parte. Intenté ingresar mi primer prompt de todos modos, solo para ver qué pasaba.
Captura de pantalla de Gemini devolviendo una imagen en lugar de un video

Lo que obtuve fue una imagen, no un video. La imagen era en realidad impresionante y coincidía bien con el prompt, pero claramente no era lo que había pedido. Luego intenté pedirle explícitamente a Gemini que creara un video para mí, pensando que tal vez había malinterpretado mi intención. La respuesta que obtuve fue: "Puedo crear ese video para ti hoy si actualizas tu suscripción".
Captura de pantalla del aviso de actualización

Así que fui a ver los planes de pago.
Aquí está el desglose actual de lo que ofrece cada plan para la generación de video:
Plan
Precio mensual
Créditos de AI
Acceso a Veo 3.1
Free
$0
50 créditos diarios
Acceso limitado a Flow, animar y generar imágenes
Google AI Plus
$7.99/mes
200 créditos mensuales
Mayor acceso a Flow y generación de imagen a video en Whisk
Google AI Pro
$19.99/mes
1.000 créditos mensuales
Mayor acceso a Flow y Whisk
Google AI Ultra
$249.99/mes
25.000 créditos mensuales
Acceso máximo a Flow y Whisk
La redacción de los planes es imprecisa. Google AI Plus dice "más acceso a la creación de imagen a video con Veo 3" y Google AI Pro dice "mayor acceso". No es exactamente claro como el agua lo que realmente estás obteniendo. Fui primero con Google AI Plus, ya que era el siguiente nivel y parecía que haría el trabajo. Pagado, suscrito, ¡y allá vamos! En el plan Plus, pude ver la adición de la opción "Crear video" que anteriormente no estaba disponible en el plan gratuito.
Plan Gemini Plus con la opción "Crear video" ahora visible



Los 4 prompts que usé para probar los límites de Veo 3

Aquí están los cuatro prompts que elaboré para probar diferentes aspectos de las capacidades de Veo 3:
1.La prueba de diálogo y sincronización labial — Para evaluar la función principal de audio nativo con diálogo sincronizado.
2.La prueba cinematográfica y atmosférica — Para evaluar qué tan bien maneja estilos visuales complejos y dirección de cámara.
3.La prueba de consistencia de producto y objeto — Para comprobar si puede producir videos de producto limpios y profesionales.
4.La prueba de acción y movimiento — Para ver cómo maneja el movimiento rápido, el trabajo de cámara dinámico y el audio en capas.


Los resultados: 4 ejemplos de video de Veo 3 (lo bueno, lo malo y lo defectuoso)

Prompt #1: La prueba de diálogo y sincronización labial

Prompt utilizado: "Plano medio de una historiadora de unos 40 años, con gafas, sentada en una biblioteca con iluminación cálida. Mira directamente a la cámara, hablando con un tono reflexivo y cautivador. Dice: 'Lo que la mayoría de la gente no se da cuenta sobre el Imperio Romano es que su colapso no fue un solo evento, sino un desmoronamiento lento y complejo a lo largo de siglos.' Ruido ambiental: el rumor silencioso de páginas que se pasan y el suave zumbido del aire acondicionado de la biblioteca. Estilo: Entrevista documental, filmada con una cámara digital de alta calidad."

Mi experiencia: Vale, quedé genuinamente impresionado con este. El proceso fue fluido y el video estuvo listo en minutos. Historia real: mientras se estaba generando, cambié de pestaña para hacer otras cosas. Cuando volví y vi el resultado, realmente pensé que un anuncio aleatorio había aparecido en mi pantalla. Se veía así de realista. La historiadora, la iluminación, el tono... todo estaba clavado. Hablaba con inflexiones naturales, pausas y énfasis. ¿Sus expresiones faciales y gestos con las manos? Perfectos. Era genuinamente digno de una entrevista documental.
Las únicas cosas que se sintieron un poco fuera de lugar fueron las agresivas motas de polvo flotando en la luz del sol, que eran un poco distractoras. Y aunque pedí sonidos ambientales de biblioteca, el modelo me dio una pista de música de fondo sutil en su lugar. Pero honestamente, fue una decisión ejecutiva inteligente. La música se ajustaba al estilo documental perfectamente, tal vez incluso mejor que lo que había pedido. ¡Qué comienzo!
Lo que me gustó
Lo que no me gustó
Personaje increíblemente realista y de aspecto natural
Las motas de polvo en la luz del sol fueron un poco distractoras
Sincronización labial perfecta con inflexiones naturales del habla
Ignoró la solicitud específica de sonido ambiental (pero tomó una buena decisión)
Capturó perfectamente el estilo de entrevista documental



Prompt #2: La prueba cinematográfica y atmosférica

Prompt utilizado: "Plano dolly moviéndose lentamente hacia atrás, revelando a un astronauta solitario de pie en el borde de un cráter en Marte. El cielo es de un naranja rojizo y polvoriento con dos pequeñas lunas visibles. Desolado y silencioso. Estilo: Ciencia ficción épica, 4K, lente gran angular, extremadamente detallado, ambiente impresionante y melancólico."

Mi experiencia: Este fue... mixto. Lo primero que me llamó la atención fue el reflejo en el casco del astronauta. Había pedido un reflejo tenue de la Tierra, pero lo que obtuve fue una extraña y distorsionada astilla de la cara de un hombre. Se veía completamente mal, como un fallo bizarro donde las capas de transparencia y dimensiones estaban todas mal. ¿Se suponía que era la propia cara del astronauta? ¡Quién sabe! Simplemente parecía pegada.
Todo lo demás no estuvo mal. El traje, el cráter, el movimiento de la cámara, todo sólido. Los detalles de la niebla de polvo y arena fueron en realidad súper realistas. Pero el prompt pedía dos pequeñas lunas, y el cielo mostraba lo que parecían tres planetas de diferentes tamaños. Es una pena lo de la cara defectuosa, porque sin ella, esto habría sido impresionante. Con la generación de video con AI, se ganan algunas, se pierden otras. El modelo añadió un sol, estrellas y niebla en movimiento, lo cual funcionó. ¿La cara extra y el planeta? No tanto.
Lo que me gustó
Lo que no me gustó
Buena ejecución del movimiento de cámara dolly
Fallo importante con la cara distorsionada en el reflejo del casco
Detalles realistas de la niebla de polvo y arena
No siguió la instrucción de "dos lunas"
Capturó bien el ambiente desolado y épico de ciencia ficción
Al traje del astronauta le faltaba algo de detalle fino


Prompt #3: La prueba de consistencia de producto y objeto

Prompt utilizado: "Plano giratorio de una tetera de cerámica de alta gama y bellamente diseñada. La tetera es de un blanco mate minimalista, colocada sobre una superficie lisa de color gris claro. La cámara gira lentamente 360 grados alrededor de la tetera. Estilo: Comercial de producto limpio, iluminación de estudio, sombras suaves, lente macro, enfoque extremadamente nítido, sin distracciones de fondo."

Mi experiencia: Este fue simplemente... aceptable. No particularmente impresionante. El modelo me dio la interpretación más básica y literal del prompt. Pedí una tetera "de alta gama y bellamente diseñada", y me dio una tetera de cerámica simple y de aspecto tradicional. El ángulo de la cámara era correcto, pero la superficie era blanca en lugar del gris claro que había especificado. ¿Cómo se equivoca en eso con un prompt tan simple?
Lo que realmente me molestó fue el enfoque. Pedí específicamente "enfoque extremadamente nítido", pero la tetera estaba borrosa, con bordes poco limpios, como si fuera parte del fondo. Para un comercial de producto, eso no tiene sentido. Para empeorar las cosas, cuando la tetera giraba, el asa quedó cortada justo fuera del encuadre. El modelo ni siquiera pudo mantener completamente visible el único objeto en la toma. Para una demostración de producto, eso es un gran fracaso.
Lo que me gustó
Lo que no me gustó
Ángulo de cámara correcto y movimiento de rotación
El diseño de la tetera era simple y poco inspirado
La configuración del fondo y la iluminación era mayormente correcta
El video estaba borroso y desenfocado
La rotación de 360 grados fue fluida
El producto quedó cortado durante la rotación


Prompt #4: La prueba de acción y movimiento

Prompt utilizado: "Plano subjetivo (POV) en mano de alguien corriendo a través de un vibrante y concurrido mercado nocturno en Bangkok. La cámara tiembla mientras se abre paso entre la gente y los puestos de comida. El vapor sube de los woks, y coloridos faroles cuelgan en lo alto. SFX: una cacofonía de sonidos de mercado — gente hablando, comida chisporroteando, música distante. El corredor ocasionalmente mira por encima del hombro, respirando pesadamente. Estilo: Película de acción cruda, realista, inmersiva, con movimiento ligeramente borroso."

Mi experiencia: Esto no fue lo que esperaba, y de ninguna manera buena en absoluto. El video comenzó con un personaje gritando "¡Apártate del camino!" y un efecto de sonido aleatorio de un puñetazo, lo que inmediatamente lo convirtió en una escena de escape agresiva que nunca pedí. El mercado estaba lleno, pero algo estaba muy mal. Todos estaban de pie en líneas perfectamente rectas y ordenadas, y nadie se movía. ¿Has visto alguna vez un mercado concurrido que se vea así? Era completamente antinatural.
El corredor nunca miró por encima del hombro, una acción específica que solicité. El audio también era un desastre. El único sonido que estaba bien era la respiración pesada del corredor. El resto de los sonidos del mercado eran demasiado distantes y silenciosos, cuando deberían haber sido una cacofonía cercana e inmersiva. Los letreros eran una mezcla de tailandés y chino, haciendo que se sintiera como un "mercado asiático" genérico en lugar de específicamente Bangkok. Este simplemente gritaba "generado por AI".
Lo que me gustó
Lo que no me gustó
El sonido de la respiración del corredor era realista
Se añadieron diálogos y efectos de sonido no deseados
La sensación de cámara en mano estaba algo presente
La multitud era estática y completamente irreal
La iluminación y los colores del mercado eran vibrantes
El escenario se sentía genérico, no específicamente de Bangkok


La característica que lo cambia todo: audio nativo y sincronización labial

A pesar de los resultados inconsistentes en mis cuatro pruebas, el éxito del Prompt #1 realmente destaca por qué Veo 3 está recibiendo tanta atención. La calidad de la sincronización labial es donde genuinamente brilla. Cuando funciona, como lo hizo en mi prueba de la historiadora, el resultado es lo suficientemente convincente como para confundirlo con una grabación real. El modelo no solo hace coincidir los movimientos de la boca con las palabras; genera patrones de habla naturales con inflexiones, pausas y énfasis. También toma decisiones creativas sobre el audio, como elegir música de fondo sobre ruido ambiental cuando sirve mejor a la escena. Ese tipo de inteligencia de audio contextual es lo que marca la diferencia entre un clip que parece generado por AI y uno que realmente se sostiene.


Las partes molestas: límites diarios, renderizado lento y fallos extraños

Aquí es donde tengo que ser honesto sobre las frustraciones, porque hubo varias.
Los límites de generación diaria fueron un problema real. Después de generar solo dos videos en el plan Google AI Plus, me topé con un muro. Apareció este mensaje.
Captura de pantalla del mensaje de límite diario alcanzado

Aquí es donde el lenguaje impreciso de "más acceso" y "mayor acceso" en las páginas de los planes se convierte en un problema real. Tuve que actualizar nuevamente a Google AI Pro para continuar con mis pruebas. Eso son dos actualizaciones pagadas solo para ejecutar cuatro prompts.
Y luego están los fallos. La cara distorsionada en el reflejo del casco del astronauta, el planeta extra en el cielo, el diálogo añadido en la escena del mercado de Bangkok. Estos son los tipos de artefactos visuales y de audio que pueden hacer que un resultado por lo demás impresionante sea completamente inutilizable si lo que buscabas era realismo. Limitaciones de Veo 3 como estas vale la pena tenerlas en cuenta antes de comprometerse con un plan de pago.


¿Vale la pena el precio de Google Veo 3? Mi veredicto honesto

Después de estas rondas de pruebas, aquí es donde me posiciono sobre si Google Veo 3 vale la pena.
Para contenido con muchos diálogos, específicamente videos de cabeza parlante, entrevistas estilo documental o cualquier escena donde un personaje hable directamente a cámara, Veo 3 es una de las mejores herramientas disponibles en este momento. La calidad de sincronización labial y la generación de habla natural son genuinamente impresionantes y difíciles de igualar. Si ese es tu caso de uso principal, el plan Google AI Pro a $19.99 al mes es una inversión razonable.
Para todo lo demás, es más una apuesta. La prueba de demostración de producto fue decepcionante, la secuencia de acción fue un desastre y la prueba cinematográfica tuvo un fallo que hizo que el resultado fuera inutilizable. Los límites diarios son frustrantes, especialmente en los planes de nivel inferior, y los tiempos de renderizado ralentizan las cosas. Si eres un creador en solitario experimentando con video con AI, vale la pena probarlo. Si eres una agencia o equipo de producción que necesita resultados consistentes y confiables a escala, las limitaciones podrían superar los beneficios por ahora.
En resumen: Veo 3 es genuinamente impresionante en las condiciones adecuadas, pero aún no es el generador de video confiable y multiuso que sugieren las demos. Es una herramienta poderosa con un punto dulce específico, y conocer ese punto dulce antes de suscribirte te ahorrará mucha frustración.


Cómo Manus puede potenciar tu flujo de trabajo de video con AI

Generar clips es solo una parte del proceso. Un proyecto de video terminado requiere generar ideas, escribir guiones y prompts, organizar recursos y crear el contenido circundante — las publicaciones de blog, los subtítulos sociales y las descripciones de video que realmente hacen que tu contenido sea visto. Ahí es donde entra Manus.
Usé Manus a lo largo de este proceso de reseña: para planificar mi enfoque de pruebas, estructurar los cuatro prompts y consolidar mis notas y hallazgos en algo coherente antes de escribir. Tener una herramienta que te ayude a organizar tu pensamiento antes de poner palabras en una página marca una diferencia real, especialmente cuando estás manejando múltiples resultados de pruebas e intentando compararlos de manera justa. Si estás construyendo un flujo de trabajo de contenido de video, vale la pena tener un Agent de AI en tu esquina para el trabajo circundante. Puedes probar Manus gratis en manus.im.


Preguntas frecuentes

¿Cómo puedo obtener acceso a Google Veo 3?

Puedes acceder a Google Veo 3 a través de la aplicación Gemini suscribiéndote a uno de los planes de AI pagos de Google. El plan Google AI Plus ($7.99/mes) proporciona acceso limitado, mientras que el plan Google AI Pro ($19.99/mes) desbloquea la generación de video con Veo 3.1 Fast. El acceso completo con los límites más altos está disponible en el plan Google AI Ultra ($249.99/mes).

¿Hay una versión gratuita de Google Veo 3?

No hay una versión gratuita dedicada de Veo 3. El plan gratuito de Google AI tiene acceso muy limitado y no admite la generación directa de video a través de la aplicación Gemini. Los usuarios gratuitos pueden tener acceso limitado a través de Google Flow, pero para la generación práctica de video necesitarás un plan de pago.

¿Cuáles son las limitaciones de Google Veo 3?

Las principales limitaciones de Veo 3 incluyen límites de generación diaria (incluso en planes de pago), tiempos de renderizado lentos de alrededor de 3-5 minutos por clip, una duración máxima de video de 8 segundos, fallos visuales ocasionales e inconsistencias, y dificultad con escenas complejas de múltiples elementos. La consistencia de objetos en tomas de producto y el comportamiento de personajes en secuencias de acción también son áreas donde puede fallar.

¿Puede Google Veo 3 crear videos más largos de 8 segundos?

No, la versión actual de Google Veo 3 genera clips de hasta 8 segundos de duración. Para contenido más largo, necesitarías generar múltiples clips y editarlos juntos en una herramienta como Google Flow o un editor de video estándar.

¿Es Google Veo 3 mejor que Sora de OpenAI?

Depende de lo que necesites. Veo 3 tiene una clara ventaja en el realismo de diálogo y sincronización labial, lo que lo convierte en la mejor opción para contenido de cabeza parlante o estilo entrevista. Sora 2 generalmente funciona mejor para escenas narrativas más largas y tiene un comportamiento de personaje más consistente en prompts complejos. Para la mayoría de los creadores, la elección se reduce a tu caso de uso principal.

Descarga la aplicación de escritorio y móvil

Accede a Manus en cualquier momento y lugar.

Descarga la aplicación de escritorio y móvil de Manus