Manus agora faz parte de Meta — levando IA para empresas em todo o mundo

Outro·sexta-feira, março 06

Testei o Google Veo 3 e Aqui Está Minha Análise Honesta

Como redator de conteúdo na Manus, testar novas ferramentas de AI faz parte da descrição do trabalho. Quando o Google Veo 3 foi lançado, a internet coletivamente perdeu a cabeça com as demos. Cabeças falantes realistas, áudio sincronizado, visuais cinematográficos, tudo a partir de um único prompt de texto. Já vi ciclos de hype de AI o suficiente para saber que demos são curadas e resultados no mundo real são uma história completamente diferente.
Então decidi passar algum tempo usando de verdade o Google Veo 3, testando-o com quatro prompts distintos projetados para levá-lo ao limite, e documentando tudo honestamente.
Isto não é um resumo dos materiais de marketing do Google. Esta é uma análise prática do Google Veo 3 baseada na minha experiência real, incluindo as partes que me impressionaram, as partes que me frustraram e as partes que simplesmente não funcionaram. Ao final deste artigo, você saberá exatamente no que o Veo 3 é bom, onde ele deixa a desejar, se vale o preço e como ele se compara à concorrência.


O que é o Google Veo 3? (E o que há de novo no Veo 3.1?)

O Google Veo 3 é um modelo avançado de geração de vídeo por AI que cria clipes de vídeo de alta qualidade a partir de um único prompt de texto. Ele suporta diálogo sincronizado, efeitos sonoros ambientes e música de fundo, tudo a partir de um único prompt, e rapidamente construiu uma reputação de produzir algumas das imagens de cabeça-falante geradas por AI mais realistas que existem.
O Veo 3 foi anunciado pela primeira vez no Google I/O por volta de meados de 2025 e rapidamente se tornou um dos geradores de vídeo por AI mais comentados do ano. A atualização mais recente, o Veo 3.1, trouxe melhorias significativas: melhor estabilidade, sincronização labial mais precisa, geração de personagens mais consistente e upscaling para 1080p e 4K. Ele é acessível através de alguns produtos do Google — Google Flow, uma ferramenta profissional de cinema feita para edição e sequenciamento de cenas mais longas e complexas, e Google Whisk, uma ferramenta experimental focada em geração rápida de imagem-para-vídeo e clipes curtos. Para esta análise, testei pelo aplicativo Gemini, onde simplesmente selecionei a opção "Create video" e rodei todos os quatro prompts de lá.


Meu processo prático de testes

Para dar um teste adequado, eu não queria apenas jogar prompts simples e dar por encerrado. Pedi à Manus que me ajudasse a projetar quatro prompts específicos para avaliar diferentes capacidades: diálogo e sincronização labial, atmosfera cinematográfica, consistência de produto e ação em ritmo acelerado. Aqui está como esse processo realmente aconteceu.

Como consegui acesso (e como você também pode)

Conseguir acesso ao Veo 3 é honestamente um pouco confuso no começo, e acho que vale a pena explicar porque é um ponto de dor comum.
Captura de tela da interface de conta gratuita do Gemini

Comecei com a conta gratuita. A interface é bem genérica, similar a outras ferramentas de AI, com uma caixa de prompt e alguns botões de ferramenta para escolher. Não havia nenhuma opção de geração de vídeo visível em lugar algum. Tentei inserir meu primeiro prompt mesmo assim, só para ver o que aconteceria.
Captura de tela do Gemini retornando uma imagem em vez de vídeo

O que recebi de volta foi uma imagem, não um vídeo. A imagem foi realmente impressionante e combinou bem com o prompt, mas claramente não era o que eu havia pedido. Em seguida, pedi explicitamente ao Gemini para criar um vídeo para mim, pensando que talvez ele tivesse interpretado mal minha intenção. A resposta que recebi foi: "Posso criar esse vídeo para você hoje se você fizer upgrade da sua assinatura."
Captura de tela do prompt de upgrade

Então fui dar uma olhada nos planos pagos.
Aqui está o resumo atual do que cada plano oferece para geração de vídeo:
Plano
Preço mensal
Créditos de AI
Acesso ao Veo 3.1
Free
$0
50 créditos diários
Acesso limitado ao Flow, Animate e geração de imagens
Google AI Plus
$7.99/mês
200 créditos mensais
Mais acesso ao Flow e geração de imagem-para-vídeo no Whisk
Google AI Pro
$19.99/mês
1.000 créditos mensais
Maior acesso ao Flow e Whisk
Google AI Ultra
$249.99/mês
25.000 créditos mensais
Acesso máximo ao Flow e Whisk
A redação dos planos é vaga. O Google AI Plus diz "mais acesso à criação de imagem-para-vídeo com o Veo 3" e o Google AI Pro diz "maior acesso". Não é exatamente claro o que você realmente está recebendo. Escolhi o Google AI Plus primeiro, já que era o próximo nível acima e parecia que daria conta. Paguei, assinei, e vamos lá! No plano Plus, pude ver a adição da opção "Create Video" que anteriormente não estava disponível no plano gratuito.
Plano Gemini Plus com a opção "Create Video" agora visível



Os 4 prompts que usei para testar os limites do Veo 3

Aqui estão os quatro prompts que montei para testar diferentes aspectos das capacidades do Veo 3:
1.O teste de diálogo e sincronização labial — Para avaliar o recurso principal de áudio nativo com diálogo sincronizado.
2.O teste cinematográfico e atmosférico — Para avaliar como ele lida com estilos visuais complexos e direção de câmera.
3.O teste de consistência de produto e objeto — Para verificar se ele consegue produzir vídeos de produto limpos e profissionais.
4.O teste de ação e movimento — Para ver como ele lida com movimento rápido, trabalho dinâmico de câmera e áudio em camadas.


Os resultados: 4 exemplos de vídeo do Veo 3 (o bom, o ruim e o bugado)

Prompt #1: O teste de diálogo e sincronização labial

Prompt usado: "Medium close-up shot of a female historian in her 40s, with glasses, sitting in a warmly lit library. She looks directly at the camera, speaking with a thoughtful and engaging tone. She says, 'What most people don't realize about the Roman Empire is that its collapse wasn't a single event, but a slow, complex unraveling over centuries.' Ambient noise: the quiet rustle of turning pages and the soft hum of library air conditioning. Style: Documentary interview, shot on a high-quality digital camera."

Minha experiência: Ok, fiquei genuinamente impressionado com este. O processo foi tranquilo, e o vídeo ficou pronto em minutos. Verdade: enquanto ele estava sendo gerado, mudei de aba para fazer outras coisas. Quando voltei e vi o resultado, na verdade pensei que um anúncio aleatório tinha aparecido na minha tela. Parecia tão realista. A historiadora, a iluminação, o tom... tudo foi acertado. Ela falava com entonações naturais, pausas e ênfases. Suas expressões faciais e gestos com as mãos? Perfeitos. Foi genuinamente digno de uma entrevista de documentário.
As únicas coisas que pareceram um pouco estranhas foram as partículas de poeira agressivas flutuando na luz do sol, que distraíam um pouco. E embora eu tenha pedido sons ambientes de biblioteca, o modelo me deu uma trilha sutil de música de fundo em vez disso. Mas honestamente? Foi uma decisão executiva inteligente. A música combinou perfeitamente com o estilo documentário, talvez até melhor do que o que eu havia pedido. Que começo!
O que gostei
O que não gostei
Personagem incrivelmente realista e de aparência natural
Partículas de poeira na luz solar distraíam um pouco
Sincronização labial perfeita com entonações naturais da fala
Ignorou o pedido específico de som ambiente (mas fez uma boa escolha)
Capturou perfeitamente o estilo de entrevista documental



Prompt #2: O teste cinematográfico e atmosférico

Prompt usado: "Dolly shot moving slowly backwards, revealing a lone astronaut standing on the ridge of a crater on Mars. The sky is a dusty, reddish-orange with two small moons visible. The desolate and silent. Style: Epic science fiction, 4K, wide-angle lens, extremely detailed, awe-inspiring and melancholic mood."

Minha experiência: Este foi... um saco de sentimentos mistos. A primeira coisa que chamou minha atenção foi o reflexo no capacete do astronauta. Eu havia pedido um leve reflexo da Terra, mas o que recebi foi uma estranha e distorcida fatia do rosto de um homem. Parecia completamente errado, como um bug bizarro onde as camadas de transparência e dimensões estavam todas erradas. Isso deveria ser o próprio rosto do astronauta? Quem sabe! Simplesmente parecia colado.
Todo o resto não foi ruim. A roupa, a cratera, o movimento da câmera, tudo sólido. Os detalhes de poeira e neblina de areia eram na verdade super realistas. Mas o prompt pediu duas pequenas luas, e o céu mostrava o que pareciam três planetas de tamanhos diferentes. É uma pena pelo rosto bugado, porque sem isso, este teria sido impressionante. Com geração de vídeo por AI, você ganha algumas, perde outras. O modelo adicionou um sol, estrelas e neblina em movimento, o que funcionou. O rosto extra e o planeta? Nem tanto.
O que gostei
O que não gostei
Boa execução do movimento de câmera em dolly
Grande bug com o rosto distorcido no reflexo do capacete
Detalhes realistas de poeira e neblina de areia
Não seguiu a instrução das "duas luas"
Capturou bem o clima desolado e épico de ficção científica
A roupa do astronauta faltou alguns detalhes finos


Prompt #3: O teste de consistência de produto e objeto

Prompt usado: "Turntable shot of a high-end, beautifully designed ceramic teapot. The teapot is a minimalist matte white, sitting on a plain, light grey surface. The camera slowly rotates 360 degrees around the teapot. Style: Clean product commercial, studio lighting, soft shadows, macro lens, extremely sharp focus, no background distractions."

Minha experiência: Este foi apenas... ok. Não particularmente impressionante. O modelo me deu a interpretação mais básica e literal do prompt. Pedi um bule "sofisticado, lindamente projetado", e ele me deu um bule de cerâmica simples, de aparência tradicional. O ângulo da câmera estava certo, mas a superfície era branca em vez do cinza claro que eu havia especificado. Como ele erra isso com um prompt tão simples?
O que realmente me incomodou foi o foco. Pedi especificamente "foco extremamente nítido", mas o bule estava borrado, com bordas sujas, como se fizesse parte do fundo. Para um comercial de produto, isso não faz sentido. Para piorar, quando o bule girou, a alça foi cortada bem do enquadramento. O modelo não conseguiu nem manter o único objeto da cena totalmente visível. Para uma demonstração de produto, isso é um grande fracasso.
O que gostei
O que não gostei
Ângulo de câmera e movimento de rotação corretos
Design do bule era simples e sem inspiração
Configuração de fundo e iluminação estava quase toda correta
Vídeo estava borrado e fora de foco
A rotação de 360 graus foi suave
O produto foi cortado durante a rotação


Prompt #4: O teste de ação e movimento

Prompt usado: "Handheld POV shot of someone running through a crowded, vibrant night market in Bangkok. The camera is shaky as they weave between people and food stalls. Steam rises from woks, and colorful lanterns hang overhead. SFX: a cacophony of market sounds — people talking, food sizzling, distant music. The runner occasionally glances over their shoulder, breathing heavily. Style: Gritty action movie, realistic, immersive, slightly blurred motion."

Minha experiência: Este não foi o que eu esperava, e não no bom sentido. O vídeo começou com um personagem gritando "Saia do caminho!" e um efeito sonoro aleatório de soco, o que imediatamente o transformou em uma cena agressiva de fuga que eu nunca havia pedido. O mercado estava lotado, mas algo estava muito errado. Todos estavam em pé em filas perfeitamente retas e ordenadas, e ninguém estava se movendo. Você já viu um mercado movimentado parecido com aquilo? Era completamente não natural.
O corredor nunca olhou por cima do ombro, uma ação específica que pedi. O áudio também estava uma bagunça. O único som que estava certo era a respiração pesada do corredor. O resto dos sons do mercado estava muito distante e silencioso, quando deveriam ser uma cacofonia próxima e imersiva. As placas eram uma mistura de tailandês e chinês, fazendo parecer um "mercado asiático" genérico em vez de especificamente Bangkok. Este simplesmente gritava "gerado por AI".
O que gostei
O que não gostei
O som da respiração do corredor era realista
Diálogos e efeitos sonoros indesejados foram adicionados
A sensação de câmera na mão estava um pouco presente
A multidão era estática e completamente irrealista
A iluminação e as cores do mercado eram vibrantes
O cenário pareceu genérico, não específico de Bangkok


O recurso que muda tudo: áudio nativo e sincronização labial

Apesar dos resultados inconsistentes ao longo dos meus quatro testes, o sucesso do Prompt #1 realmente destaca por que o Veo 3 está recebendo tanta atenção. A qualidade da sincronização labial é onde ele genuinamente brilha. Quando funciona, como aconteceu no meu teste da historiadora, o resultado é convincente o suficiente para ser confundido com filmagem real. O modelo não apenas combina os movimentos da boca com as palavras; ele gera padrões naturais de fala com entonações, pausas e ênfases. Ele também toma decisões criativas sobre áudio, como escolher música de fundo em vez de ruído ambiente quando isso serve melhor à cena. Esse tipo de inteligência contextual de áudio é o que faz a diferença entre um clipe que parece gerado por AI e um que realmente se sustenta.


As partes chatas: limites diários, renderização lenta e bugs estranhos

Aqui é onde tenho que ser honesto sobre as frustrações, porque houve várias.
Os limites diários de geração foram um problema real. Depois de gerar apenas dois vídeos no plano Google AI Plus, bati em uma parede. Esta mensagem apareceu.
Captura de tela da mensagem de limite diário atingido

É aqui que a linguagem vaga de "mais acesso" e "maior acesso" nas páginas dos planos se torna um problema real. Tive que fazer upgrade novamente para o Google AI Pro para continuar meus testes. São dois upgrades pagos só para rodar quatro prompts.
E depois há os bugs. O rosto distorcido no reflexo do capacete do astronauta, o planeta extra no céu, o diálogo adicionado na cena do mercado de Bangkok. Esses são os tipos de artefatos visuais e de áudio que podem tornar um resultado impressionante completamente inutilizável se realismo for o que você estava buscando. Limitações do Veo 3 como essas valem a pena serem lembradas antes de se comprometer com um plano pago.


O Google Veo 3 vale o preço? Meu veredito honesto

Após essas rodadas de testes, aqui está onde cheguei sobre se o Google Veo 3 vale a pena.
Para conteúdo pesado em diálogo, especificamente vídeos de cabeça-falante, entrevistas em estilo documentário ou qualquer cena onde um personagem fale diretamente à câmera, o Veo 3 é uma das melhores ferramentas disponíveis agora. A qualidade da sincronização labial e da geração de fala natural são genuinamente impressionantes e difíceis de igualar. Se esse for seu caso de uso principal, o plano Google AI Pro a $19.99 por mês é um investimento razoável.
Para tudo mais, é mais uma aposta. O teste de demonstração de produto foi decepcionante, a sequência de ação foi uma bagunça, e o teste cinematográfico teve um bug que tornou o resultado inutilizável. Os limites diários são frustrantes, especialmente nos planos de nível mais baixo, e os tempos de renderização atrasam as coisas. Se você é um criador solo experimentando com vídeo por AI, vale a pena tentar. Se você é uma agência ou equipe de produção que precisa de resultados consistentes e confiáveis em escala, as limitações podem superar os benefícios por enquanto.
A conclusão: o Veo 3 é genuinamente impressionante nas condições certas, mas ainda não é o gerador de vídeo confiável e de uso geral que as demos sugerem. É uma ferramenta poderosa com um nicho específico, e conhecer esse nicho antes de assinar vai te poupar muita frustração.


Como a Manus pode turbinar seu fluxo de trabalho de vídeo com AI

Gerar clipes é apenas uma parte do processo. Um projeto de vídeo finalizado exige brainstorming de ideias, escrita de roteiros e prompts, organização de ativos e criação do conteúdo ao redor — os posts de blog, legendas sociais e descrições de vídeo que efetivamente fazem seu conteúdo ser visto. É aí que entra a Manus.
Usei a Manus ao longo desse processo de análise: para planejar minha abordagem de testes, estruturar os quatro prompts e consolidar minhas anotações e descobertas em algo coerente antes de escrever. Ter uma ferramenta que ajuda a organizar seu pensamento antes de colocar palavras em uma página faz uma diferença real, especialmente quando você está equilibrando múltiplos resultados de teste e tentando compará-los de forma justa. Se você está construindo um fluxo de trabalho de conteúdo de vídeo, vale a pena ter um Agent de AI do seu lado para o trabalho ao redor. Você pode experimentar a Manus gratuitamente em manus.im.


Perguntas frequentes

Como posso obter acesso ao Google Veo 3?

Você pode acessar o Google Veo 3 através do aplicativo Gemini assinando um dos planos pagos de AI do Google. O plano Google AI Plus ($7.99/mês) oferece acesso limitado, enquanto o plano Google AI Pro ($19.99/mês) desbloqueia a geração de vídeo com o Veo 3.1 Fast. O acesso completo com os limites mais altos está disponível no plano Google AI Ultra ($249.99/mês).

Existe uma versão gratuita do Google Veo 3?

Não existe uma versão gratuita dedicada do Veo 3. O plano gratuito Google AI tem acesso muito limitado e não suporta geração direta de vídeo através do aplicativo Gemini. Usuários gratuitos podem ter acesso limitado via Google Flow, mas para geração prática de vídeo você precisará de um plano pago.

Quais são as limitações do Google Veo 3?

As principais limitações do Veo 3 incluem limites diários de geração (mesmo em planos pagos), tempos de renderização lentos de cerca de 3-5 minutos por clipe, comprimento máximo de vídeo de 8 segundos, bugs visuais e inconsistências ocasionais, e dificuldade com cenas complexas de múltiplos elementos. A consistência de objetos em tomadas de produto e o comportamento de personagens em sequências de ação também são áreas onde ele pode deixar a desejar.

O Google Veo 3 pode criar vídeos com mais de 8 segundos?

Não, a versão atual do Google Veo 3 gera clipes de até 8 segundos de duração. Para conteúdo mais longo, você precisaria gerar múltiplos clipes e editá-los juntos em uma ferramenta como o Google Flow ou um editor de vídeo padrão.

O Google Veo 3 é melhor que o Sora da OpenAI?

Depende do que você precisa. O Veo 3 tem uma vantagem clara no realismo de diálogo e sincronização labial, tornando-o a melhor escolha para conteúdo de cabeça-falante ou estilo de entrevista. O Sora 2 geralmente tem melhor desempenho para cenas narrativas mais longas e tem um comportamento de personagem mais consistente em prompts complexos. Para a maioria dos criadores, a escolha depende do seu caso de uso principal.

Baixe o aplicativo para desktop e móvel

Acesse o Manus a qualquer hora, em qualquer lugar.

Baixe o aplicativo de desktop e móvel do Manus