Manus 現已成為 Meta 的一部分——將 AI 帶給全球企業

其他·星期五, 3月 06

我測試了 Google Veo 3,這是我的誠實評測

作為 Manus 的內容撰寫人,測試新的 AI 工具基本上是工作描述的一部分。當 Google Veo 3 發布時,網路因其展示影片而集體瘋狂。逼真的說話頭像、同步音訊、電影級視覺效果,全部由一個文字提示詞生成。我已經見過足夠多的 AI 熱潮週期,知道展示影片是經過精心策劃的,而真實世界的結果則完全是另一回事。
所以我決定花些時間實際使用 Google Veo 3,透過四個不同的提示詞來測試其極限,並誠實地記錄下所有內容。
這不是 Google 的行銷材料摘要。這是一篇基於我真實體驗的 Google Veo 3 評測,包括讓我印象深刻的部分、讓我沮喪的部分以及完全無法運作的部分。讀完這篇文章後,你將確切知道 Veo 3 擅長什麼、它的不足之處、是否值得購買,以及它與競爭對手的比較。


什麼是 Google Veo 3?(以及 Veo 3.1 有哪些新功能?)

Google Veo 3 是一個先進的 AI 影片生成模型,可以透過一個文字提示詞創建高品質的影片片段。它支援同步對話、環境音效和背景音樂,全部由一個提示詞生成,並迅速建立了製作一些最逼真的 AI 生成說話頭像影片的聲譽。
Veo 3 於 2025 年中旬在 Google I/O 上首次宣布,並迅速成為當年最受關注的 AI 影片生成器之一。最近的更新 Veo 3.1 帶來了顯著的改進:更好的穩定性、更準確的唇同步、更一致的角色生成,以及支援 1080p 和 4K 的升級。它可以透過一些 Google 產品存取——Google Flow,一個專業級電影製作工具,專為編輯和排列更長、更複雜的場景而設計;以及 Google Whisk,一個專注於快速圖像到影片生成和短片的實驗工具。在這次評測中,我透過 Gemini 應用進行了測試,在那裡我只需選擇「創建影片」工具選項並執行所有四個提示詞。


我的實際測試過程

為了進行適當的測試,我不想只是簡單地輸入提示詞然後草草了事。我請 Manus 幫助我設計了四個具體的提示詞來評估不同的能力:對話和唇同步、電影氛圍、產品一致性以及快節奏動作。以下是實際過程。

我如何取得存取權限(以及你如何取得)

取得 Veo 3 的存取權限一開始確實有點令人困惑,我認為值得詳細說明,因為這是一個常見的痛點。
Gemini 免費账户介面截圖

我從免費账户開始。介面非常普通,與其他 AI 工具類似,有一個提示詞框和一些工具選項可供選擇。沒有任何影片生成選項可見。我還是嘗試輸入了我的第一個提示詞,看看會發生什麼。
Gemini 返回了一個圖像而不是影片截圖

我得到的是一個圖像,而不是影片。圖像實際上很令人印象深刻,與提示詞非常匹配,但顯然不是我要求的內容。我隨後嘗試明確要求 Gemini 為我創建一個影片,認為它可能只是誤解了我的意圖。我得到的回應是:「如果您升級訂閱,我今天可以為您創建該影片。」
升級提示截圖

於是我去查看了付費方案。
以下是每個方案提供的影片生成功能的目前細分:
方案
每月價格
AI 积分
Veo 3.1 存取權限
免費
$0
每日 50 积分
限制存取 Flow、Animate 和生成圖像
Google AI Plus
$7.99/月
每月 200 积分
更多存取 Flow 和 Whisk 上的圖像到影片生成
Google AI Pro
$19.99/月
每月 1,000 积分
更高存取 Flow 和 Whisk
Google AI Ultra
$249.99/月
每月 25,000 积分
最高存取 Flow 和 Whisk
方案中的措辭很模糊。Google AI Plus 說「更多存取 Veo 3 的圖像到影片創建」,而 Google AI Pro 說「更高存取」。並不完全清楚你實際會得到什麼。我首先選擇了 Google AI Plus,因為它是下一個等級,看起來可以滿足需求。付費、訂閱,開始吧!在 Plus 方案中,我可以看到「創建影片」選項的增加,這在免費方案中是不可用的。
Gemini Plus 方案中「創建影片」選項現在可見



我用來測試 Veo 3 極限的 4 個提示詞

以下是我設計的四個提示詞,用來測試 Veo 3 的不同能力:
1.對話和唇同步測試 — 評估核心原生音訊功能與同步對話。
2.電影和氛圍測試 — 評估其處理複雜視覺風格和鏡頭方向的能力。
3.產品和物體一致性測試 — 檢查它是否能生成乾淨、專業的產品影片。
4.動作和運動測試 — 查看它如何處理快速移動、動態鏡頭和分層音訊。


結果:4 個 Veo 3 影片範例(好的、不好的和有問題的)

提示詞 #1:對話和唇同步測試

使用的提示詞:「中景特寫鏡頭,一位 40 多歲的女性歷史學家,戴著眼鏡,坐在一個暖光照亮的圖書館裡。她直視鏡頭,用深思熟慮且引人入勝的語氣說話。她說:『大多數人沒有意識到羅馬帝國的崩潰並不是一個單一事件,而是一個緩慢、複雜的世紀解體過程。』環境噪音:翻書的輕微沙沙聲和圖書館空調的柔和嗡嗡聲。風格:紀錄片採訪,使用高品質數位相機拍攝。」

我的體驗: 好吧,這個真的讓我震驚了。過程非常順利,影片在幾分鐘內就準備好了。真實情況:在生成過程中,我切換到其他分頁做其他事情。當我回來看到輸出時,我真的以為螢幕上彈出了一個隨機廣告。它看起來如此逼真。歷史學家、燈光、語氣……一切都非常到位。她的講話自然流暢,帶有自然的語調、停頓和強調。她的面部表情和手勢?非常準確。真的達到了紀錄片採訪的水平。
唯一讓我覺得有點不對勁的是陽光中的浮塵顆粒,它們有點分散注意力。雖然我要求環境圖書館聲音,模型卻給了我一個微妙的背景音樂軌道。但說實話?這是一個聰明的執行決定。音樂非常符合紀錄片風格,甚至可能比我要求的更好。一個好的開始!
我喜歡的
我不喜歡的
極其逼真且自然的角色
陽光中的浮塵顆粒有點分散注意力
完美的唇同步和自然的語音語調
忽略了具體的環境聲音請求(但做出了不錯的選擇)
完美捕捉了紀錄片採訪風格



提示詞 #2:電影和氛圍測試

使用的提示詞:「鏡頭緩慢向後移動,揭示一個孤獨的太空人站在火星上的隕石坑邊緣。天空是塵土飛揚的紅橙色,有兩顆小月亮可見。荒涼而寂靜。風格:史詩科幻,4K,廣角鏡頭,極其詳細,令人敬畏且憂鬱的氛圍。」

我的體驗: 這個……表現參差不齊。首先吸引我注意的是太空人頭盔中的反射。我要求一個地球的微弱反射,但我得到的是一個奇怪的、扭曲的男人臉的碎片。它看起來完全不對勁,就像一個奇怪的故障,透明度和維度的層次都錯了。這應該是太空人自己的臉嗎?誰知道呢!它看起來就像被貼上去的一樣。
其他部分還不錯。太空衣、隕石坑、鏡頭移動都很扎實。塵土和沙霧的細節實際上非常逼真。但提示詞要求兩顆小月亮,而天空顯示的是三個不同大小的行星。頭盔中的故障臉是個遺憾,因為沒有它,這會很令人印象深刻。使用 AI 影片生成,有時會成功,有時會失敗。模型添加了太陽、星星和移動的霧氣,這些都很有效。額外的臉和行星?不太行。
我喜歡的
我不喜歡的
鏡頭移動執行得很好
頭盔反射中的扭曲臉是個重大故障
塵土和沙霧細節逼真
沒有遵循「兩顆月亮」的指示
很好地捕捉了荒涼、史詩科幻的氛圍
太空人的太空衣缺乏一些精細細節


提示詞 #3:產品和物體一致性測試

使用的提示詞:「高端、設計精美的陶瓷茶壺的旋轉鏡頭。茶壺是極簡主義的霧面白色,放在一個簡單的淺灰色表面上。鏡頭緩慢地圍繞茶壺旋轉 360 度。風格:乾淨的產品廣告,工作室燈光,柔和的陰影,微距鏡頭,極其清晰的焦點,沒有背景干擾。」

我的體驗: 這個只是……還可以。沒有特別令人印象深刻。模型給了我提示詞最基本、最字面化的解釋。我要求一個「高端、設計精美」的茶壺,它給了我一個普通的、傳統外觀的陶瓷壺。鏡頭角度是對的,但表面是白色而不是我指定的淺灰色。如此簡單的提示詞怎麼會出錯?
真正讓我困擾的是焦點。我明確要求「極其清晰的焦點」,但茶壺是模糊的,邊緣不乾淨,彷彿是背景的一部分。對於產品廣告來說,這毫無意義。更糟糕的是,當茶壺旋轉時,手柄被完全切出了畫面。模型甚至無法讓唯一的物體在鏡頭中完全可見。對於產品演示來說,這是一個巨大的失敗。
我喜歡的
我不喜歡的
正確的鏡頭角度和旋轉運動
茶壺設計普通且缺乏靈感
背景和燈光設置大致正確
影片模糊且焦點不清晰
360 度旋轉平穩
產品在旋轉過程中被切出畫面


提示詞 #4:動作和運動測試

使用的提示詞:「手持 POV 鏡頭,某人穿過曼谷擁擠、充滿活力的夜市奔跑。鏡頭隨著他們在人群和食品攤之間穿梭而搖晃。蒸汽從炒鍋中升起,彩色燈籠懸掛在頭頂。音效:市場聲音的喧囂——人們交談、食物煎炸、遠處的音樂。跑步者偶爾回頭看,喘著粗氣。風格:粗糙的動作電影,真實、沉浸式、略微模糊的運動。」

我的體驗: 這完全不是我預期的,而且完全不是好的方面。影片開頭有一個角色喊著「讓開!」和一個隨機的拳擊音效,這立即將其變成了一個我從未要求的激烈逃跑場景。市場很擁擠,但有些地方非常不對勁。每個人都站得非常直,整齊地排成隊,沒有人移動。你見過這樣的繁忙市場嗎?完全不自然。
跑步者從未回頭看,這是我明確要求的一個動作。音訊也很混亂。唯一正確的聲音是跑步者的喘氣聲。其他市場聲音太遠且太安靜,而它們應該是近距離且沉浸式的喧囂。標誌是泰語和中文的混合,使其感覺像一個通用的「亞洲市場」,而不是具體的曼谷。這一段完全顯得「AI 生成」。
我喜歡的
我不喜歡的
跑步者的喘氣聲音很真實
添加了不需要的對話和音效
手持鏡頭感稍微存在
人群靜止且完全不真實
市場的燈光和顏色很鮮豔
場景感覺通用,而不是具體的曼谷


改變一切的功能:原生音訊和唇同步

儘管我的四次測試結果不一致,但提示詞 #1 的成功確實突出了 Veo 3 為什麼會受到如此多關注。唇同步品質是它真正的亮點。當它運作時,就像我的歷史學家測試一樣,結果令人信服到可以被誤認為是真實的鏡頭。模型不僅將嘴部動作與單字匹配,還生成了帶有語調、停頓和強調的自然語音模式。它還對音訊做出了創造性的決策,比如在場景需要時選擇背景音樂而不是環境噪音。這種上下文音訊智慧是區分看起來像 AI 生成的剪輯與真正能夠經得起考驗的剪輯的關鍵。


令人煩惱的部分:每日限制、緩慢渲染和奇怪的故障

以下是我必須誠實面對的挫折,因為確實有幾個。
每日生成限制是一個真正的問題。在 Google AI Plus 方案中生成了兩個影片後,我就遇到了瓶頸。出現了這條訊息。
每日限制訊息截圖

這就是方案頁面上模糊的「更多存取」和「更高存取」用語成為真正問題的地方。我不得不再次升級到 Google AI Pro 才能繼續我的測試。這是兩次付費升級,僅僅為了執行四個提示詞。
然後是故障。太空人頭盔反射中的扭曲臉、天空中的額外行星、曼谷市場場景中添加的對話。這些是視覺和音訊瑕疵,可以使原本令人印象深刻的輸出完全無法使用,如果你追求的是逼真效果的話。像這樣的 Veo 3 限制在訂閱付費方案之前值得注意。


Google Veo 3 值得購買嗎?我的誠實結論

經過這些輪測試後,我對 Google Veo 3 是否值得購買的看法如下。
對於以對話為主的內容,特別是說話頭像影片、紀錄片風格的採訪或任何角色直接對鏡頭說話的場景,Veo 3 是目前最好的工具之一。唇同步品質和自然語音生成確實令人印象深刻且難以匹敵。如果這是你的主要使用場景,Google AI Pro 方案每月 $19.99 是一個合理的投資。
對於其他所有內容,這更像是一場賭博。產品演示測試令人失望,動作場景一團糟,電影測試有一個故障使輸出無法使用。每日限制令人沮喪,特別是在低階方案中,渲染時間也拖慢了進度。如果你是一個獨立創作者在嘗試 AI 影片,這值得一試。如果你是一個需要一致、可靠結果的代理機構或製作團隊,這些限制可能會超過目前的好處。
底線:Veo 3 在合適的條件下確實令人印象深刻,但它還不是展示影片所暗示的可靠、全能的影片生成器。它是一個強大的工具,有一個特定的優勢點,在訂閱之前了解這個優勢點可以為你節省很多挫折。


Manus 如何助力你的 AI 影片工作流程

生成剪輯只是過程的一部分。一個完整的影片專案需要腦力激盪想法、編寫腳本和提示詞、組織資產,以及創建周邊內容——部落格文章、社群標題和影片描述,這些內容實際上讓你的內容被看到。這就是 Manus 的作用。
在整個評測過程中,我使用了 Manus:來規劃我的測試方法、結構化四個提示詞,並將我的筆記和發現整合成一個連貫的內容再進行撰寫。在你處理多個測試輸出並嘗試公平比較時,有一個幫助你在寫作之前組織思路的工具確實會有所不同。如果你正在建構一個影片內容工作流程,值得擁有一個 AI Agent 來處理周邊工作。你可以在 manus.im 免費試用 Manus。


常見問題

我如何取得 Google Veo 3 的存取權限?

你可以透過訂閱 Google 的付費 AI 方案,透過 Gemini 應用存取 Google Veo 3。Google AI Plus 方案($7.99/月)提供有限存取權限,而 Google AI Pro 方案($19.99/月)解鎖 Veo 3.1 快速影片生成功能。最高限制的完整存取權限可透過 Google AI Ultra 方案($249.99/月)取得。

Google Veo 3 有免費版本嗎?

Veo 3 沒有專門的免費版本。免費的 Google AI 方案存取非常有限,並且不支援透過 Gemini 應用直接影片生成。免費使用者可能透過 Google Flow 有有限存取權限,但對於實際的影片生成,你需要一個付費方案。

Google Veo 3 的限制是什麼?

Veo 3 的主要限制包括每日生成限制(即使在付費方案中)、渲染時間緩慢(每個剪輯約 3-5 分鐘)、最大影片長度為 8 秒、偶爾的視覺故障和不一致,以及處理複雜多元素場景的困難。產品鏡頭中的物體一致性和動作場景中的角色行為也是它可能不足的領域。

Google Veo 3 能生成超過 8 秒的影片嗎?

不能,目前版本的 Google Veo 3 生成的剪輯最長為 8 秒。對於更長的內容,你需要生成多個剪輯並在 Google Flow 或標準影片編輯器中將它們編輯在一起。

Google Veo 3 比 OpenAI 的 Sora 更好嗎?

這取決於你的需求。Veo 3 在對話和唇同步逼真度方面有明顯優勢,使其成為說話頭像或採訪風格內容的更好選擇。Sora 2 通常在更長的敘事場景中表現更好,並且在複雜提示詞中的角色行為更一致。對於大多數創作者來說,選擇取決於你的主要使用場景。

下載桌面端和行動端應用程式

隨時隨地存取 Manus。

下載 Manus 的桌面端和行動端應用程式