Tôi đã thử nghiệm Google Veo 3 và đây là bài đánh giá trung thực của tôi

Là một người viết nội dung tại Manus, việc thử nghiệm các công cụ AI mới về cơ bản là một phần trong mô tả công việc. Khi Google Veo 3 ra mắt, cộng đồng mạng đã phát cuồng vì các bản demo. Những cái đầu biết nói chân thực, âm thanh đồng bộ, hình ảnh điện ảnh, tất cả chỉ từ một câu lệnh văn bản duy nhất. Tôi đã chứng kiến đủ các chu kỳ cường điệu về AI để biết rằng các bản demo được chọn lọc kỹ và kết quả thực tế lại là một câu chuyện hoàn toàn khác.
Vì vậy, tôi đã quyết định dành thời gian thực sự sử dụng Google Veo 3, chạy nó qua bốn câu lệnh khác nhau được thiết kế để đẩy giới hạn của nó, và ghi lại mọi thứ một cách trung thực.
Đây không phải là bản tóm tắt tài liệu tiếp thị của Google. Đây là một bài đánh giá Google Veo 3 thực tế dựa trên trải nghiệm thật của tôi, bao gồm những phần làm tôi ấn tượng, những phần làm tôi bực bội, và những phần đơn giản là không hoạt động. Đến cuối bài viết này, bạn sẽ biết chính xác Veo 3 giỏi ở đâu, nó còn thiếu sót ở đâu, liệu nó có đáng giá hay không, và nó so sánh với các đối thủ như thế nào.
Google Veo 3 là gì? (Và có gì mới trong Veo 3.1?)
Google Veo 3 là một mô hình tạo video AI tiên tiến, tạo ra các đoạn video chất lượng cao từ một câu lệnh văn bản duy nhất. Nó hỗ trợ đối thoại đồng bộ, hiệu ứng âm thanh môi trường, và nhạc nền, tất cả chỉ từ một câu lệnh, và đã nhanh chóng tạo dựng được danh tiếng về việc tạo ra một số đoạn phim nói chuyện do AI tạo ra chân thực nhất hiện nay.
Veo 3 lần đầu tiên được công bố tại Google I/O vào khoảng giữa năm 2025 và nhanh chóng trở thành một trong những trình tạo video AI được bàn luận nhiều nhất trong năm. Bản cập nhật gần đây nhất, Veo 3.1, đã mang lại những cải tiến đáng kể: độ ổn định tốt hơn, đồng bộ khẩu hình chính xác hơn, tạo nhân vật nhất quán hơn, và nâng cấp lên 1080p và 4K. Nó có thể truy cập thông qua một số sản phẩm của Google — Google Flow, một công cụ làm phim chuyên nghiệp được xây dựng để chỉnh sửa và sắp xếp các cảnh dài, phức tạp hơn, và Google Whisk, một công cụ thử nghiệm tập trung vào việc tạo video từ hình ảnh nhanh chóng và các đoạn clip ngắn. Đối với bài đánh giá này, tôi đã thử nghiệm thông qua ứng dụng Gemini, nơi tôi chỉ cần chọn tab công cụ "Create video" và chạy tất cả bốn câu lệnh từ đó.
Quy trình thử nghiệm thực tế của tôi
Để đánh giá một cách đúng đắn, tôi không muốn chỉ đưa ra những câu lệnh đơn giản rồi kết thúc. Tôi đã nhờ Manus giúp tôi thiết kế bốn câu lệnh cụ thể để đánh giá các khả năng khác nhau: đối thoại và đồng bộ khẩu hình, không khí điện ảnh, tính nhất quán của sản phẩm, và hành động nhịp độ nhanh. Đây là cách quá trình đó thực sự diễn ra.
Cách tôi có quyền truy cập (và bạn cũng có thể)
Nói thật, việc có quyền truy cập vào Veo 3 ban đầu khá rối rắm, và tôi nghĩ điều này đáng để trình bày vì nó là một vấn đề gây khó chịu phổ biến.

Tôi bắt đầu với tài khoản miễn phí. Giao diện khá chung chung, tương tự các công cụ AI khác, với một ô nhập câu lệnh và một số tab công cụ để lựa chọn. Không có tùy chọn tạo video nào được hiển thị ở bất kỳ đâu. Dù vậy, tôi vẫn thử nhập câu lệnh đầu tiên của mình, chỉ để xem điều gì sẽ xảy ra.

Cái mà tôi nhận lại là một hình ảnh, không phải video. Hình ảnh thực sự ấn tượng và khớp với câu lệnh, nhưng rõ ràng không phải thứ tôi yêu cầu. Sau đó tôi thử yêu cầu Gemini rõ ràng tạo video cho tôi, nghĩ rằng có thể nó chỉ hiểu sai ý định của tôi. Phản hồi tôi nhận được là: "Tôi có thể tạo video đó cho bạn hôm nay nếu bạn nâng cấp gói đăng ký."

Vì vậy, tôi đã đi xem xét các gói trả phí.
Đây là bảng phân tích hiện tại về những gì mỗi gói cung cấp cho việc tạo video:
Gói | Giá hàng tháng | Credits AI | Truy cập Veo 3.1 |
Free | $0 | 50 credits mỗi ngày | Truy cập hạn chế vào Flow, Animate và tạo hình ảnh |
Google AI Plus | $7.99/tháng | 200 credits hàng tháng | Truy cập nhiều hơn vào Flow và tạo video từ hình ảnh trên Whisk |
Google AI Pro | $19.99/tháng | 1,000 credits hàng tháng | Quyền truy cập cao hơn vào Flow và Whisk |
Google AI Ultra | $249.99/tháng | 25,000 credits hàng tháng | Quyền truy cập cao nhất vào Flow và Whisk |
Cách diễn đạt trên các gói khá mơ hồ. Google AI Plus nói "truy cập nhiều hơn vào việc tạo video từ hình ảnh với Veo 3" và Google AI Pro nói "truy cập cao hơn". Không rõ ràng lắm về những gì bạn thực sự nhận được. Tôi đã chọn Google AI Plus trước, vì nó là gói cao hơn tiếp theo và có vẻ sẽ đủ dùng. Thanh toán, đăng ký, và bắt đầu thôi! Trên gói Plus, tôi có thể thấy tùy chọn "Create Video" đã được thêm vào, trước đây không có sẵn trên gói miễn phí.

4 câu lệnh tôi đã dùng để thử nghiệm giới hạn của Veo 3
Đây là bốn câu lệnh tôi đã soạn để thử nghiệm các khía cạnh khác nhau trong khả năng của Veo 3:
1.Thử nghiệm đối thoại và đồng bộ khẩu hình — Để đánh giá tính năng âm thanh gốc cốt lõi với đối thoại đồng bộ.
2.Thử nghiệm điện ảnh và không khí — Để đánh giá mức độ xử lý các phong cách hình ảnh phức tạp và chỉ đạo camera.
3.Thử nghiệm tính nhất quán của sản phẩm và đồ vật — Để kiểm tra liệu nó có thể tạo ra video sản phẩm sạch sẽ, chuyên nghiệp hay không.
4.Thử nghiệm hành động và chuyển động — Để xem nó xử lý chuyển động nhanh, công việc camera động, và âm thanh nhiều lớp như thế nào.
Kết quả: 4 ví dụ video Veo 3 (Điều tốt, điều xấu và những lỗi kỳ lạ)
Câu lệnh #1: Thử nghiệm đối thoại và đồng bộ khẩu hình
Câu lệnh đã dùng: "Cảnh quay trung cận của một nữ sử gia ở độ tuổi 40, đeo kính, ngồi trong một thư viện được chiếu sáng ấm áp. Cô ấy nhìn thẳng vào máy quay, nói với giọng điệu trầm tư và lôi cuốn. Cô ấy nói, 'Điều mà hầu hết mọi người không nhận ra về Đế chế La Mã là sự sụp đổ của nó không phải là một sự kiện đơn lẻ, mà là một sự tan rã chậm rãi, phức tạp kéo dài hàng thế kỷ.' Tiếng ồn xung quanh: tiếng lật trang sách nhẹ và tiếng kêu nhỏ của điều hòa thư viện. Phong cách: Phỏng vấn tài liệu, quay bằng máy ảnh kỹ thuật số chất lượng cao."
Trải nghiệm của tôi: Thành thật mà nói, tôi thực sự bị choáng ngợp bởi cái này. Quá trình diễn ra suôn sẻ, và video đã sẵn sàng trong vài phút. Chuyện thật: trong khi nó đang tạo, tôi chuyển tab để làm việc khác. Khi quay lại và thấy kết quả đầu ra, tôi thực sự nghĩ rằng có một quảng cáo ngẫu nhiên đã xuất hiện trên màn hình. Nó trông đến mức chân thực như vậy. Nữ sử gia, ánh sáng, giọng điệu... mọi thứ đều hoàn hảo. Cô ấy nói với ngữ điệu tự nhiên, ngừng nghỉ, và nhấn nhá. Biểu cảm khuôn mặt và cử chỉ tay của cô ấy? Hoàn hảo. Nó thực sự xứng đáng với một cuộc phỏng vấn tài liệu.
Những điều duy nhất cảm thấy hơi khác lạ là các hạt bụi nổi mạnh mẽ trong ánh nắng mặt trời, hơi gây mất tập trung. Và mặc dù tôi yêu cầu âm thanh thư viện xung quanh, mô hình lại cho tôi một bản nhạc nền tinh tế. Nhưng thành thật mà nói? Đó là một quyết định thông minh. Âm nhạc phù hợp hoàn hảo với phong cách tài liệu, thậm chí có thể tốt hơn những gì tôi đã yêu cầu. Khởi đầu thật tuyệt!
Điều tôi thích | Điều tôi không thích |
Nhân vật cực kỳ chân thực và trông tự nhiên | Các hạt bụi trong ánh nắng mặt trời hơi gây mất tập trung |
Đồng bộ khẩu hình hoàn hảo với ngữ điệu nói tự nhiên | Bỏ qua yêu cầu âm thanh môi trường cụ thể (nhưng đã có lựa chọn tốt) |
Nắm bắt hoàn hảo phong cách phỏng vấn tài liệu | |
Câu lệnh #2: Thử nghiệm điện ảnh và không khí
Câu lệnh đã dùng: "Cảnh quay dolly di chuyển chậm về phía sau, hé lộ một phi hành gia đơn độc đứng trên rìa một miệng núi lửa trên sao Hỏa. Bầu trời có màu cam đỏ đầy bụi với hai mặt trăng nhỏ có thể thấy được. Hoang vắng và im lặng. Phong cách: Khoa học viễn tưởng sử thi, 4K, ống kính góc rộng, cực kỳ chi tiết, tâm trạng đầy kinh ngạc và u sầu."
Trải nghiệm của tôi: Cái này thì… khá hỗn hợp. Điều đầu tiên đập vào mắt tôi là phản chiếu trên mũ bảo hiểm của phi hành gia. Tôi yêu cầu một phản chiếu mờ nhạt của Trái Đất, nhưng những gì tôi nhận được là một mảnh khuôn mặt người đàn ông bị biến dạng kỳ lạ. Nó trông hoàn toàn lệch lạc, như một lỗi kỳ quặc trong đó các lớp trong suốt và các chiều đều sai. Đó có phải là khuôn mặt của chính phi hành gia không? Ai biết! Nó chỉ trông như được dán vào.
Mọi thứ khác không tệ. Bộ đồ, miệng núi lửa, chuyển động máy quay, tất cả đều vững vàng. Các chi tiết bụi và sương mù cát thực sự cực kỳ chân thực. Nhưng câu lệnh yêu cầu hai mặt trăng nhỏ, và bầu trời cho thấy có vẻ như ba hành tinh có kích thước khác nhau. Thật tiếc vì khuôn mặt bị lỗi, bởi vì nếu không có nó, cảnh này đã rất ấn tượng. Với việc tạo video AI, bạn thắng vài cái, thua vài cái. Mô hình đã thêm mặt trời, các ngôi sao, và sương mù chuyển động, điều đó đã hoạt động. Khuôn mặt và hành tinh phụ? Không hẳn vậy.
Điều tôi thích | Điều tôi không thích |
Thực hiện tốt chuyển động máy quay dolly | Lỗi lớn với khuôn mặt bị méo trong phản chiếu mũ bảo hiểm |
Chi tiết bụi và sương mù cát chân thực | Không tuân theo hướng dẫn "hai mặt trăng" |
Nắm bắt tốt không khí hoang vắng, sử thi viễn tưởng | Bộ đồ phi hành gia thiếu một số chi tiết tinh xảo |
Câu lệnh #3: Thử nghiệm tính nhất quán của sản phẩm và đồ vật
Câu lệnh đã dùng: "Cảnh quay turntable của một ấm trà gốm được thiết kế đẹp, cao cấp. Ấm trà có màu trắng mờ tối giản, đặt trên một bề mặt xám nhạt trơn. Máy quay từ từ xoay 360 độ quanh ấm trà. Phong cách: Quảng cáo sản phẩm sạch sẽ, ánh sáng studio, bóng mềm, ống kính macro, tiêu điểm cực kỳ sắc nét, không có nền gây mất tập trung."
Trải nghiệm của tôi: Cái này chỉ… tạm ổn thôi. Không đặc biệt ấn tượng. Mô hình đã cho tôi cách diễn giải cơ bản, nghĩa đen nhất của câu lệnh. Tôi yêu cầu một ấm trà "cao cấp, được thiết kế đẹp", và nó cho tôi một ấm gốm trông đơn giản, truyền thống. Góc máy quay đúng, nhưng bề mặt là màu trắng thay vì màu xám nhạt mà tôi đã chỉ định. Làm thế nào mà nó lại làm sai với một câu lệnh đơn giản như vậy?
Điều thực sự làm tôi khó chịu là tiêu điểm. Tôi đã yêu cầu cụ thể "tiêu điểm cực kỳ sắc nét", nhưng ấm trà lại mờ, với các cạnh không rõ ràng, như thể nó là một phần của nền. Đối với một quảng cáo sản phẩm, điều đó vô lý. Tệ hơn nữa, khi ấm trà xoay, tay cầm bị cắt ngay ra khỏi khung hình. Mô hình thậm chí không thể giữ đối tượng duy nhất trong cảnh quay hoàn toàn hiển thị. Đối với một bản demo sản phẩm, đó là một thất bại lớn.
Điều tôi thích | Điều tôi không thích |
Góc máy và chuyển động xoay chính xác | Thiết kế ấm trà đơn giản và thiếu cảm hứng |
Thiết lập nền và ánh sáng hầu như đúng | Video bị mờ và mất tiêu điểm |
Xoay 360 độ mượt mà | Sản phẩm bị cắt trong khi xoay |
Câu lệnh #4: Thử nghiệm hành động và chuyển động
Câu lệnh đã dùng: "Cảnh quay POV cầm tay của ai đó đang chạy qua một khu chợ đêm đông đúc, sôi động ở Bangkok. Máy quay rung lắc khi họ len lỏi giữa mọi người và các quầy hàng ăn. Hơi nước bốc lên từ các chảo, và những chiếc đèn lồng đầy màu sắc treo trên cao. SFX: một âm thanh hỗn loạn của chợ — mọi người nói chuyện, thức ăn xèo xèo, nhạc từ xa. Người chạy thỉnh thoảng liếc qua vai, thở hổn hển. Phong cách: Phim hành động gai góc, chân thực, đắm chìm, chuyển động hơi mờ."
Trải nghiệm của tôi: Đây không phải là những gì tôi mong đợi, và hoàn toàn không theo hướng tốt. Video mở đầu với một nhân vật hét lên "Tránh ra!" và một hiệu ứng âm thanh đấm đấm ngẫu nhiên, ngay lập tức biến nó thành một cảnh chạy trốn hung hăng mà tôi chưa bao giờ yêu cầu. Chợ đông đúc, nhưng có gì đó rất lệch lạc. Mọi người đều đứng thành hàng thẳng tắp, trật tự hoàn hảo, và không ai di chuyển. Bạn đã bao giờ thấy một khu chợ nhộn nhịp trông như vậy chưa? Nó hoàn toàn không tự nhiên.
Người chạy không một lần liếc qua vai, một hành động cụ thể mà tôi đã yêu cầu. Âm thanh cũng là một mớ hỗn độn. Âm thanh duy nhất đúng là tiếng thở hổn hển của người chạy. Phần còn lại của âm thanh chợ quá xa và yên tĩnh, trong khi chúng ra phải gần và đắm chìm mạnh mẽ. Các biển hiệu là sự pha trộn giữa tiếng Thái và tiếng Trung, khiến nó có cảm giác như một "chợ châu Á" chung chung thay vì cụ thể là Bangkok. Cái này chỉ đơn giản là hét lên "AI tạo ra".
Điều tôi thích | Điều tôi không thích |
Âm thanh thở của người chạy chân thực | Đối thoại và hiệu ứng âm thanh không mong muốn được thêm vào |
Cảm giác máy quay cầm tay phần nào có mặt | Đám đông tĩnh và hoàn toàn không chân thực |
Ánh sáng và màu sắc của chợ sống động | Bối cảnh cảm thấy chung chung, không cụ thể cho Bangkok |
Tính năng thay đổi mọi thứ: Âm thanh gốc và đồng bộ khẩu hình
Mặc dù kết quả không nhất quán qua bốn bài thử nghiệm của tôi, sự thành công của Câu lệnh #1 thực sự làm nổi bật lý do tại sao Veo 3 đang nhận được nhiều sự chú ý như vậy. Chất lượng đồng bộ khẩu hình là nơi nó thực sự tỏa sáng. Khi nó hoạt động, như trong thử nghiệm nữ sử gia của tôi, kết quả đủ thuyết phục để bị nhầm với cảnh quay thật. Mô hình không chỉ khớp chuyển động miệng với từ ngữ; nó còn tạo ra các mẫu lời nói tự nhiên với ngữ điệu, ngừng nghỉ, và nhấn nhá. Nó cũng đưa ra quyết định sáng tạo về âm thanh, như chọn nhạc nền thay vì tiếng ồn xung quanh khi điều đó phục vụ cảnh tốt hơn. Loại trí tuệ âm thanh theo ngữ cảnh đó là điều tạo nên sự khác biệt giữa một đoạn clip trông như do AI tạo ra và một đoạn thực sự có sức thuyết phục.
Những phần phiền phức: Giới hạn hàng ngày, kết xuất chậm, và các lỗi kỳ quặc
Đây là lúc tôi phải trung thực về những điều gây khó chịu, vì có rất nhiều.
Giới hạn tạo hàng ngày là một vấn đề thực sự. Sau khi tạo chỉ hai video trên gói Google AI Plus, tôi đã đụng phải giới hạn. Tin nhắn này xuất hiện.

Đây là nơi ngôn ngữ mơ hồ "truy cập nhiều hơn" và "truy cập cao hơn" trên các trang gói trở thành một vấn đề thực sự. Tôi phải nâng cấp lại lên Google AI Pro để tiếp tục thử nghiệm. Đó là hai lần nâng cấp trả phí chỉ để chạy bốn câu lệnh.
Và sau đó là các lỗi. Khuôn mặt bị méo trong phản chiếu mũ bảo hiểm của phi hành gia, hành tinh thêm trên bầu trời, đoạn đối thoại được thêm vào cảnh chợ Bangkok. Đây là những loại lỗi hình ảnh và âm thanh có thể khiến một sản phẩm đầu ra ấn tượng hoàn toàn không sử dụng được nếu tính chân thực là điều bạn hướng tới. Những giới hạn của Veo 3 như thế này đáng để ghi nhớ trước khi cam kết với một gói trả phí.
Google Veo 3 có đáng giá không? Nhận định trung thực của tôi
Sau những vòng thử nghiệm này, đây là nơi tôi đứng về việc liệu Google Veo 3 có đáng hay không.
Đối với nội dung nhiều đối thoại, đặc biệt là các video nói chuyện, phỏng vấn phong cách tài liệu, hoặc bất kỳ cảnh nào mà một nhân vật nói trực tiếp với máy quay, Veo 3 là một trong những công cụ tốt nhất hiện có. Chất lượng đồng bộ khẩu hình và tạo giọng nói tự nhiên thực sự ấn tượng và khó có thể sánh bằng. Nếu đó là trường hợp sử dụng chính của bạn, gói Google AI Pro với giá $19.99 mỗi tháng là một khoản đầu tư hợp lý.
Đối với mọi thứ khác, nó giống như một canh bạc. Bài thử nghiệm demo sản phẩm thất vọng, cảnh hành động là một mớ hỗn độn, và bài thử nghiệm điện ảnh có một lỗi khiến sản phẩm đầu ra không sử dụng được. Giới hạn hàng ngày gây khó chịu, đặc biệt là ở các gói cấp thấp hơn, và thời gian kết xuất làm chậm mọi thứ. Nếu bạn là một người sáng tạo đơn lẻ đang thử nghiệm video AI, nó đáng để thử. Nếu bạn là một đại lý hoặc nhóm sản xuất cần kết quả nhất quán, đáng tin cậy ở quy mô lớn, những hạn chế có thể vượt trội hơn lợi ích vào lúc này.
Điểm mấu chốt: Veo 3 thực sự ấn tượng trong điều kiện phù hợp, nhưng nó chưa phải là trình tạo video đáng tin cậy, đa năng như các bản demo gợi ý. Đó là một công cụ mạnh mẽ với một điểm ngọt ngào cụ thể, và biết điểm ngọt ngào đó trước khi đăng ký sẽ giúp bạn tiết kiệm rất nhiều sự bực bội.
Manus có thể tăng cường quy trình làm việc video AI của bạn như thế nào
Tạo đoạn clip chỉ là một phần của quá trình. Một dự án video hoàn thiện đòi hỏi động não ý tưởng, viết kịch bản và câu lệnh, sắp xếp tài sản, và tạo nội dung xung quanh — các bài đăng blog, chú thích mạng xã hội, và mô tả video thực sự giúp nội dung của bạn được chú ý. Đó là lúc Manus xuất hiện.
Tôi đã sử dụng Manus trong suốt quá trình đánh giá này: để lên kế hoạch cho phương pháp thử nghiệm của mình, cấu trúc bốn câu lệnh, và hợp nhất các ghi chú và phát hiện của tôi thành một thứ mạch lạc trước khi viết. Có một công cụ giúp bạn tổ chức tư duy trước khi đặt bút lên giấy tạo ra sự khác biệt thực sự, đặc biệt khi bạn đang phải cân bằng nhiều kết quả thử nghiệm và cố gắng so sánh chúng một cách công bằng. Nếu bạn đang xây dựng một quy trình làm việc nội dung video, đáng để có một AI Agent đồng hành cho công việc xung quanh. Bạn có thể thử Manus miễn phí tại manus.im.
Câu hỏi thường gặp
Làm thế nào để tôi có quyền truy cập vào Google Veo 3?
Bạn có thể truy cập Google Veo 3 thông qua ứng dụng Gemini bằng cách đăng ký một trong các gói AI trả phí của Google. Gói Google AI Plus ($7.99/tháng) cung cấp quyền truy cập hạn chế, trong khi gói Google AI Pro ($19.99/tháng) mở khóa tính năng tạo video với Veo 3.1 Fast. Quyền truy cập đầy đủ với giới hạn cao nhất có sẵn trên gói Google AI Ultra ($249.99/tháng).
Có phiên bản miễn phí của Google Veo 3 không?
Không có phiên bản miễn phí dành riêng cho Veo 3. Gói Google AI miễn phí có quyền truy cập rất hạn chế và không hỗ trợ tạo video trực tiếp thông qua ứng dụng Gemini. Người dùng miễn phí có thể có quyền truy cập hạn chế qua Google Flow, nhưng để tạo video thực tế, bạn sẽ cần một gói trả phí.
Những giới hạn của Google Veo 3 là gì?
Các giới hạn chính của Veo 3 bao gồm giới hạn tạo hàng ngày (ngay cả trên các gói trả phí), thời gian kết xuất chậm khoảng 3-5 phút mỗi đoạn clip, độ dài video tối đa là 8 giây, các lỗi và sự không nhất quán về hình ảnh thỉnh thoảng xảy ra, và khó khăn với các cảnh phức tạp nhiều yếu tố. Tính nhất quán của đối tượng trong các cảnh quay sản phẩm và hành vi nhân vật trong các chuỗi hành động cũng là những lĩnh vực mà nó có thể không đạt.
Google Veo 3 có thể tạo video dài hơn 8 giây không?
Không, phiên bản hiện tại của Google Veo 3 tạo các đoạn clip dài đến 8 giây. Đối với nội dung dài hơn, bạn sẽ cần tạo nhiều đoạn clip và chỉnh sửa chúng lại với nhau trong một công cụ như Google Flow hoặc trình chỉnh sửa video tiêu chuẩn.
Google Veo 3 có tốt hơn Sora của OpenAI không?
Điều đó phụ thuộc vào những gì bạn cần. Veo 3 có lợi thế rõ ràng về tính chân thực của đối thoại và đồng bộ khẩu hình, khiến nó trở thành lựa chọn tốt hơn cho nội dung nói chuyện hoặc phong cách phỏng vấn. Sora 2 thường hoạt động tốt hơn cho các cảnh tường thuật dài hơn và có hành vi nhân vật nhất quán hơn qua các câu lệnh phức tạp. Đối với hầu hết các nhà sáng tạo, lựa chọn phụ thuộc vào trường hợp sử dụng chính của bạn.
