Vì sao Darren Aronofsky lại cho rằng phim tài liệu lịch sử do trí tuệ nhân tạo tạo ra là một ý tưởng hay?

Tác giả dinhtri 07/02/2026 31 phút đọc

Nguồn tin từ phía nhà sản xuất cho biết phải mất "nhiều tuần" để sản xuất chỉ vài phút video có thể sử dụng được.

pitchfork
 
Hình ảnh do họa sĩ phác họa về phản ứng của giới phê bình đối với những tập đầu tiên của "Vào ngày này... năm 1776". Nguồn: Primordial Soup
 

Tuần trước, hãng phim AI Primordial Soup của nhà làm phim Darren Aronofsky và tạp chí Time đã phát hành hai tập đầu tiên của series On This Day… 1776. Loạt video ngắn kéo dài một năm này gồm những đoạn phim ngắn mô tả những gì đã xảy ra vào ngày này của cuộc Cách mạng Mỹ cách đây 250 năm, nhưng được thực hiện bằng cách sử dụng “nhiều công cụ AI” để tạo ra những cảnh quay chân thực có chứa hình ảnh đại diện của các nhân vật lịch sử như George Washington, Thomas Paine và Benjamin Franklin.

Trong thông báo về loạt phim, Chủ tịch Time Studios, Ben Bitonti, cho biết dự án này mang đến “cái nhìn thoáng qua về việc sử dụng trí tuệ nhân tạo một cách chu đáo, sáng tạo và do nghệ sĩ dẫn dắt – không phải thay thế kỹ thuật thủ công mà mở rộng những khả năng và cho phép người kể chuyện đi đến những nơi mà trước đây họ không thể.”

 
Đoạn trailer của phim “Vào ngày này… năm 1776”.

Các nhà phê bình bên ngoài tỏ ra không mấy hào hứng với nỗ lực này. AV Club chỉ trích các tập đầu tiên vì “các chuyển động máy quay lặp đi lặp lại [và] các nhân vật cứng đờ” tạo nên “một cái nhìn xấu xí về lịch sử nước Mỹ”. CNET cho rằng “mớ hỗn độn AI này đang hủy hoại lịch sử nước Mỹ”, gọi các video là “một thứ hỗn độn kinh khủng gồm trí tuệ nhân tạo do máy móc điều khiển và những lựa chọn tồi tệ của con người”. Tờ Guardian than thở rằng “đạo diễn từng được ca ngợi của Black SwanThe Wrestler đã tự nhấn chìm mình trong mớ hỗn độn AI”, gọi loạt phim là “đáng xấu hổ”, “kinh khủng” và “xấu xí như tội lỗi”. Tôi có thể kể thêm nữa.

Nhưng phản ứng ban đầu như vậy dường như không làm nản lòng Primordial Soup trong những nỗ lực không ngừng phát triển của họ. Một nguồn tin thân cận với đoàn làm phim, người yêu cầu giấu tên để có thể thẳng thắn nói về chi tiết quá trình tạo ra loạt phim, đã nói với Ars rằng chất lượng của các tập phim mới sẽ được cải thiện khi các công cụ AI của nhóm được hoàn thiện hơn trong suốt năm và khi nhóm học cách sử dụng chúng tốt hơn.

“Chúng tôi bước vào dự án này với nhận định rằng mình còn rất nhiều điều phải học hỏi, rằng quy trình này sẽ phát triển, các công cụ chúng tôi sử dụng cũng sẽ phát triển,” nguồn tin cho biết. “Chúng tôi sẽ mắc sai lầm. Chúng tôi sẽ học hỏi được rất nhiều… chúng tôi sẽ làm tốt hơn, [và] công nghệ cũng sẽ thay đổi. Chúng ta sẽ xem khán giả phản ứng như thế nào với những điều nhất định, điều gì hiệu quả, điều gì không hiệu quả. Thực sự đây là một cuộc thử nghiệm lớn.”

Không phải tất cả AI đều như vậy.

Điều quan trọng cần lưu ý là On This Day… 1776  không hoàn toàn được tạo ra bởi trí tuệ nhân tạo. Ví dụ, kịch bản được viết bởi một nhóm biên kịch dưới sự giám sát của các cộng sự viết kịch bản lâu năm của Aronofsky là Ari Handel và Lucas Sussman, như tờ The Hollywood Reporter đã đưa tin . Điều đó khiến những lời chỉ trích như của tờ Guardian về "những khẩu hiệu nghe giống như của ChatGPT" trong những tập đầu tiên vừa có phần sai lệch vừa mang tính khắc nghiệt đến nực cười.

Nguồn tin từ phía nhà sản xuất cho biết dự án này ngay từ đầu đã được hình thành như một tác phẩm do con người viết và nhóm thực hiện đã lên kế hoạch và nghiên cứu từ lâu về cách kể loại câu chuyện này. “Tôi không nghĩ [họ] cần hoặc muốn loại trợ giúp đó [viết bằng trí tuệ nhân tạo],” nguồn tin nói. “Tất cả chúng ta đều đã thử nghiệm với việc viết bằng trí tuệ nhân tạo và các chatbot ngoài kia, và bạn biết chất lượng mà bạn nhận được từ đó như thế nào rồi đấy.”

image-2
 
Những gì bạn thấy ở đây không phải là diễn viên người thật, nhưng lời thoại của nhân vật được viết và lồng tiếng bởi con người. Nguồn: Primordial Soup

Các nhà sản xuất cũng đặc biệt nhấn mạnh rằng tất cả các đoạn hội thoại trong loạt phim đều được thu âm trực tiếp bởi các diễn viên lồng tiếng thuộc Hiệp hội Diễn viên Màn ảnh (Screen Actors Guild) , chứ không phải bằng giọng nói do AI tạo ra. Mặc dù các quy định mới được đàm phán gần đây của công đoàn có thể liên quan đến điều đó, nhưng nguồn tin sản xuất của chúng tôi cũng cho biết giọng nói do AI tạo ra mà nhóm đã sử dụng cho các bản thu âm tạm thời nghe khá giả tạo và chưa sẵn sàng cho một sản phẩm chuyên nghiệp.

 

Theo nguồn tin của chúng tôi, con người cũng trực tiếp chịu trách nhiệm về âm nhạc, biên tập, hòa âm, hiệu ứng hình ảnh và hiệu chỉnh màu sắc cho dự án. “Các công cụ hỗ trợ bởi AI” chỉ được sử dụng trong chính video, được thực hiện bằng “sự kết hợp giữa các công cụ làm phim truyền thống và khả năng AI mới nổi”, như thông báo đã nêu.

Trên thực tế, nguồn tin của chúng tôi cho biết, điều đó có nghĩa là con người tạo ra kịch bản phân cảnh, tìm kiếm hình ảnh tham khảo cho địa điểm và nhân vật, và thiết lập cách họ muốn các cảnh quay trông như thế nào. Thông tin đó, cùng với kịch bản, được đưa vào trình tạo video AI để tạo ra các cảnh quay riêng lẻ từng cái một, sau đó được ghép lại và chỉnh sửa bởi con người trong quá trình hậu kỳ truyền thống.

Quá trình đó đưa cuộc đối thoại điện ảnh do AI tạo ra tiến thêm một bước so với Ancestra , một bộ phim ngắn mà Primordial Soup phát hành mùa hè năm ngoái với sự hợp tác của Google DeepMind (không tham gia vào dự án mới này). Ở đó, các công cụ AI đã được sử dụng để bổ sung "các cảnh quay thực tế bằng các chuỗi hình ảnh do Veo tạo ra."

“Nhiều tuần” nhắc nhở và nhắc lại nhiều lần

Về lý thuyết, việc sử dụng mô hình AI để tạo ra một cảnh quay chỉ trong vài phút có thể tiết kiệm rất nhiều thời gian so với làm phim truyền thống – tìm địa điểm quay, thuê diễn viên, thiết lập máy quay và bối cảnh, v.v. Nhưng nguồn tin từ phía nhà sản xuất cho biết quá trình lặp đi lặp lại để tạo ra và hoàn thiện các cảnh quay cho bộ phim On This Day… 1776 vẫn mất “nhiều tuần” cho mỗi video dài vài phút và “thường xuyên hơn là chúng tôi phải chạy đua với thời hạn”.

 
Tập đầu tiên của chương trình " Vào ngày này… năm 1776" có cảnh thượng cờ đầy kịch tính.

Mặc dù mô hình AI về cơ bản đang tạo ra các hình đại diện chân thực như ảnh chụp, nguồn tin cho biết quá trình này "giống với làm phim người thật đóng hơn" vì thiếu sự kiểm soát chi tiết đối với những gì mô hình video sẽ tạo ra. "Bạn không biết liệu mình sẽ có được kết quả mong muốn ngay lần quay đầu tiên, lần thứ 12 hay lần thứ 40", nguồn tin cho biết.

Mặc dù một số cảnh quay cần ít thời gian hơn để hoàn thiện so với những cảnh khác, nguồn tin của chúng tôi cho biết mô hình AI hiếm khi tạo ra được một cảnh quay hoàn hảo, sẵn sàng trình chiếu ngay từ lần thử đầu tiên. Và trong khi một số vấn đề nhỏ trong cảnh quay do AI tạo ra có thể được che đậy trong khâu hậu kỳ bằng hiệu ứng hình ảnh hoặc chỉnh sửa cẩn thận, thì hầu hết thời gian, nhóm phải quay lại và yêu cầu mô hình tạo ra một video hoàn toàn mới với những thay đổi nhỏ.

“Việc này vẫn đòi hỏi rất nhiều công sức, và không hẳn là vì nó sai, mà là vì cần phải kiểm soát tốt nhất, bởi vì bạn [có thể] muốn ánh sáng chiếu vào khuôn mặt theo đúng cách để kể câu chuyện,” nguồn tin cho biết. “Chúng tôi vẫn đang nỗ lực để đạt được mức độ kiểm soát tương tự như khi sản xuất phim người thật đóng, nhằm tối đa hóa câu chuyện và cảm xúc.”

Chụp nhanh và ngân sách nhỏ hơn

Mặc dù công nghệ video đã tiến bộ rất nhiều kể từ thời đoạn phim kinh dị về Will Smith ăn mì Ý , nhưng theo nguồn tin của chúng tôi, ảo giác và hình ảnh vô nghĩa “vẫn là một vấn đề” trong quá trình sản xuất phim On This Day… 1776. Đó là một trong những lý do khiến công ty quyết định sử dụng một loạt video ngắn thay vì một bộ phim dài kể cùng một câu chuyện cốt lõi.

“Việc duy trì phong độ ổn định trong vòng ba phút là một chuyện. Còn việc duy trì phong độ ổn định trong vòng hai giờ thì khó hơn nhiều và đòi hỏi nhiều công sức hơn,” nguồn tin cho biết. “Tôi không biết giới hạn trên hiện tại là bao nhiêu [nhưng] càng kéo dài, mọi thứ càng dễ sa sút.”

Ảnh tĩnh từ một video do AI tạo ra, ghi lại cảnh Will Smith ăn mì Ý.
 
Chúng ta đã tiến bộ rất nhiều so với những video quay cảnh Will Smith ăn mì Ý vào khoảng năm 2023. Nguồn: chaindrop / Reddit

Việc giữ cho mỗi cảnh quay ngắn cũng cho phép kiểm soát tốt hơn và giảm thiểu số lần "quay lại" đối với một sản phẩm hoạt hình do AI tạo ra như thế này. "Nếu bạn nghĩ về điều đó, nếu bạn đang cố gắng tạo ra một đoạn phim dài 20 giây, bạn có rất nhiều thứ đang xảy ra, và nếu một trong những thứ đó gặp trục trặc trong 20 giây, bạn phải bắt đầu lại từ đầu," nguồn tin của chúng tôi cho biết. "Và khả năng xảy ra lỗi trong 20 giây là khá cao. Khả năng xảy ra lỗi trong tám giây thì thấp hơn nhiều."

 

Mặc dù nguồn tin sản xuất của chúng tôi không thể cung cấp thông tin cụ thể về chi phí mà nhóm đã bỏ ra để tạo ra lượng video mô phỏng bằng AI lớn như vậy, nhưng họ cho rằng quy trình này vẫn rẻ hơn nhiều so với việc quay một bộ phim tài liệu lịch sử như thế này tại hiện trường.

“Ý tôi là, chúng tôi không bao giờ có thể đạt được những gì đang làm với số tiền này, điều mà tôi nghĩ khá rõ ràng khi các bạn xem chương trình này,” họ nói. Trong các tập tiếp theo, nguồn tin hứa hẹn, “các bạn sẽ thấy những điều mà ngay cả máy quay cũng không thể làm được” như một cách để “tận dụng tối đa khả năng của phương tiện truyền thông này.”

“Hãy xem chúng ta có thể làm được gì.”

Nếu bạn đã để ý đến tốc độ phát triển nhanh chóng của video do AI tạo ra, bạn có thể nghĩ rằng các mô hình AI sẽ sớm có thể sản xuất phim chất lượng Hollywood chỉ với một vài thao tác đơn giản. Nhưng nguồn tin của chúng tôi cho biết, việc thực hiện dự án " On This Day… 1776" cho thấy tầm quan trọng của việc con người vẫn tham gia vào quá trình này.

“Cá nhân tôi không nghĩ chúng ta sẽ bao giờ đạt được điều đó [thay thế hoàn toàn các biên tập viên con người],” ông nói. “Thực tế, chúng ta rất cần một biên tập viên. Chúng ta cần một người khác xem xét bản dựng và nói, 'Nếu chúng ta kết thúc cảnh quay này sớm hơn một chút, thì chúng ta có thể tạo ra một chút kịch tính. Nếu chúng ta nán lại ở cảnh này lâu hơn một chút…' Điều đó vẫn thực sự cần thiết.”

aifranklinpaine
 
Trí tuệ nhân tạo Ben Franklin và trí tuệ nhân tạo Thomas Paine nâng ly chúc mừng nỗ lực tuyên truyền chiến tranh. Nguồn: Primordial Soup

Đó có thể là tin tốt cho các biên tập viên con người. Nhưng bộ phim "Vào ngày này năm 1776" cũng gợi ý về một thế giới nơi các diễn viên người thật trên màn ảnh (hoặc thậm chí là diễn viên được ghi hình chuyển động) hoàn toàn được thay thế bằng các hình đại diện do trí tuệ nhân tạo tạo ra. Tuy nhiên, khi tôi hỏi nguồn tin của mình lý do tại sao các nhà sản xuất lại cảm thấy trí tuệ nhân tạo đã sẵn sàng đảm nhận phần việc mang tính con người trong quá trình làm phim, câu trả lời đã khiến tôi bất ngờ.

“Thành thật mà nói, tôi không chắc chúng tôi có biết điều đó hay không,” họ nói. “Tôi nghĩ chúng tôi biết rằng công nghệ đã có sẵn để thử. Và tôi nghĩ với tư cách là những người kể chuyện, chúng tôi thực sự quan tâm đến việc sử dụng… tất cả các công cụ khác nhau mà chúng tôi có thể để cố gắng truyền tải câu chuyện của mình và để cố gắng khiến khán giả cảm nhận được điều gì đó.”

“Không thường xuyên lắm chúng ta mới có được những công cụ mới tuyệt vời như thế này,” nguồn tin tiếp tục. “Ý tôi là, điều đó chưa từng xảy ra trong suốt cuộc đời tôi. Nhưng khi bạn có được những công cụ mới này, bạn muốn bắt đầu thử nghiệm chúng… Chúng ta phải thử nghiệm để biết liệu nó có hiệu quả hay không.”

“Vậy nên, chúng ta đã có các công cụ rồi. Hãy xem chúng ta có thể làm được gì.”

Tác giả dinhtri Admin
Bài viết trước Cách xem các sự kiện môn curling tại Thế vận hội mùa đông 2026

Cách xem các sự kiện môn curling tại Thế vận hội mùa đông 2026

Bài viết tiếp theo

Môn trượt băng nghệ thuật tại Thế vận hội mùa đông 2026 đã bắt đầu. Làm thế nào để xem được mọi cú xoay, cú nhảy và cú ngã?

Môn trượt băng nghệ thuật tại Thế vận hội mùa đông 2026 đã bắt đầu. Làm thế nào để xem được mọi cú xoay, cú nhảy và cú ngã?
Viết bình luận
Thêm bình luận

Bài viết liên quan

Thông báo

0917111899