Odyssey Ra Mắt AI Biến Video Thành Thế Giới Tương Tác Trong Thời Gian Thực
Một phòng thí nghiệm AI có trụ sở tại Luân Đôn, Odyssey, đã ra mắt bản xem trước nghiên cứu về một mô hình có khả năng biến video thành các thế giới tương tác. Công ty gọi đây là "phiên bản sơ khai của Holodeck," gợi ý về một phương tiện giải trí hoàn toàn mới.
Chức năng cốt lõi của mô hình Odyssey là tạo ra video tương tác phản hồi lại các lệnh nhập (inputs) của người dùng trong thời gian thực—chỉ trong vòng 40 mili giây cho mỗi khung hình video. Điều này tạo ra ảo giác rằng người dùng đang thực sự ảnh hưởng và định hình thế giới kỹ thuật số đó.

Công Nghệ Cốt Lõi: Mô Hình Thế Giới (World Model)
Khác biệt chính nằm ở công nghệ AI cơ bản được sử dụng:
Công nghệ: Mô hình Thế giới (World Model).
Hoạt động: Không giống như các mô hình video truyền thống tạo ra toàn bộ clip cùng một lúc, mô hình thế giới hoạt động khung hình theo khung hình để dự đoán điều gì sẽ xảy ra tiếp theo dựa trên trạng thái hiện tại và bất kỳ hành động nào của người dùng.
Quy trình: Khi người dùng tương tác, mô hình sẽ lấy trạng thái hiện tại, hành động của người dùng và lịch sử các sự kiện, sau đó tạo ra khung hình video tiếp theo. Kết quả là một trải nghiệm có cảm giác hữu cơ và khó đoán hơn so với logic lập trình sẵn của một trò chơi truyền thống.
Giải quyết "Trôi dạt" (Drift): Để duy trì sự ổn định theo thời gian (khi các lỗi nhỏ tích lũy), Odyssey đã đào tạo AI của mình trên dữ liệu video chung và sau đó tinh chỉnh nó trên một tập hợp môi trường nhỏ hơn (narrow distribution model), đánh đổi sự đa dạng để lấy độ ổn định cao hơn.
Ứng Dụng Tiềm năng và Lợi Ích
Mặc dù hiện tại trải nghiệm vẫn còn "thô sơ, không ổn định," công nghệ này có tiềm năng trở thành bước phát triển tiếp theo trong lịch sử kể chuyện (sau sách, phim và trò chơi điện tử). Các ứng dụng tiềm năng bao gồm:
Giải trí: Mở ra một phương tiện kể chuyện mới, nơi người xem có thể khám phá và tương tác với các thế giới do AI tạo ra.
Đào tạo: Tạo ra các video huấn luyện tương tác nơi người dùng có thể thực hành các kỹ năng đang được giảng dạy.
Du lịch Ảo: Cung cấp các trải nghiệm du lịch cho phép người dùng khám phá các địa điểm từ xa, với khả năng tương tác đầy đủ.
Chi phí vận hành công nghệ này hiện nay đang dựa trên cụm GPU, nhưng dự kiến sẽ giảm đáng kể khi các mô hình trở nên hiệu quả hơn, khiến nó trở nên rất cạnh tranh so với việc sản xuất nội dung trò chơi hoặc phim truyền thống.
Theo bạn, khả năng AI biến nội dung thành trải nghiệm tương tác này sẽ có ảnh hưởng lớn nhất đến lĩnh vực nào?