Waymo tận dụng Genie 3 để tạo ra mô hình toàn cầu cho xe tự lái.

Tác giả dangkhoa 23/02/2026 13 phút đọc

Waymo tận dụng Genie 3 để tạo ra mô hình toàn cầu cho xe tự lái.

Với Genie 3, Waymo muốn khám phá những điều kiện lái xe hiếm gặp và thậm chí là bất khả thi.    

Xe Waymo
 
Một chiếc xe tự lái Waymo tại sự kiện Google I/O. Ảnh: Ryan Whitwam

Công ty con Waymo của Google đang trong quá trình mở rộng đội xe tự lái của mình sang các khu vực mới. Waymo tự hào có hơn 200 triệu dặm đường đã được lái thử, giúp hiểu rõ cách xe di chuyển trên đường, nhưng trí tuệ nhân tạo (AI) của công ty cũng đã lái hàng tỷ dặm trong môi trường ảo, và còn nhiều điều thú vị hơn nữa với mô hình Waymo World Model mới. Dựa trên Genie 3 của Google DeepMind, Waymo cho biết mô hình này có thể tạo ra các môi trường mô phỏng "siêu thực" để huấn luyện AI trong các tình huống hiếm khi (hoặc không bao giờ) gặp phải trong đời thực - ví dụ như tuyết trên cầu Golden Gate.

Cho đến gần đây, ngành công nghiệp lái xe tự động hoàn toàn dựa vào dữ liệu huấn luyện thu thập từ ô tô thật và các tình huống thực tế. Điều đó có nghĩa là các sự kiện hiếm gặp, tiềm ẩn nguy hiểm không được thể hiện đầy đủ trong dữ liệu huấn luyện. Mô hình Thế giới Waymo nhằm mục đích giải quyết vấn đề đó bằng cách cho phép các kỹ sư tạo ra các mô phỏng với các hướng dẫn đơn giản và đầu vào lái xe.

Năm ngoái, Google đã tiết lộ Genie 3 , định vị nó như một bản nâng cấp đáng kể so với các mô hình thế giới khác nhờ khả năng ghi nhớ dài hạn. Trong mô hình thế giới của Google, bạn có thể di chuyển ra xa một đối tượng nhất định, và khi quay lại, mô hình vẫn sẽ "ghi nhớ" hình dạng của đối tượng đó. Trong các nỗ lực tạo ra mô hình thế giới trước đây, mô phỏng sẽ mất đi ngữ cảnh đó gần như ngay lập tức. Với Genie 3, mô hình có thể ghi nhớ các chi tiết trong vài phút

Tuyết rơi ở San Francisco.

Các mô hình thế giới tự hồi quy như Genie thực chất không tạo ra không gian 3D, mà thay vào đó hiển thị video đủ nhanh để tạo cảm giác như một thế giới có thể khám phá. Tất nhiên, trò chơi điện tử được coi là một ứng dụng hàng đầu cho các mô hình thế giới, đến mức cổ phiếu của các công ty game đã giảm khi Google gần đây mở rộng quyền truy cập vào công nghệ này thông qua Dự án Genie . Tuy nhiên, độ trễ và bộ nhớ vẫn còn khá ngắn của Genie khiến việc ứng dụng trong game còn xa vời. Mặc dù vậy, Waymo cho biết Genie 3 thực sự lý tưởng để mô phỏng loại dữ liệu mà họ cần để huấn luyện xe tự lái.

Trên đường cùng trí tuệ nhân tạo

Mô hình Waymo World Model không chỉ đơn thuần là bản sao chép Genie 3 với các video từ camera hành trình được tích hợp bên trong. Waymo và DeepMind đã sử dụng một quy trình hậu huấn luyện chuyên biệt để tạo ra mô hình mới có thể tạo ra cả video 2D và dữ liệu lidar 3D của cùng một khung cảnh. Mặc dù camera rất tốt để hiển thị các chi tiết nhỏ, Waymo cho biết lidar là cần thiết để bổ sung thông tin độ sâu quan trọng vào những gì xe tự lái "nhìn thấy" trên đường - có lẽ ai đó nên nói điều này với Tesla .

Việc sử dụng mô hình thế giới cho phép Waymo thu thập video từ các phương tiện của mình và sử dụng các lệnh để thay đổi lộ trình di chuyển của phương tiện, mà họ gọi là điều khiển hành động lái xe. Các mô phỏng này, đi kèm với bản đồ lidar, được cho là mang lại tính chân thực và nhất quán cao hơn so với các phương pháp mô phỏng tái tạo cũ.

 
Với mô hình toàn cầu, Waymo có thể thấy điều gì sẽ xảy ra nếu chiếc xe rẽ theo một hướng khác.

Mô hình này cũng có thể giúp cải thiện trí tuệ nhân tạo lái xe tự động ngay cả khi không cần thêm hoặc bớt bất cứ thứ gì. Có rất nhiều video từ camera hành trình có sẵn để huấn luyện xe tự lái, nhưng chúng thiếu dữ liệu cảm biến đa phương thức của xe Waymo. Việc đưa một video như vậy vào Mô hình Thế giới Waymo sẽ tạo ra dữ liệu cảm biến phù hợp, cho thấy trí tuệ nhân tạo lái xe sẽ nhìn nhận tình huống đó như thế nào.

Mặc dù Waymo World Model có thể tạo ra những cảnh hoàn toàn ảo, nhưng dường như công ty này chủ yếu quan tâm đến việc "biến đổi" các điều kiện trong video thực tế. Bài đăng trên blog chứa các ví dụ về việc thay đổi thời gian trong ngày hoặc thời tiết, thêm biển báo mới hoặc đặt phương tiện ở những vị trí bất thường. Hoặc, tại sao không thử một con voi giữa đường?

 
Waymo đã sẵn sàng trong trường hợp có voi xuất hiện.

Các thành phố thử nghiệm ban đầu của Waymo đều có thời tiết nắng ráo (như Phoenix) và ít gặp thời tiết xấu. Những mô phỏng kiểu này có thể giúp xe thích nghi với các môi trường khác. Các thị trường mới bao gồm những nơi có điều kiện khắc nghiệt hơn, chẳng hạn như Boston và Washington, DC.

Tất nhiên, lợi ích của mô hình AI mới sẽ phụ thuộc vào độ chính xác mà Genie 3 có thể mô phỏng thế giới thực. Các video thử nghiệm về Genie 3 mà chúng ta đã xem có chất lượng từ khá chân thực đến mức đáng sợ, nhưng Waymo tin rằng công nghệ đã được cải thiện đến mức có thể dạy cho xe tự lái một vài điều.

Tác giả dangkhoa Admin
Bài viết trước Luật sư thiết lập tiêu chuẩn mới về lạm dụng trí tuệ nhân tạo; thẩm phán bác bỏ vụ kiện.2

Luật sư thiết lập tiêu chuẩn mới về lạm dụng trí tuệ nhân tạo; thẩm phán bác bỏ vụ kiện.2

Bài viết tiếp theo

Vì sao chiếc tai nghe giá rẻ này vẫn có chống ồn “đỉnh” sau gần 3 năm

Vì sao chiếc tai nghe giá rẻ này vẫn có chống ồn “đỉnh” sau gần 3 năm
Viết bình luận
Thêm bình luận

Bài viết liên quan

Thông báo

0917111899