Meta ra mắt mô hình AI mới có khả năng hiểu quy luật vật lý như trọng lực

Trần Ngọc Bảo Trân Tác giả Trần Ngọc Bảo Trân 20/09/2025 5 phút đọc

Meta công bố mô hình AI mới có thể hiểu các quy luật vật lý

Meta vừa ra mắt mô hình AI sinh mới có tên Video Joint Embedding Predictive Architecture 2 (V-JEPA 2), được kỳ vọng sẽ thay đổi cách máy móc nhận thức về thế giới vật lý. Đây là mô hình mã nguồn mở, được thiết kế nhằm giúp AI hiểu rõ hơn về các quy luật cơ bản như lực hấp dẫn hay tính tồn tại của vật thể, từ đó mở ra cơ hội phát triển robot thông minh và nhiều ứng dụng thực tiễn khác.

V-JEPA 2: How Meta's New AI Model Teaches Robots Real-World “Common Sense” | by Vidusha Sanidu | Just AI Things

Trong bài đăng giới thiệu, Meta cho biết mục tiêu của việc công khai mô hình này là cung cấp cho giới nghiên cứu và nhà phát triển những công cụ tốt nhất để thúc đẩy tiến bộ, qua đó xây dựng hệ thống AI có khả năng hỗ trợ và nâng cao chất lượng cuộc sống con người.

Các mô hình AI hiện nay thường dựa vào dữ liệu gắn nhãn hoặc video để mô phỏng thế giới thực. Tuy nhiên, V-JEPA 2 được thiết kế để hiểu rõ logic của vật lý, chẳng hạn như việc một quả bóng lăn khỏi bàn sẽ rơi xuống đất. Nhờ đó, AI có thể đưa ra dự đoán chính xác hơn về cách các vật thể di chuyển và tương tác.

Meta cho rằng mô hình này đặc biệt hữu ích cho các thiết bị như xe tự hành và robot, bởi chúng không cần phải trải qua quá trình huấn luyện cho mọi tình huống có thể xảy ra. Đây được coi là bước tiến quan trọng hướng đến loại AI có khả năng thích ứng linh hoạt giống con người.

Meta V-JEPA 2: The AI Model Bringing Common Sense to Robots - Unite.AI

Một trong những thách thức lớn nhất của AI trong lĩnh vực vật lý là nhu cầu khổng lồ về dữ liệu huấn luyện, vốn tốn nhiều thời gian, tiền bạc và tài nguyên. Các chuyên gia từng đề xuất sử dụng dữ liệu tổng hợp do AI tạo ra để bổ sung, nhằm giúp mô hình truyền thống ứng phó với tình huống bất ngờ. Tuy nhiên, Meta khẳng định V-JEPA 2 giúp đơn giản hóa quá trình này, mang lại hiệu quả cao hơn trong ứng dụng thực tế nhờ không phụ thuộc hoàn toàn vào kho dữ liệu huấn luyện khổng lồ.

Bước tiếp theo của các mô hình thế giới (world models) sẽ là phát triển khả năng học tập, suy luận và lập kế hoạch trên nhiều quy mô thời gian và không gian khác nhau. Đồng thời, các mô hình đa phương thức có thể kết hợp thêm giác quan như âm thanh và xúc giác bên cạnh thị giác cũng sẽ đóng vai trò quan trọng, giúp AI trong tương lai hiểu thế giới thực một cách toàn diện hơn.

Trần Ngọc Bảo Trân
Tác giả Trần Ngọc Bảo Trân Admin
Bài viết trước 1080p, 1440p, 4K: Nên chọn độ phân giải màn hình nào?

1080p, 1440p, 4K: Nên chọn độ phân giải màn hình nào?

Bài viết tiếp theo

Khi nào bạn nên “dùng thử” bàn phím ergonomic trước khi quyết định mua?

Khi nào bạn nên “dùng thử” bàn phím ergonomic trước khi quyết định mua?
Viết bình luận
Thêm bình luận

Bài viết liên quan

Thông báo

0917111899