Các mô hình AI mới của Google DeepMind có thể tìm kiếm web để hỗ trợ robot hoàn thành nhiệm vụ

Tác giả lananh 30/09/2025 5 phút đọc

Google DeepMind: Các mô hình AI nâng cấp giúp robot hoàn thành các nhiệm vụ phức tạp và sử dụng web để hỗ trợ

Trong một buổi họp báo, Carolina Parada, trưởng bộ phận robotics của Google DeepMind, cho biết các mô hình AI mới của công ty hoạt động kết hợp, cho phép robot “tư duy nhiều bước trước khi thực hiện hành động trong thế giới vật lý.”

Hệ thống này được hỗ trợ bởi Gemini Robotics 1.5 cùng với mô hình reasoning có hiện thân, Gemini Robotics-ER 1.5, là bản nâng cấp của các mô hình AI mà Google DeepMind giới thiệu hồi tháng 3.

Giờ đây, robot không chỉ thực hiện những nhiệm vụ đơn lẻ như gấp giấy hay kéo khóa túi. Chúng có thể làm các việc phức tạp hơn, chẳng hạn:

  • Phân loại quần áo theo màu tối và sáng
  • Đóng gói vali dựa trên thời tiết hiện tại ở London
  • Hỗ trợ phân loại rác thải, compost và vật liệu tái chế dựa trên tìm kiếm web theo yêu cầu địa phương

“Các mô hình trước đây có thể thực hiện tốt một lệnh tại một thời điểm theo cách rất tổng quát,” Parada nói. “Với bản cập nhật này, chúng tôi đang chuyển từ việc thực hiện một lệnh duy nhất sang hiểu biết và giải quyết vấn đề thực sự cho các nhiệm vụ vật lý.

Để làm được điều này, robot sử dụng mô hình Gemini Robotics-ER 1.5 nâng cấp để hình thành hiểu biết về môi trường xung quanh, đồng thời sử dụng các công cụ kỹ thuật số như Google Search để tìm thêm thông tin. Gemini Robotics-ER 1.5 sau đó chuyển những phát hiện đó thành hướng dẫn bằng ngôn ngữ tự nhiên cho Gemini Robotics 1.5, cho phép robot sử dụng khả năng nhận dạng hình ảnh và hiểu ngôn ngữ của mô hình để thực hiện từng bước.

Ngoài ra, Google DeepMind thông báo rằng Gemini Robotics 1.5 có khả năng giúp robot “học hỏi” lẫn nhau, ngay cả khi chúng có cấu hình khác nhau. Google DeepMind phát hiện rằng các nhiệm vụ được đưa ra cho robot ALOHA2 (gồm hai cánh tay cơ học) có thể thực hiện trực tiếp trên robot bi-arm Franka cũng như robot hình người Apollo của Apptronik. 

“Điều này cho phép chúng tôi làm hai việc: thứ nhất là điều khiển những robot rất khác nhau — bao gồm cả robot hình người — bằng một mô hình duy nhất,” kỹ sư phần mềm Kanishka Rao của Google DeepMind nói trong buổi họp báo. “Thứ hai là các kỹ năng học được trên một robot giờ có thể được chuyển sang robot khác. 

Trong khuôn khổ bản cập nhật này, Gemini Robotics-ER 1.5 sẽ được triển khai cho các nhà phát triển thông qua Gemini API trong Google AI Studio, trong khi chỉ một số đối tác chọn lọc mới có quyền truy cập Gemini Robotics 1.5. 

Tác giả lananh Admin
Bài viết trước NATO khởi động Project HEIST: sao lưu liên lạc biển sâu bằng vệ tinh để đối phó tổn hại cáp ngầm

NATO khởi động Project HEIST: sao lưu liên lạc biển sâu bằng vệ tinh để đối phó tổn hại cáp ngầm

Bài viết tiếp theo

Cách Tắt Hiệu Ứng Trong Suốt Trên Windows 10 Nhanh Chóng Và Hiệu Quả

Cách Tắt Hiệu Ứng Trong Suốt Trên Windows 10 Nhanh Chóng Và Hiệu Quả
Viết bình luận
Thêm bình luận

Bài viết liên quan

Thông báo

0917111899