Việc tiêm thuốc nhanh chóng xứng đáng với lòng bàn tay vào các trợ lý AI vẫn tiếp tục. Phần hôm nay đánh trúng tác nhân Nghiên cứu sâu của OpenAI. Các nhà nghiên cứu gần đây đã nghĩ ra một cuộc tấn công lấy thông tin bí mật ra khỏi hộp thư Gmail của người dùng và gửi nó đến máy chủ web do kẻ tấn công kiểm soát, không yêu cầu tương tác từ phía nạn nhân và không có dấu hiệu thoát ra.
Deep Research là một tác nhân AI tích hợp ChatGPT mà OpenAI giới thiệu đầu năm nay. Như tên của nó có nghĩa là để truyền đạt, Deep Research thực hiện nghiên cứu phức tạp, nhiều bước trên Internet bằng cách khai thác vào một mảng lớn các tài nguyên, bao gồm hộp thư đến email của người dùng, tài liệu và các tài nguyên khác. Nó cũng có thể tự động duyệt các trang web và nhấp vào các liên kết.
Người dùng có thể nhắc đại lý tìm kiếm qua email của tháng qua, tham chiếu chéo chúng với thông tin được tìm thấy trên web và sử dụng chúng để biên soạn báo cáo chi tiết về một chủ đề nhất định. OpenAI nói rằng nó “hoàn thành trong hàng chục phút những gì con người sẽ mất nhiều giờ.”
Điều gì có thể xảy ra?
Hóa ra có một nhược điểm khi có một mô hình ngôn ngữ lớn duyệt các trang web và nhấp vào các liên kết không có sự giám sát của con người.
Vào thứ Năm, hãng bảo mật Radware nghiên cứu được công bố cho thấy cách một cuộc tấn công vườn-giống được gọi là tiêm nhanh chóng là tất cả những gì cần thiết để các nhà nghiên cứu của công ty lấy ra thông tin bí mật khi Deep Research được cấp quyền truy cập vào hộp thư đến Gmail của mục tiêu. Kiểu tích hợp này chính xác là những gì Deep Research được thiết kế để thực hiện và là điều mà OpenAI đã khuyến khích. Radware đã đặt tên cho cuộc tấn công là Shadow Leak.
các nhà nghiên cứu của “ShadowLeak đã vũ khí hóa chính những khả năng giúp trợ lý AI trở nên hữu ích: truy cập email, sử dụng công cụ và các cuộc gọi web tự động, các nhà nghiên cứu của ” Radware viết. “Nó dẫn đến mất dữ liệu im lặng và các hành động không được ghi nhật ký được thực hiện ‘thay mặt cho người dùng,’ bỏ qua các biện pháp kiểm soát bảo mật truyền thống giả định người dùng có chủ ý nhấp chuột hoặc ngăn chặn rò rỉ dữ liệu ở cấp cổng.”