Trợ lý AI Copilot của Microsoft đang phơi bày nội dung của hơn 20.000 kho GitHub riêng tư từ các công ty bao gồm Google, Intel, Huawei, PayPal, IBM, Tencent và trớ trêu thay, Microsoft.
Các kho này, thuộc hơn 16.000 tổ chức, ban đầu được đăng lên GitHub dưới dạng công khai, nhưng sau đó được đặt thành riêng tư, thường là sau khi các nhà phát triển chịu trách nhiệm nhận ra rằng chúng chứa thông tin xác thực cho phép truy cập trái phép hoặc các loại dữ liệu bí mật khác. Tuy nhiên, thậm chí nhiều tháng sau, các trang riêng tư vẫn có sẵn toàn bộ thông qua Copilot.
Công ty bảo mật AI Lasso đã phát hiện ra hành vi này vào nửa cuối năm 2024. Sau khi phát hiện vào tháng 1 rằng Copilot tiếp tục lưu trữ các kho riêng tư và cung cấp chúng, Lasso bắt đầu đo lường mức độ thực sự của vấn đề.
Kho lưu trữ Zombie
“Sau khi nhận ra rằng bất kỳ dữ liệu nào trên GitHub, ngay cả khi chỉ công khai trong giây lát, đều có thể được lập chỉ mục và có khả năng bị lộ bởi các công cụ như Copilot, chúng tôi rất ngạc nhiên trước mức độ dễ dàng truy cập thông tin này, các nhà nghiên cứu Ophir Dror và Bar Lanyado của ” Lasso đã viết trong a post vào thứ năm. “Quyết tâm tìm hiểu toàn bộ mức độ của vấn đề, chúng tôi bắt đầu tự động hóa quy trình xác định các kho lưu trữ zombie (các kho lưu trữ từng là công khai và hiện là riêng tư) và xác thực các phát hiện của chúng tôi.”
⁇ Sau khi phát hiện ra Microsoft đã phơi bày một trong những kho lưu trữ riêng của Lasso, các nhà nghiên cứu Lasso đã truy tìm vấn đề đến cơ chế bộ nhớ cache trong Bing. Công cụ tìm kiếm của Microsoft đã lập chỉ mục các trang khi chúng được xuất bản công khai và không bao giờ bận tâm đến việc xóa các mục sau khi các trang được đổi thành riêng tư trên GitHub. Vì Copilot sử dụng Bing làm công cụ tìm kiếm chính nên dữ liệu riêng tư cũng có sẵn thông qua bot trò chuyện AI.
Sau khi Lasso báo cáo sự cố vào tháng 11, Microsoft đã đưa ra những thay đổi được thiết kế để khắc phục nó. Lasso xác nhận rằng dữ liệu riêng tư không còn có sẵn thông qua bộ đệm Bing, nhưng nó tiếp tục tạo ra một khám phá thú vị về tính khả dụng trong Copilot của kho lưu trữ GitHub đã được đặt ở chế độ riêng tư sau một vụ kiện mà Microsoft đã đệ trình. Vụ kiện cáo buộc kho lưu trữ đã lưu trữ các công cụ được thiết kế đặc biệt để vượt qua các lan can bảo vệ an toàn và bảo mật được tích hợp trong các dịch vụ AI tổng hợp của công ty. Kho lưu trữ sau đó đã bị xóa khỏi GitHub, nhưng hóa ra, Copilot vẫn tiếp tục cung cấp các công cụ này.
