Các nhà tiếp thị quảng bá các công cụ dành cho nhà phát triển được hỗ trợ bởi AI như những con ngựa làm việc cần thiết cho kỹ sư phần mềm ngày nay. Ví dụ: nền tảng nhà phát triển GitLab tuyên bố chatbot Duo của họ có thể “ngay lập tức tạo ra một list” việc cần làm giúp loại bỏ gánh nặng “lội qua nhiều tuần cam kết.” Những gì các công ty này không nói là những công cụ này, theo tính khí nếu không mặc định, dễ dàng bị lừa bởi các tác nhân độc hại để thực hiện các hành động thù địch chống lại người dùng của h.
Các nhà nghiên cứu từ công ty bảo mật Legit hôm thứ Năm chứng minh một cuộc tấn công khiến Duo chèn mã độc vào tập lệnh mà nó đã được hướng dẫn viết. Cuộc tấn công cũng có thể làm rò rỉ mã riêng và dữ liệu vấn đề bí mật, chẳng hạn như chi tiết lỗ hổng zero-day. Tất cả những gì Lôi yêu cầu là người dùng hướng dẫn chatbot tương tác với yêu cầu hợp nhất hoặc nội dung tương tự từ một nguồn bên ngoài.
Trợ lý AI’ lưỡi dao hai lưỡi
Tất nhiên, cơ chế kích hoạt các cuộc tấn công là tiêm thuốc nhanh chóng. Trong số các hình thức khai thác chatbot phổ biến nhất, việc tiêm nhắc nhở được nhúng vào nội dung mà chatbot được yêu cầu làm việc, chẳng hạn như email cần trả lời, lịch để tham khảo hoặc trang web để tóm tắt. Các trợ lý dựa trên mô hình ngôn ngữ lớn rất háo hức làm theo hướng dẫn đến nỗi họ sẽ nhận đơn đặt hàng từ bất cứ đâu, bao gồm cả các nguồn có thể được kiểm soát bởi các tác nhân độc hại.
Các cuộc tấn công nhắm vào Duo đến từ nhiều tài nguyên khác nhau thường được các nhà phát triển sử dụng. Ví dụ bao gồm các yêu cầu hợp nhất, cam kết, mô tả và nhận xét lỗi cũng như mã nguồn. Các nhà nghiên cứu đã chứng minh cách các hướng dẫn được nhúng bên trong các nguồn này có thể khiến Duo lạc lối.
“Lỗ hổng này nêu bật bản chất hai lưỡi của các trợ lý AI như GitLab Duo: khi được tích hợp sâu vào quy trình phát triển, chúng không chỉ kế thừa bối cảnh mà còn cả rủi ro, nhà nghiên cứu Omer Mayraz của — Legit viết. “Bằng cách nhúng các hướng dẫn ẩn trong nội dung dự án dường như vô hại, chúng tôi đã có thể thao túng hành vi của Duo, lọc mã nguồn riêng và chứng minh cách các phản hồi AI có thể được tận dụng cho các kết quả ngoài ý muốn và có hại.”


