ChatGPT rơi vào cuộc tấn công truyền dữ liệu mới khi một vòng luẩn quẩn trong AI tiếp tục

Tác giả tanthanh 06/02/2026 13 phút đọc

Có một mô hình mòn trong sự phát triển của chatbot AI. Các nhà nghiên cứu phát hiện ra một lỗ hổng và khai thác nó để làm điều gì đó xấu. Nền tảng này giới thiệu một lan can bảo vệ ngăn chặn cuộc tấn công hoạt động. Sau đó, các nhà nghiên cứu nghĩ ra một tinh chỉnh đơn giản mà một lần nữa gây nguy hiểm cho người dùng chatbot.

Lý do thường xuyên hơn không phải là AI vốn được thiết kế để tuân thủ các yêu cầu của người dùng đến mức các lan can có tính phản ứng và đặc biệt, nghĩa là chúng được xây dựng để ngăn chặn một kỹ thuật tấn công cụ thể thay vì loại lỗ hổng rộng hơn có thể thực hiện được. Nó tương đương với việc đặt một lan can bảo vệ đường cao tốc mới để đối phó với một vụ tai nạn gần đây của một chiếc ô tô nhỏ gọn nhưng không bảo vệ được các loại phương tiện lớn hơn.

Nhập ZombieAgent, con trai của ShadowLeak

Một trong những ví dụ mới nhất là một lỗ hổng được phát hiện gần đây trong ChatGPT.Nó cho phép các nhà nghiên cứu tại Radware lén lút lấy ra thông tin cá nhân của người dùng. Cuộc tấn công của họ cũng cho phép dữ liệu được gửi trực tiếp từ máy chủ ChatGPT, một khả năng giúp dữ liệu có thêm khả năng tàng hình vì không có dấu hiệu vi phạm nào trên máy người dùng, nhiều máy trong số đó nằm trong các doanh nghiệp được bảo vệ. Hơn nữa, việc khai thác đã đưa các mục vào bộ nhớ dài hạn mà trợ lý AI lưu trữ cho người dùng mục tiêu, giúp nó tồn tại lâu dài.

Kiểu tấn công này đã được chứng minh nhiều lần chống lại hầu như tất cả các mô hình ngôn ngữ lớn. Một ví dụ là ShadowLeak, một lỗ hổng lọc dữ liệu trong ChatGPT của Radware tiết lộ vào tháng 9 năm ngoái. Nó nhắm mục tiêu vào Deep Research, một tác nhân AI tích hợp Chat-GPT mà OpenAI đã giới thiệu hồi đầu năm.

Đáp lại, OpenAI đã đưa ra các biện pháp giảm thiểu nhằm ngăn chặn cuộc tấn công. Tuy nhiên, với nỗ lực khiêm tốn, Radware đã tìm ra một phương pháp bỏ qua giúp hồi sinh ShadowLeak một cách hiệu quả. Công ty bảo mật đã đặt tên cho cuộc tấn công sửa đổi là ZombieAgent.

ZombieAgent cũng có thể duy trì cuộc tấn công bằng cách chỉ đạo ChatGPT lưu trữ logic bỏ qua trong bộ nhớ dài hạn được gán cho mỗi người dùng.

blog_zombie-agent_img6-persistent-compromise-1024x696
Sơ đồ minh họa việc chèn các hướng dẫn vào bộ nhớ dài hạn của người dùng.
Giống như trường hợp của một số lượng lớn các lỗ hổng LLM khác, nguyên nhân sâu xa là do không thể phân biệt các hướng dẫn hợp lệ trong lời nhắc với người dùng và những hướng dẫn được nhúng vào email hoặc tài liệu khác mà bất kỳ ai—, kể cả kẻ tấn công— có thể gửi đến mục tiêu. Khi người dùng định cấu hình tác nhân AI để tóm tắt email, LLM sẽ diễn giải các hướng dẫn được tích hợp vào tin nhắn dưới dạng lời nhắc hợp lệ.

Các nhà phát triển AI cho đến nay vẫn chưa thể nghĩ ra phương tiện để LLM phân biệt giữa các nguồn của chỉ thị. Do đó, các nền tảng phải dùng đến việc chặn các cuộc tấn công cụ thể. Các nhà phát triển vẫn không thể đóng loại lỗ hổng này một cách đáng tin cậy, được gọi là tiêm nhắc gián tiếp hoặc đơn giản là tiêm nhắc.

ShadowLeak đã sử dụng tính năng tiêm nhanh đã hướng dẫn Deep Research viết một liên kết do Radware kiểm soát và thêm các tham số vào đó. Việc tiêm đã xác định các tham số là tên và địa chỉ của nhân viên. Khi Deep Research tuân thủ, nó đã mở liên kết và, trong quá trình đó, đã lọc thông tin vào nhật ký sự kiện của trang web.

Để chặn cuộc tấn công, OpenAI đã hạn chế ChatGPT chỉ mở các URL chính xác như được cung cấp và từ chối thêm tham số vào chúng, ngay cả khi được hướng dẫn rõ ràng để làm khác. Cùng với đó, ShadowLeak đã bị chặn vì LLM không thể tạo URL mới bằng cách nối các từ hoặc tên, nối thêm tham số truy vấn hoặc chèn dữ liệu do người dùng tạo vào URL cơ sở.

Tinh chỉnh ZombieAgent của Radware rất đơn giản. Các nhà nghiên cứu đã sửa đổi việc tiêm nhanh chóng để cung cấp danh sách đầy đủ các URL được xây dựng sẵn. Mỗi cái chứa URL cơ sở được thêm vào bởi một số hoặc chữ cái duy nhất của bảng chữ cái, ví dụ: example.com/a, example.com/b và mọi chữ cái tiếp theo của bảng chữ cái, cùng với example.com/0 đến example.com/9. Lời nhắc cũng hướng dẫn tác nhân thay thế một mã thông báo đặc biệt cho dấu cách.

blog_zombie-agent_img9-url-based-exfiltration-1024x722
Sơ đồ minh họa quá trình lọc ký tự dựa trên URL để bỏ qua danh sách cho phép được giới thiệu trong ChatGPT để phản hồi ShadowLeak.
ZombieAgent hoạt động vì các nhà phát triển OpenAI đã không hạn chế việc thêm một chữ cái vào URL. Điều đó cho phép cuộc tấn công lọc dữ liệu từng chữ một.

OpenAI đã giảm thiểu cuộc tấn công ZombieAgent bằng cách hạn chế ChatGPT mở bất kỳ liên kết nào bắt nguồn từ email trừ khi nó xuất hiện trong chỉ mục công khai nổi tiếng hoặc được người dùng cung cấp trực tiếp trong lời nhắc trò chuyện. Tinh chỉnh này nhằm mục đích ngăn chặn tác nhân mở các URL cơ sở dẫn đến miền do kẻ tấn công kiểm soát.

Công bằng mà nói, OpenAI hầu như không đơn độc trong chu kỳ giảm thiểu một cuộc tấn công không hồi kết này chỉ để thấy nó hồi sinh thông qua một thay đổi đơn giản. Nếu năm năm qua là bất kỳ hướng dẫn nào, mô hình này có khả năng tồn tại vô thời hạn, theo cách mà các lỗ hổng SQL injection và hỏng bộ nhớ tiếp tục cung cấp cho tin tặc nhiên liệu họ cần để xâm phạm phần mềm và trang web.

“Guardrails không nên được coi là giải pháp cơ bản cho các vấn đề tiêm chích kịp thời,” Pascal Geenens, Phó Giám đốc tình báo mối đe dọa tại Radware, viết trong một email. “Thay vào đó, chúng là giải pháp nhanh chóng để ngăn chặn một cuộc tấn công cụ thể. Miễn là không có giải pháp cơ bản, việc tiêm nhanh sẽ vẫn là mối đe dọa tích cực và rủi ro thực sự đối với các tổ chức triển khai trợ lý và tác nhân AI.”

Tác giả tanthanh Admin
Bài viết trước Người đàn ông Michigan học được một cách khó khăn rằng “bắt một ứng dụng phần mềm gián điệp cheater” không hợp pháp

Người đàn ông Michigan học được một cách khó khăn rằng “bắt một ứng dụng phần mềm gián điệp cheater” không hợp pháp

Bài viết tiếp theo

Không nên tự build PC gaming 1.000 USD vào năm 2026

Không nên tự build PC gaming 1.000 USD vào năm 2026
Viết bình luận
Thêm bình luận

Bài viết liên quan

Thông báo

0917111899