ChatGPT rơi vào cuộc tấn công truyền dữ liệu mới khi một vòng luẩn quẩn trong AI tiếp tục

Tác giả tanthanh 06/02/2026 13 phút đọc

Có một mô hình mòn trong sự phát triển của chatbot AI. Các nhà nghiên cứu phát hiện ra một lỗ hổng và khai thác nó để làm điều gì đó xấu. Nền tảng này giới thiệu một lan can bảo vệ ngăn chặn cuộc tấn công hoạt động. Sau đó, các nhà nghiên cứu nghĩ ra một tinh chỉnh đơn giản mà một lần nữa gây nguy hiểm cho người dùng chatbot.

Lý do thường xuyên hơn không phải là AI vốn được thiết kế để tuân thủ các yêu cầu của người dùng đến mức các lan can có tính phản ứng và đặc biệt, nghĩa là chúng được xây dựng để ngăn chặn một kỹ thuật tấn công cụ thể thay vì loại lỗ hổng rộng hơn có thể thực hiện được. Nó tương đương với việc đặt một lan can bảo vệ đường cao tốc mới để đối phó với một vụ tai nạn gần đây của một chiếc ô tô nhỏ gọn nhưng không bảo vệ được các loại phương tiện lớn hơn.

Nhập ZombieAgent, con trai của ShadowLeak

Một trong những ví dụ mới nhất là một lỗ hổng được phát hiện gần đây trong ChatGPT.Nó cho phép các nhà nghiên cứu tại Radware lén lút lấy ra thông tin cá nhân của người dùng. Cuộc tấn công của họ cũng cho phép dữ liệu được gửi trực tiếp từ máy chủ ChatGPT, một khả năng giúp dữ liệu có thêm khả năng tàng hình vì không có dấu hiệu vi phạm nào trên máy người dùng, nhiều máy trong số đó nằm trong các doanh nghiệp được bảo vệ. Hơn nữa, việc khai thác đã đưa các mục vào bộ nhớ dài hạn mà trợ lý AI lưu trữ cho người dùng mục tiêu, giúp nó tồn tại lâu dài.

Kiểu tấn công này đã được chứng minh nhiều lần chống lại hầu như tất cả các mô hình ngôn ngữ lớn. Một ví dụ là ShadowLeak, một lỗ hổng lọc dữ liệu trong ChatGPT của Radware tiết lộ vào tháng 9 năm ngoái. Nó nhắm mục tiêu vào Deep Research, một tác nhân AI tích hợp Chat-GPT mà OpenAI đã giới thiệu hồi đầu năm.

Đáp lại, OpenAI đã đưa ra các biện pháp giảm thiểu nhằm ngăn chặn cuộc tấn công. Tuy nhiên, với nỗ lực khiêm tốn, Radware đã tìm ra một phương pháp bỏ qua giúp hồi sinh ShadowLeak một cách hiệu quả. Công ty bảo mật đã đặt tên cho cuộc tấn công sửa đổi là ZombieAgent.

“Những kẻ tấn công có thể dễ dàng thiết kế các lời nhắc tuân thủ các quy tắc này về mặt kỹ thuật trong khi vẫn đạt được các mục tiêu độc hại, các nhà nghiên cứu của ” Radware viết trong a bài đăng vào thứ năm. “Ví dụ: ZombieAgent đã sử dụng kỹ thuật lọc từng ký tự và thao tác liên kết gián tiếp để phá vỡ các lan can OpenAI được triển khai nhằm ngăn chặn tiền thân của nó, ShadowLeak, thoát khỏi thông tin nhạy cảm. Bởi vì LLM không có sự hiểu biết cố hữu về ý định và không có ranh giới đáng tin cậy giữa các hướng dẫn hệ thống và nội dung bên ngoài, các phương pháp tấn công này vẫn có hiệu quả mặc dù đã cải tiến nhà cung cấp gia tăng.”

ZombieAgent cũng có thể duy trì cuộc tấn công bằng cách chỉ đạo ChatGPT lưu trữ logic bỏ qua trong bộ nhớ dài hạn được gán cho mỗi người dùng.

blog_zombie-agent_img6-persistent-compromise-1024x696 — Sơ đồ minh họa việc chèn các hướng dẫn vào bộ nhớ dài hạn của người dùng.

Các nhà phát triển AI cho đến nay vẫn chưa thể nghĩ ra phương tiện để LLM phân biệt giữa các nguồn của chỉ thị. Do đó, các nền tảng phải dùng đến việc chặn các cuộc tấn công cụ thể. Các nhà phát triển vẫn không thể đóng loại lỗ hổng này một cách đáng tin cậy, được gọi là tiêm nhắc gián tiếp hoặc đơn giản là tiêm nhắc.

ShadowLeak đã sử dụng tính năng tiêm nhanh đã hướng dẫn Deep Research viết một liên kết do Radware kiểm soát và thêm các tham số vào đó. Việc tiêm đã xác định các tham số là tên và địa chỉ của nhân viên. Khi Deep Research tuân thủ, nó đã mở liên kết và, trong quá trình đó, đã lọc thông tin vào nhật ký sự kiện của trang web.

Để chặn cuộc tấn công, OpenAI đã hạn chế ChatGPT chỉ mở các URL chính xác như được cung cấp và từ chối thêm tham số vào chúng, ngay cả khi được hướng dẫn rõ ràng để làm khác. Cùng với đó, ShadowLeak đã bị chặn vì LLM không thể tạo URL mới bằng cách nối các từ hoặc tên, nối thêm tham số truy vấn hoặc chèn dữ liệu do người dùng tạo vào URL cơ sở.

Tinh chỉnh ZombieAgent của Radware rất đơn giản. Các nhà nghiên cứu đã sửa đổi việc tiêm nhanh chóng để cung cấp danh sách đầy đủ các URL được xây dựng sẵn. Mỗi cái chứa URL cơ sở được thêm vào bởi một số hoặc chữ cái duy nhất của bảng chữ cái, ví dụ: example.com/a, example.com/b và mọi chữ cái tiếp theo của bảng chữ cái, cùng với example.com/0 đến example.com/9. Lời nhắc cũng hướng dẫn tác nhân thay thế một mã thông báo đặc biệt cho dấu cách.

blog_zombie-agent_img9-url-based-exfiltration-1024x722 — Sơ đồ minh họa quá trình lọc ký tự dựa trên URL để bỏ qua danh sách cho phép được giới thiệu trong ChatGPT để phản hồi ShadowLeak.

OpenAI đã giảm thiểu cuộc tấn công ZombieAgent bằng cách hạn chế ChatGPT mở bất kỳ liên kết nào bắt nguồn từ email trừ khi nó xuất hiện trong chỉ mục công khai nổi tiếng hoặc được người dùng cung cấp trực tiếp trong lời nhắc trò chuyện. Tinh chỉnh này nhằm mục đích ngăn chặn tác nhân mở các URL cơ sở dẫn đến miền do kẻ tấn công kiểm soát.

Công bằng mà nói, OpenAI hầu như không đơn độc trong chu kỳ giảm thiểu một cuộc tấn công không hồi kết này chỉ để thấy nó hồi sinh thông qua một thay đổi đơn giản. Nếu năm năm qua là bất kỳ hướng dẫn nào, mô hình này có khả năng tồn tại vô thời hạn, theo cách mà các lỗ hổng SQL injection và hỏng bộ nhớ tiếp tục cung cấp cho tin tặc nhiên liệu họ cần để xâm phạm phần mềm và trang web.

“Guardrails không nên được coi là giải pháp cơ bản cho các vấn đề tiêm chích kịp thời,” Pascal Geenens, Phó Giám đốc tình báo mối đe dọa tại Radware, viết trong một email. “Thay vào đó, chúng là giải pháp nhanh chóng để ngăn chặn một cuộc tấn công cụ thể. Miễn là không có giải pháp cơ bản, việc tiêm nhanh sẽ vẫn là mối đe dọa tích cực và rủi ro thực sự đối với các tổ chức triển khai trợ lý và tác nhân AI.”

Tác giả tanthanh Admin

Theo dõi:

Bài viết trước

Người đàn ông Michigan học được một cách khó khăn rằng “bắt một ứng dụng phần mềm gián điệp cheater” không hợp pháp

Bài viết tiếp theo

Việc tháo rời chiếc LG Rollable chưa được phát hành cho thấy lý do tại sao điện thoại màn hình cuộn không phải là một xu hướng.

Viết bình luận

Thêm bình luận

ChatGPT rơi vào cuộc tấn công truyền dữ liệu mới khi một vòng luẩn quẩn trong AI tiếp tục

Nhập ZombieAgent, con trai của ShadowLeak

Người đàn ông Michigan học được một cách khó khăn rằng “bắt một ứng dụng phần mềm gián điệp cheater” không hợp pháp

Việc tháo rời chiếc LG Rollable chưa được phát hành cho thấy lý do tại sao điện thoại màn hình cuộn không phải là một xu hướng.

Bài viết liên quan

Người đàn ông Michigan học được một cách khó khăn rằng “bắt một ứng dụng phần mềm gián điệp cheater” không hợp pháp

Các chuyên gia cảnh báo rằng lưu lượng truy cập web từ bot AI đang tiến gần đến mức sử dụng của con người.

Người sáng tạo tín hiệu Moxie Marlinspike muốn làm cho AI những gì anh ấy đã làm để nhắn tin

Luật bảo mật nghiêm ngặt nhất của quốc gia vừa có hiệu lực, khiến các nhà môi giới dữ liệu phải thất vọng

Các công ty khởi nghiệp hãy chú ý: Proton nói rằng bạn không "quá nhỏ" để bị tấn công mạng.

Chuỗi cung ứng, trí tuệ nhân tạo và điện toán đám mây: Những thất bại lớn nhất (và một thành công) của năm 2025