Các nhà nghiên cứu đặt câu hỏi về tuyên bố của Anthropic rằng cuộc tấn công có sự hỗ trợ của AI đạt hiệu quả tự động đến 90%.

Tác giả dangkhoa 06/02/2026 20 phút đọc

Các nhà nghiên cứu đặt câu hỏi về tuyên bố của Anthropic rằng cuộc tấn công có sự hỗ trợ của AI đạt hiệu quả tự động đến 90%.

Kết quả của việc tấn công mạng có sự hỗ trợ của trí tuệ nhân tạo không ấn tượng như nhiều người vẫn nghĩ.

Nguồn ảnh: Wong Yu Liang qua Getty Images

Các nhà nghiên cứu từ Anthropic cho biết gần đây họ đã quan sát thấy "chiến dịch gián điệp mạng do AI điều khiển đầu tiên được báo cáo" sau khi phát hiện các tin tặc nhà nước Trung Quốc sử dụng công cụ AI Claude của công ty trong một chiến dịch nhắm vào hàng chục mục tiêu. Các nhà nghiên cứu bên ngoài thận trọng hơn nhiều khi mô tả tầm quan trọng của phát hiện này.

Anthropic đã công bố các báo cáo vào thứ Năm tại đây và đây . Theo các báo cáo, vào tháng 9, Anthropic đã phát hiện ra một “chiến dịch gián điệp cực kỳ tinh vi” do một nhóm được nhà nước Trung Quốc tài trợ thực hiện, sử dụng Claude Code để tự động hóa tới 90% công việc. Sự can thiệp của con người chỉ cần thiết “thỉnh thoảng (có lẽ 4-6 điểm quyết định quan trọng cho mỗi chiến dịch tấn công mạng)”. Anthropic cho biết các hacker đã sử dụng khả năng của trí tuệ nhân tạo ở mức độ “chưa từng có”.

“Chiến dịch này có ý nghĩa quan trọng đối với an ninh mạng trong thời đại của các ‘tác nhân’ AI – những hệ thống có thể hoạt động tự động trong thời gian dài và hoàn thành các nhiệm vụ phức tạp mà hầu như không cần sự can thiệp của con người,” Anthropic cho biết. “Các tác nhân rất có giá trị đối với công việc và năng suất hàng ngày – nhưng nếu rơi vào tay kẻ xấu, chúng có thể làm tăng đáng kể khả năng xảy ra các cuộc tấn công mạng quy mô lớn.”

“Nịnh hót, lảng tránh vấn đề và những chuyến đi ảo giác do ma túy gây ra”

Các nhà nghiên cứu bên ngoài không tin rằng phát hiện này là bước ngoặt quan trọng như những bài đăng trên Anthropic đã mô tả. Họ đặt câu hỏi tại sao những tiến bộ kiểu này thường được cho là do tin tặc độc hại tạo ra, trong khi tin tặc mũ trắng và các nhà phát triển phần mềm hợp pháp chỉ báo cáo những cải tiến nhỏ từ việc sử dụng trí tuệ nhân tạo.

“Tôi vẫn không tin rằng những kẻ tấn công bằng cách nào đó có thể khiến các mô hình này vượt qua những thử thách mà không ai khác có thể làm được,” Dan Tentler, người sáng lập kiêm giám đốc điều hành của Phobos Group và là nhà nghiên cứu chuyên về các vụ vi phạm an ninh phức tạp, nói với Ars . “Tại sao các mô hình lại đáp ứng được yêu cầu của những kẻ tấn công đến 90% thời gian, trong khi những người còn lại chúng ta lại phải đối mặt với sự nịnh bợ, lảng tránh trách nhiệm và những rắc rối khó lường?”

Các nhà nghiên cứu không phủ nhận rằng các công cụ AI có thể cải thiện quy trình làm việc và rút ngắn thời gian cần thiết cho một số nhiệm vụ nhất định, chẳng hạn như phân loại, phân tích nhật ký và đảo ngược kỹ thuật. Tuy nhiên, khả năng tự động hóa một chuỗi nhiệm vụ phức tạp với sự tương tác tối thiểu của con người của AI vẫn còn là điều khó đạt được. Nhiều nhà nghiên cứu so sánh những tiến bộ mà AI mang lại trong các cuộc tấn công mạng với những tiến bộ do các công cụ hack như Metasploit hoặc SEToolkit cung cấp, những công cụ đã được sử dụng trong nhiều thập kỷ. Không thể phủ nhận rằng những công cụ này rất hữu ích, nhưng sự ra đời của chúng không làm tăng đáng kể khả năng của tin tặc hoặc mức độ nghiêm trọng của các cuộc tấn công mà chúng gây ra.

Một lý do khác khiến kết quả không ấn tượng như người ta vẫn nói: Các tác nhân đe dọa—mà Anthropic theo dõi với mã hiệu GTG-1002—đã nhắm mục tiêu vào ít nhất 30 tổ chức, bao gồm các tập đoàn công nghệ lớn và các cơ quan chính phủ. Trong số đó, chỉ có một “số lượng nhỏ” các cuộc tấn công thành công. Điều này, đến lượt nó, đặt ra nhiều câu hỏi. Ngay cả khi giả sử phần lớn sự tương tác của con người đã được loại bỏ khỏi quy trình, thì điều đó có ích gì khi tỷ lệ thành công lại thấp như vậy? Liệu số lượng các cuộc tấn công thành công có tăng lên nếu những kẻ tấn công sử dụng các phương pháp truyền thống, có sự tham gia của con người hơn?

Theo Anthropic, tin tặc đã sử dụng Claude để dàn dựng các cuộc tấn công bằng cách sử dụng các phần mềm và framework mã nguồn mở có sẵn. Những công cụ này đã tồn tại nhiều năm và rất dễ bị các nhà phòng thủ phát hiện. Anthropic không nêu chi tiết các kỹ thuật, công cụ hoặc cách khai thác cụ thể đã xảy ra trong các cuộc tấn công, nhưng cho đến nay, chưa có dấu hiệu nào cho thấy việc sử dụng trí tuệ nhân tạo khiến các cuộc tấn công trở nên mạnh mẽ hơn hoặc khó phát hiện hơn so với các kỹ thuật truyền thống.

"Những kẻ gây ra mối đe dọa không hề phát minh ra điều gì mới mẻ ở đây," nhà nghiên cứu độc lập Kevin Beaumont cho biết .

Ngay cả Anthropic cũng lưu ý "một hạn chế quan trọng" trong các phát hiện của mình:

Claude thường xuyên phóng đại các phát hiện và đôi khi bịa đặt dữ liệu trong các hoạt động tự động, tuyên bố đã có được thông tin xác thực không hoạt động hoặc xác định những phát hiện quan trọng mà hóa ra lại là thông tin công khai. Ảo tưởng về trí tuệ nhân tạo này trong bối cảnh an ninh tấn công đã đặt ra thách thức đối với hiệu quả hoạt động của tác nhân, đòi hỏi phải xác thực cẩn thận tất cả các kết quả được tuyên bố. Điều này vẫn là một trở ngại đối với các cuộc tấn công mạng hoàn toàn tự động.

(Theo Anthropic) diễn biến vụ tấn công như thế nào

Anthropic cho biết GTG-1002 đã phát triển một khung tấn công tự động sử dụng Claude làm cơ chế điều phối, giúp loại bỏ phần lớn sự cần thiết của sự can thiệp của con người. Hệ thống điều phối này chia nhỏ các cuộc tấn công đa giai đoạn phức tạp thành các nhiệm vụ kỹ thuật nhỏ hơn như quét lỗ hổng, xác thực thông tin đăng nhập, trích xuất dữ liệu và di chuyển ngang.

“Kiến trúc này tích hợp các khả năng kỹ thuật của Claude như một công cụ thực thi trong một hệ thống tự động lớn hơn, nơi trí tuệ nhân tạo thực hiện các hành động kỹ thuật cụ thể dựa trên hướng dẫn của người vận hành trong khi logic điều phối duy trì trạng thái tấn công, quản lý các giai đoạn chuyển đổi và tổng hợp kết quả trên nhiều phiên,” Anthropic cho biết. “Cách tiếp cận này cho phép tác nhân đe dọa đạt được quy mô hoạt động thường thấy trong các chiến dịch của quốc gia trong khi vẫn duy trì sự can thiệp trực tiếp tối thiểu, vì khung hệ thống tự động tiến hành qua các giai đoạn trinh sát, truy cập ban đầu, duy trì và đánh cắp dữ liệu bằng cách sắp xếp trình tự các phản hồi của Claude và điều chỉnh các yêu cầu tiếp theo dựa trên thông tin được phát hiện.”

Các cuộc tấn công diễn ra theo cấu trúc năm giai đoạn, trong đó mức độ tự chủ của AI tăng lên qua từng giai đoạn.

Những kẻ tấn công đã có thể vượt qua các rào cản bảo mật của Claude một phần bằng cách chia nhỏ các nhiệm vụ thành các bước nhỏ mà, nếu xét riêng lẻ, công cụ AI này không nhận định là độc hại. Trong các trường hợp khác, những kẻ tấn công đã ngụy trang các yêu cầu của mình trong bối cảnh các chuyên gia bảo mật đang cố gắng sử dụng Claude để cải thiện khả năng phòng thủ.

Như đã đề cập tuần trước , phần mềm độc hại do AI phát triển còn một chặng đường dài trước khi nó gây ra mối đe dọa thực sự. Không có lý do gì để nghi ngờ rằng các cuộc tấn công mạng có sự hỗ trợ của AI một ngày nào đó có thể tạo ra những cuộc tấn công mạnh mẽ hơn. Nhưng dữ liệu cho đến nay cho thấy rằng các tác nhân đe dọa—giống như hầu hết những người khác sử dụng AI—đang thấy những kết quả trái chiều, không ấn tượng như những gì ngành công nghiệp AI tuyên bố.

Tác giả dangkhoa Admin

Theo dõi:

Bài viết trước

5 người nhận tội trong vụ án buôn bán laptop và đánh cắp danh tính để giúp người Triều Tiên có được việc làm trong lĩnh vực CNTT tại Mỹ

Bài viết tiếp theo

Rất tiếc. Các nhà mật mã hủy kết quả bầu cử sau khi mất khóa giải mã.

Viết bình luận

Thêm bình luận

Các nhà nghiên cứu đặt câu hỏi về tuyên bố của Anthropic rằng cuộc tấn công có sự hỗ trợ của AI đạt hiệu quả tự động đến 90%.

Các nhà nghiên cứu đặt câu hỏi về tuyên bố của Anthropic rằng cuộc tấn công có sự hỗ trợ của AI đạt hiệu quả tự động đến 90%.

“Nịnh hót, lảng tránh vấn đề và những chuyến đi ảo giác do ma túy gây ra”

(Theo Anthropic) diễn biến vụ tấn công như thế nào

5 người nhận tội trong vụ án buôn bán laptop và đánh cắp danh tính để giúp người Triều Tiên có được việc làm trong lĩnh vực CNTT tại Mỹ

Rất tiếc. Các nhà mật mã hủy kết quả bầu cử sau khi mất khóa giải mã.

Bài viết liên quan

5 người nhận tội trong vụ án buôn bán laptop và đánh cắp danh tính để giúp người Triều Tiên có được việc làm trong lĩnh vực CNTT tại Mỹ

Vụ trộm Bitcoin điên rồ: Khách sạn 5 sao, phong bì đầy tiền mặt, tiền biến mất không dấu vết

Các nhà phê bình chế giễu sau khi Microsoft cảnh báo tính năng AI có thể lây nhiễm vào máy móc và đánh cắp dữ liệu.

Rất tiếc. Các nhà mật mã hủy kết quả bầu cử sau khi mất khóa giải mã.

Làm thế nào để biết bộ định tuyến Asus của bạn có phải là một trong hàng ngàn bị tin tặc nhà nước Trung Quốc tấn công hay không

ClickFix có thể là mối đe dọa an ninh lớn nhất mà gia đình bạn chưa từng nghe đến.