Các nhà nghiên cứu từ Anthropic cho biết gần đây họ đã quan sát thấy "chiến dịch gián điệp mạng do AI điều khiển đầu tiên được báo cáo" sau khi phát hiện các tin tặc nhà nước Trung Quốc sử dụng công cụ AI Claude của công ty trong một chiến dịch nhắm vào hàng chục mục tiêu. Các nhà nghiên cứu bên ngoài thận trọng hơn nhiều khi mô tả tầm quan trọng của phát hiện này.
Anthropic đã công bố các báo cáo vào thứ Năm tại đây và đây . Theo các báo cáo, vào tháng 9, Anthropic đã phát hiện ra một “chiến dịch gián điệp cực kỳ tinh vi” do một nhóm được nhà nước Trung Quốc tài trợ thực hiện, sử dụng Claude Code để tự động hóa tới 90% công việc. Sự can thiệp của con người chỉ cần thiết “thỉnh thoảng (có lẽ 4-6 điểm quyết định quan trọng cho mỗi chiến dịch tấn công mạng)”. Anthropic cho biết các hacker đã sử dụng khả năng của trí tuệ nhân tạo ở mức độ “chưa từng có”.
“Chiến dịch này có ý nghĩa quan trọng đối với an ninh mạng trong thời đại của các ‘tác nhân’ AI – những hệ thống có thể hoạt động tự động trong thời gian dài và hoàn thành các nhiệm vụ phức tạp mà hầu như không cần sự can thiệp của con người,” Anthropic cho biết. “Các tác nhân rất có giá trị đối với công việc và năng suất hàng ngày – nhưng nếu rơi vào tay kẻ xấu, chúng có thể làm tăng đáng kể khả năng xảy ra các cuộc tấn công mạng quy mô lớn.”
“Nịnh hót, lảng tránh vấn đề và những chuyến đi ảo giác do ma túy gây ra”
Các nhà nghiên cứu bên ngoài không tin rằng phát hiện này là bước ngoặt quan trọng như những bài đăng trên Anthropic đã mô tả. Họ đặt câu hỏi tại sao những tiến bộ kiểu này thường được cho là do tin tặc độc hại tạo ra, trong khi tin tặc mũ trắng và các nhà phát triển phần mềm hợp pháp chỉ báo cáo những cải tiến nhỏ từ việc sử dụng trí tuệ nhân tạo.
“Tôi vẫn không tin rằng những kẻ tấn công bằng cách nào đó có thể khiến các mô hình này vượt qua những thử thách mà không ai khác có thể làm được,” Dan Tentler, người sáng lập kiêm giám đốc điều hành của Phobos Group và là nhà nghiên cứu chuyên về các vụ vi phạm an ninh phức tạp, nói với Ars . “Tại sao các mô hình lại đáp ứng được yêu cầu của những kẻ tấn công đến 90% thời gian, trong khi những người còn lại chúng ta lại phải đối mặt với sự nịnh bợ, lảng tránh trách nhiệm và những rắc rối khó lường?”

