Báo cáo: Lịch sử trò chuyện và dữ liệu nội bộ của DeepSeek đã được công khai

Tác giả tanthanh 14/02/2026 7 phút đọc

Một công ty bảo mật đám mây đã tìm thấy một cơ sở dữ liệu có thể truy cập công khai, có thể kiểm soát hoàn toàn thuộc về DeepSeek, công ty Trung Quốc gần đây đã làm rung chuyển thế giới AI, “trong vòng vài phút” sau khi kiểm tra bảo mật của DeepSeek, theo một bài đăng trên blog của Wiz".

Cơ sở dữ liệu ClickHouse phân tích gắn liền với DeepSeek, “hoàn toàn mở và không được xác thực,” chứa hơn 1 triệu phiên bản lịch sử trò chuyện “, dữ liệu phụ trợ và thông tin nhạy cảm, bao gồm luồng nhật ký, bí mật API và chi tiết hoạt động,” theo Wiz. Giao diện web mở cũng cho phép kiểm soát cơ sở dữ liệu đầy đủ và leo thang đặc quyền, với các điểm cuối và khóa API nội bộ có sẵn thông qua giao diện và các tham số URL chung.

“Mặc dù phần lớn sự chú ý xung quanh bảo mật AI tập trung vào các mối đe dọa trong tương lai, nhưng những mối nguy hiểm thực sự thường đến từ những rủi ro cơ bản, giống như việc vô tình tiếp xúc với cơ sở dữ liệu bên ngoài, — Gal Nagli viết trên blog của Wiz. “Khi các tổ chức vội vàng áp dụng các công cụ và dịch vụ AI từ số lượng công ty khởi nghiệp và nhà cung cấp ngày càng tăng, điều cần thiết cần nhớ là bằng cách làm như vậy, chúng tôi đang ủy thác cho các công ty này dữ liệu nhạy cảm. Tốc độ áp dụng nhanh chóng thường dẫn đến việc bỏ qua bảo mật, nhưng việc bảo vệ dữ liệu khách hàng vẫn phải là ưu tiên hàng đầu.”

Ars đã liên hệ với DeepSeek để nhận xét và sẽ cập nhật bài đăng này với bất kỳ phản hồi nào. Wiz lưu ý rằng họ không nhận được phản hồi từ DeepSeek về những phát hiện của mình, nhưng sau khi liên hệ với mọi email DeepSeek và hồ sơ LinkedIn mà Wiz có thể tìm thấy vào thứ Tư, công ty đã bảo vệ cơ sở dữ liệu mà Wiz đã truy cập trước đó trong vòng nửa giờ.

“Việc xảy ra sai sót là đúng, nhưng đây là một sai lầm nghiêm trọng, vì mức độ nỗ lực rất thấp và mức độ truy cập mà chúng tôi nhận được rất cao,” Ami Luttwak, CTO của Wiz, nói với WIRED. “Tôi có thể nói rằng điều đó có nghĩa là dịch vụ này chưa hoàn thiện để sử dụng với bất kỳ dữ liệu nhạy cảm nào.”

Mô hình R1 của DeepSeek, a mô hình lý luận mô phỏng có sẵn miễn phí rằng DeepSeek và một số người thử nghiệm tin rằng phù hợp với mô hình o1 của OpenAI về hiệu suất, đã gây ra một ngọn lửa biến động trong thị trường công nghệ và AI. DeepSeek có mục đích chạy với chi phí chỉ bằng một phần nhỏ của o1, ít nhất là trên các máy chủ của DeepSeek. Công suất dường như giảm đáng kể cần thiết để chạy và huấn luyện R1 giá cổ phiếu công ty điện lực rung chuyển. Ars’ Kyle Orlando nhận thấy R1 rất ấn tượng, do sự xuất hiện dường như đột ngột và quy mô nhỏ hơn, nhưng lưu ý một số thiếu sót so với các mẫu OpenAI.

OpenAI nói với Financial Times rằng họ tin rằng DeepSeek đã sử dụng đầu ra OpenAI để huấn luyện mô hình R1 của mình, trong một phương pháp được gọi là chưng cất. Việc đào tạo như vậy vi phạm các điều khoản dịch vụ của OpenAI, và công ty nói với Ars nó sẽ làm việc với chính phủ Hoa Kỳ để bảo vệ mô hình của mình. Khi kiểm tra các hệ thống của DeepSeek, các nhà nghiên cứu của Wiz nói với WIRED, họ đã tìm thấy nhiều điểm tương đồng về cấu trúc với OpenAI, dường như để khách hàng có thể chuyển từ công ty đó sang DeepSeek.