Anthropic cho rằng DeepSeek có thể đã sử dụng kỹ thuật chưng cất mô hình từ Claude
Anthropic cáo buộc rằng một công ty AI tại Trung Quốc có tên DeepSeek có thể đã sử dụng kỹ thuật chưng cất mô hình để khai thác năng lực từ Claude, mô hình AI do Anthropic phát triển.
Theo thông tin được đưa ra, Anthropic cho biết họ phát hiện dấu hiệu cho thấy đầu ra của DeepSeek có điểm tương đồng với Claude, làm dấy lên nghi vấn về việc sử dụng kỹ thuật distillation. Đây là phương pháp trong đó một mô hình nhỏ hơn được huấn luyện dựa trên kết quả đầu ra của một mô hình lớn hơn, thay vì trực tiếp truy cập dữ liệu huấn luyện gốc.
Anthropic không công bố bằng chứng kỹ thuật chi tiết nhưng nhấn mạnh rằng việc sử dụng đầu ra của mô hình khác để huấn luyện mà không được phép có thể vi phạm điều khoản dịch vụ và làm dấy lên tranh cãi pháp lý.
Phía DeepSeek chưa đưa ra phản hồi chính thức về cáo buộc này. Vấn đề distillation đang trở thành chủ đề nóng trong ngành AI, khi nhiều công ty tìm cách xây dựng mô hình hiệu quả hơn bằng cách học từ các hệ thống mạnh hơn.
Vụ việc cho thấy mức độ cạnh tranh ngày càng gay gắt giữa các công ty AI toàn cầu, đồng thời đặt ra câu hỏi về cách bảo vệ quyền sở hữu trí tuệ và thực thi điều khoản sử dụng trong lĩnh vực mô hình ngôn ngữ lớn.