Trí tuệ nhân tạo có thể viết lại mã nguồn mở, nhưng liệu nó cũng có thể viết lại giấy phép sử dụng?

Tác giả dangkhoa 13/03/2026 23 phút đọc

Trí tuệ nhân tạo có thể viết lại mã nguồn mở, nhưng liệu nó cũng có thể viết lại giấy phép sử dụng?

Đây có phải là "kỹ thuật đảo ngược" thuần túy hay chỉ là một "tác phẩm phái sinh" được lọc bằng LLM?    

GettyImages-2167753513-1152x648
 
Hãy cùng chào đón đội ngũ lập trình mã nguồn mở mới của bạn! 

Các kỹ sư máy tính và lập trình viên từ lâu đã dựa vào kỹ thuật đảo ngược để sao chép chức năng của một chương trình máy tính mà không cần sao chép trực tiếp mã nguồn được bảo vệ bản quyền của chương trình đó. Giờ đây, các công cụ lập trình AI đang đặt ra những vấn đề mới về cách thức quá trình viết lại "trong môi trường sạch" này diễn ra về mặt pháp lý, đạo đức và thực tiễn.

Những vấn đề đó đã nổi lên vào tuần trước với sự ra mắt phiên bản mới của chardet , một thư viện Python mã nguồn mở phổ biến dùng để tự động phát hiện mã hóa ký tự. Kho lưu trữ này ban đầu được lập trình viên Mark Pilgrim viết vào năm 2006 và được phát hành theo giấy phép LGPL , đặt ra những giới hạn nghiêm ngặt về cách thức tái sử dụng và phân phối lại.

 

Dan Blanchard tiếp quản việc bảo trì kho lưu trữ vào năm 2012 nhưng đã vướng vào một số tranh cãi với việc phát hành phiên bản 7.0 của chardet vào tuần trước. Blanchard mô tả sự cải tiến đó là "một bản viết lại hoàn toàn từ đầu, được cấp phép theo giấy phép MIT" của toàn bộ thư viện được xây dựng với sự giúp đỡ của Claude Code để "nhanh hơn và chính xác hơn nhiều" so với phiên bản trước đó.

Trả lời phỏng vấn tờ The Register , Blanchard cho biết ông từ lâu đã muốn đưa chardet vào thư viện chuẩn của Python nhưng không có thời gian để khắc phục các vấn đề về “giấy phép, tốc độ và độ chính xác” khiến mục tiêu đó bị cản trở. Tuy nhiên, với sự giúp đỡ của Claude Code, Blanchard cho biết ông đã có thể cải tiến toàn diện thư viện “trong khoảng năm ngày” và đạt được hiệu suất tăng gấp 48 lần.

Tuy nhiên, không phải ai cũng hài lòng với kết quả đó. Một người dùng có tên Mark Pilgrim đã xuất hiện trên GitHub để lập luận rằng phiên bản mới này là hành vi cấp phép lại trái phép mã nguồn gốc của Pilgrim theo giấy phép MIT dễ dãi hơn (trong đó, ngoài những điều khoản khác, cho phép sử dụng trong các dự án mã nguồn đóng). Là một bản sửa đổi của mã nguồn gốc được cấp phép theo LGPL, Pilgrim lập luận rằng phiên bản chardet mới này cũng phải duy trì cùng giấy phép LGPL.

“Tuyên bố của họ rằng đây là một ‘bản viết lại hoàn toàn’ là không liên quan, vì họ đã có đủ kinh nghiệm với mã nguồn được cấp phép ban đầu (tức là đây không phải là một bản triển khai ‘mới hoàn toàn’),” Pilgrim viết. “Việc thêm một trình tạo mã phức tạp vào không hề mang lại cho họ bất kỳ quyền lợi bổ sung nào. Tôi trân trọng yêu cầu họ khôi phục dự án về giấy phép ban đầu.”

Mã này là của ai vậy?

Trong phản hồi của mình đối với Pilgrim , Blanchard thừa nhận rằng ông đã có “tiếp xúc rộng rãi với mã nguồn gốc”, nghĩa là ông không có sự “tách biệt nghiêm ngặt” truyền thống thường được sử dụng cho việc đảo ngược kỹ thuật trong môi trường “sạch”. Nhưng truyền thống đó được thiết lập cho các lập trình viên nhằm “đảm bảo mã nguồn thu được không phải là sản phẩm phái sinh từ bản gốc”, Blanchard lập luận.

Trong trường hợp này, Blanchard cho biết mã do AI tạo ra mới "khác biệt về chất lượng" so với mã trước đó và "độc lập về cấu trúc với mã cũ". Để chứng minh điều này, ông dẫn chứng số liệu thống kê về độ tương đồng của JPlag cho thấy tối đa 1,29% bất kỳ tệp chardet phiên bản 7.0.0 nào có cấu trúc tương tự với tệp tương ứng trong phiên bản 6.0.0. Mặt khác, khi so sánh phiên bản 5.2.0 với phiên bản 6.0.0, người ta thấy độ tương đồng lên đến 80% ở một số tệp tương ứng.

“Không có tệp nào trong mã nguồn phiên bản 7.0.0 có cấu trúc tương tự bất kỳ tệp nào từ bất kỳ phiên bản nào trước đó,” Blanchard viết. “Đây không phải là trường hợp 'viết lại hầu hết nhưng giữ lại một số tệp'. Không có gì được giữ lại cả.”

wipeitclean
 
Blanchard cho biết việc bắt đầu bằng một thao tác "xóa sạch" và một kho lưu trữ mới là chìa khóa để tạo ra mã nguồn mới, không phái sinh từ AI. Ảnh: Dan Blanchard / Github

Blanchard cho biết ông đã có thể hoàn thành quy trình “phòng sạch AI” này bằng cách đầu tiên xác định kiến ​​trúc trong tài liệu thiết kế và viết ra một số yêu cầu cho Claude Code. Sau đó, Blanchard “bắt đầu với một kho lưu trữ trống rỗng mà không có quyền truy cập vào cây mã nguồn cũ và chỉ thị rõ ràng cho Claude không được dựa trên bất kỳ mã nào được cấp phép theo LGPL/GPL.”

Tuy nhiên, có một vài yếu tố phức tạp làm cho câu chuyện tưởng chừng đơn giản này trở nên khó hiểu. Thứ nhất, Claude đã dựa vào một số tệp siêu dữ liệu từ các phiên bản trước của chardet , điều này đặt ra câu hỏi trực tiếp về việc liệu phiên bản này có thực sự là "phiên bản phái sinh" hay không.

Hơn nữa, các mô hình của Claude được huấn luyện trên lượng lớn dữ liệu lấy từ Internet công cộng , điều đó có nghĩa là rất có thể Claude đã sử dụng mã nguồn mở của các phiên bản chardet trước đó trong quá trình huấn luyện. Liệu "kiến thức" trước đó có đồng nghĩa với việc sản phẩm của Claude là một "sản phẩm phái sinh" từ công trình của Pilgrim hay không vẫn là một câu hỏi bỏ ngỏ, ngay cả khi mã mới có cấu trúc khác biệt so với mã cũ.

Và sau đó là yếu tố con người. Mặc dù mã nguồn cho phiên bản mới này được tạo ra bởi Claude, Blanchard cho biết ông đã “xem xét, kiểm tra và cải tiến từng phần của kết quả bằng cách sử dụng Claude. … Tôi không tự tay viết mã, nhưng tôi đã tham gia sâu vào việc thiết kế, xem xét và cải tiến mọi khía cạnh của nó.” Việc có một người am hiểu sâu sắc về mã nguồn chardet trước đó tham gia tích cực vào việc xem xét mã nguồn mới cũng có thể ảnh hưởng đến việc liệu phiên bản này có thể được coi là một dự án hoàn toàn mới hay không.

 

Thế giới mới dũng cảm

Tất cả những vấn đề này đã dẫn đến một cuộc tranh luận lớn về tính hợp pháp của phiên bản chardet 7.0.0 trong cộng đồng mã nguồn mở. Giám đốc điều hành của Free Software Foundation, Zoë Kooyman, nói với The Register : “Không có gì 'sạch sẽ' khi một Mô hình Ngôn ngữ Lớn lại tiếp nhận chính mã nguồn mà nó đang được yêu cầu viết lại” .

Nhưng những người khác lại cho rằng những lập luận kiểu "Con tàu của Theseus" thường xuất hiện trong các vụ tranh chấp bản quyền mã nguồn không áp dụng nhiều ở đây. "Nếu bạn vứt bỏ toàn bộ mã nguồn và bắt đầu lại từ đầu, ngay cả khi kết quả cuối cùng hoạt động giống nhau, thì đó vẫn là một con tàu mới," nhà phát triển mã nguồn mở Armin Ronacher cho biết trong một bài đăng trên blog phân tích tình hình .

GettyImages-2263095145
 
Tình trạng pháp lý của mã lập trình do trí tuệ nhân tạo tạo ra vẫn còn nhiều vấn đề chưa được giải quyết rõ ràng. Ảnh: Getty Images

Bỏ qua các vấn đề về giấy phép mã nguồn cũ, việc sử dụng AI để tạo ra mã nguồn mới hoàn toàn cũng có thể tạo ra những rắc rối pháp lý riêng trong tương lai. Tòa án đã phán quyết rằng AI không thể là tác giả của bằng sáng chế hoặc chủ sở hữu bản quyền của một tác phẩm nghệ thuật  , nhưng vẫn chưa đưa ra phán quyết về ý nghĩa của điều đó đối với việc cấp phép phần mềm được tạo ra toàn bộ hoặc một phần bởi AI. Các vấn đề xung quanh khả năng "làm ô nhiễm" giấy phép mã nguồn mở bằng loại mã được tạo ra này có thể trở nên phức tạp một cách nhanh chóng .

Dù kết quả thế nào đi nữa, tác động thực tiễn của việc có thể sử dụng AI để nhanh chóng viết lại và cấp phép lại nhiều dự án mã nguồn mở—mà không cần tốn nhiều công sức của lập trình viên—chắc chắn sẽ tạo ra hiệu ứng lan tỏa mạnh mẽ trong toàn cộng đồng.

“Giờ đây, quá trình viết lại mã nguồn trở nên đơn giản đến mức nhiều người cảm thấy khó chịu về điều này,” lập trình viên người Ý Salvatore “antirez” Sanfilippo viết trên blog của mình . “Có một sự thật cơ bản hơn ở đây: bản chất của phần mềm đã thay đổi; việc viết lại mã nguồn theo các giấy phép khác nhau chỉ là một ví dụ về cách bản chất đó đã biến đổi mãi mãi. Thay vì chống lại từng biểu hiện của lập trình tự động, tôi tin rằng tốt hơn hết là nên xây dựng một mô hình tư duy mới và thích nghi.”

Những người khác lại diễn đạt sự thay đổi lớn lao này bằng những từ ngữ đáng báo động hơn. “Tôi đang đập vỡ kính và kéo chuông báo cháy!” nhà truyền bá mã nguồn mở Bruce Perens nói với tờ The Register . “Toàn bộ nền kinh tế của ngành phát triển phần mềm đã chết, biến mất, kết thúc, sụp đổ!… Chúng ta đã từng trải qua điều này trước đây, ví dụ như khi máy in ra đời và dẫn đến luật bản quyền, khi phương pháp khoa học phát triển mạnh và đột nhiên xuất hiện một cấu trúc logic cho việc tích lũy kiến ​​thức. Tôi nghĩ sự thay đổi này cũng lớn lao không kém.”

Tác giả dangkhoa Admin
Bài viết trước Zoox dự định đưa dịch vụ taxi tự lái của mình lên ứng dụng Uber tại Las Vegas trong năm nay.

Zoox dự định đưa dịch vụ taxi tự lái của mình lên ứng dụng Uber tại Las Vegas trong năm nay.

Bài viết tiếp theo

Phần mềm chống vi-rút tốt nhất để bảo vệ máy tính của bạn vào năm 2026

Phần mềm chống vi-rút tốt nhất để bảo vệ máy tính của bạn vào năm 2026
Viết bình luận
Thêm bình luận

Bài viết liên quan

Thông báo

0917111899