Trong lập trình, phản hồi từ đồng nghiệp là yếu tố rất quan trọng để phát hiện lỗi sớm, duy trì sự nhất quán trong codebase và cải thiện chất lượng phần mềm.

Sự phát triển của “vibe coding” — tức là sử dụng các công cụ AI có thể nhận hướng dẫn bằng ngôn ngữ tự nhiên và nhanh chóng tạo ra lượng lớn mã — đã thay đổi cách các lập trình viên làm việc. Những công cụ này giúp tăng tốc quá trình phát triển, nhưng đồng thời cũng tạo ra nhiều lỗi mới, rủi ro bảo mật và những đoạn mã mà lập trình viên chưa hiểu rõ hoàn toàn.
Giải pháp của Anthropic là một AI chuyên đánh giá mã nguồn, được thiết kế để phát hiện lỗi trước khi chúng được đưa vào codebase của phần mềm. Sản phẩm mới có tên Code Review, được ra mắt trong Claude Code.
Cat Wu, trưởng bộ phận sản phẩm của Anthropic, cho biết:
“Chúng tôi đã thấy sự tăng trưởng rất lớn của Claude Code, đặc biệt trong các doanh nghiệp. Một trong những câu hỏi mà các lãnh đạo doanh nghiệp thường hỏi là: Khi Claude Code tạo ra rất nhiều pull request, làm thế nào để chúng tôi đảm bảo chúng được xem xét một cách hiệu quả?”
Pull request là cơ chế mà các lập trình viên sử dụng để gửi các thay đổi trong mã để được xem xét trước khi chúng được hợp nhất vào phần mềm. Wu cho biết Claude Code đã tăng mạnh lượng mã được tạo ra, kéo theo số lượng pull request cần đánh giá cũng tăng lên, gây ra tình trạng tắc nghẽn trong quá trình phát hành phần mềm.
“Code Review là câu trả lời của chúng tôi cho vấn đề đó,” Wu nói.
Công cụ Code Review được ra mắt đầu tiên dưới dạng bản xem trước nghiên cứu cho khách hàng Claude for Teams và Claude for Enterprise.
Wu cho biết sản phẩm này đặc biệt hướng đến các doanh nghiệp quy mô lớn, như Uber, Salesforce và Accenture, những công ty đã sử dụng Claude Code và cần hỗ trợ xử lý số lượng lớn pull request do AI tạo ra.
Các trưởng nhóm phát triển có thể bật Code Review làm mặc định cho toàn bộ kỹ sư trong nhóm. Khi được kích hoạt, công cụ sẽ tích hợp với GitHub và tự động phân tích các pull request, để lại bình luận trực tiếp trong mã nhằm giải thích các vấn đề tiềm ẩn và gợi ý cách sửa.
Theo Wu, trọng tâm của công cụ là phát hiện lỗi logic thay vì các vấn đề về phong cách viết mã.
“Điều này rất quan trọng vì nhiều lập trình viên đã từng thấy phản hồi tự động từ AI trước đây và họ cảm thấy khó chịu khi nó không đưa ra được các đề xuất có thể áp dụng ngay,” Wu nói. “Chúng tôi quyết định tập trung hoàn toàn vào lỗi logic để bắt được những vấn đề quan trọng nhất cần sửa.”
AI sẽ giải thích từng bước lý do của mình, bao gồm:
vấn đề là gì
tại sao nó có thể gây ra lỗi
cách có thể sửa chữa
Hệ thống cũng đánh dấu mức độ nghiêm trọng bằng màu sắc:
Đỏ: mức độ nghiêm trọng cao nhất
Vàng: vấn đề tiềm ẩn cần xem xét
Tím: lỗi liên quan đến mã cũ hoặc lỗi lịch sử
Wu cho biết hệ thống hoạt động nhanh nhờ sử dụng nhiều tác nhân AI chạy song song. Mỗi tác nhân sẽ phân tích codebase từ một góc nhìn khác nhau. Sau đó, một tác nhân cuối cùng sẽ tổng hợp, loại bỏ các phát hiện trùng lặp và ưu tiên các vấn đề quan trọng nhất.
Công cụ cũng cung cấp một mức phân tích bảo mật cơ bản, và các trưởng nhóm kỹ thuật có thể tùy chỉnh thêm các kiểm tra dựa trên tiêu chuẩn nội bộ của công ty. Wu cho biết sản phẩm Claude Code Security, được ra mắt gần đây, cung cấp phân tích bảo mật sâu hơn.
Kiến trúc đa tác nhân khiến công cụ này tiêu tốn nhiều tài nguyên tính toán. Giống như nhiều dịch vụ AI khác, giá được tính dựa trên token, và chi phí thay đổi tùy theo độ phức tạp của mã. Wu ước tính mỗi lần đánh giá code sẽ tốn khoảng 15–25 USD.
Wu cho biết đây là một trải nghiệm cao cấp, nhưng cần thiết khi các công cụ AI tạo ra ngày càng nhiều mã.
“Code Review xuất phát từ nhu cầu thị trường rất lớn,” Wu nói. “Khi các kỹ sư phát triển phần mềm với Claude Code, họ thấy việc tạo ra tính năng mới trở nên dễ dàng hơn nhiều, nhưng đồng thời nhu cầu kiểm tra code cũng tăng mạnh. Chúng tôi hy vọng công cụ này sẽ giúp các doanh nghiệp xây dựng phần mềm nhanh hơn bao giờ hết và với ít lỗi hơn trước đây.”