Hôm thứ Năm, OpenAI đã phát hành mô hình AI thương mại đầu tiên chạy trên phần cứng không phải của Nvidia, triển khai mô hình mã hóa GPT-5.3-Codex-Spark mới trên chip của Cerebras. Mô hình này cung cấp mã với tốc độ hơn 1.000 token (khối dữ liệu) mỗi giây, được cho là nhanh hơn khoảng 15 lần so với phiên bản tiền nhiệm. Để so sánh, Claude Opus 4.6 của Anthropic ở chế độ nhanh với giá cao hơn đạt tốc độ nhanh hơn khoảng 2,5 lần so với tốc độ tiêu chuẩn là 68,2 token mỗi giây , mặc dù đây là một mô hình lớn hơn và mạnh mẽ hơn Spark.
“Cerebras là một đối tác kỹ thuật tuyệt vời, và chúng tôi rất vui mừng khi bổ sung khả năng suy luận nhanh như một tính năng mới cho nền tảng,” Sachin Katti, người đứng đầu bộ phận điện toán tại OpenAI, cho biết trong một tuyên bố.
Codex-Spark là bản xem trước nghiên cứu dành cho người đăng ký ChatGPT Pro (200 đô la/tháng) thông qua ứng dụng Codex, giao diện dòng lệnh và tiện ích mở rộng VS Code. OpenAI đang triển khai quyền truy cập API cho một số đối tác thiết kế được chọn. Mô hình được tích hợp sẵn cửa sổ ngữ cảnh 128.000 token và chỉ xử lý văn bản khi khởi chạy.
Phiên bản này được xây dựng dựa trên mô hình GPT-5.3-Codex đầy đủ mà OpenAI đã ra mắt hồi đầu tháng này. Trong khi mô hình đầy đủ xử lý các tác vụ lập trình tác nhân phức tạp, OpenAI đã tinh chỉnh Spark để ưu tiên tốc độ hơn là chiều sâu kiến thức. OpenAI đã xây dựng nó như một mô hình chỉ xử lý văn bản và tinh chỉnh nó đặc biệt cho việc lập trình, chứ không phải cho các tác vụ đa năng mà phiên bản lớn hơn của GPT-5.3 xử lý.
Trên SWE-Bench Pro và Terminal-Bench 2.0, hai bộ dữ liệu chuẩn để đánh giá khả năng kỹ thuật phần mềm, Spark được cho là vượt trội hơn so với GPT-5.1-Codex-mini cũ hơn, đồng thời hoàn thành các tác vụ trong thời gian ngắn hơn nhiều, theo OpenAI. Công ty này không chia sẻ thông tin xác thực độc lập về những con số đó.
Theo kinh nghiệm thực tế, tốc độ của Codex là một điểm yếu; khi Ars thử nghiệm bốn tác nhân lập trình AI xây dựng các bản sao của trò chơi Minesweeper vào tháng 12, Codex mất thời gian gấp đôi so với Claude Code của Anthropic để tạo ra một trò chơi hoạt động được.
Cuộc chạy đua vũ trang giữa các tác nhân lập trình
Để dễ hình dung, tốc độ 1.000 token mỗi giây của GPT-5.3-Codex-Spark thể hiện một bước nhảy vọt khá ấn tượng so với bất kỳ hiệu năng nào mà OpenAI từng cung cấp thông qua cơ sở hạ tầng của riêng mình. Theo các bài kiểm tra độc lập từ Artificial Analysis, các mô hình nhanh nhất của OpenAI trên phần cứng Nvidia cũng chỉ đạt tốc độ thấp hơn nhiều: GPT-4o đạt khoảng 147 token mỗi giây, o3-mini đạt khoảng 167, và GPT-4o mini đạt khoảng 52.
