
(Nguồn ảnh: Microsoft)
Microsoft đã bắt đầu triển khai chip AI đầu tiên do chính hãng thiết kế, Maia 200, tại một số trung tâm dữ liệu được chọn , một bước tiến trong nỗ lực lâu dài của hãng nhằm kiểm soát nhiều hơn nữa cơ sở hạ tầng của mình.
Bất chấp động thái này, Giám đốc điều hành của Microsoft đã khẳng định rõ ràng rằng công ty không có ý định từ bỏ các nhà sản xuất chip bên thứ ba.
Mới đây, Satya Nadella tuyên bố Nvidia và AMD sẽ vẫn là một phần trong chiến lược mua sắm của Microsoft, ngay cả khi Maia 200 được đưa vào sử dụng trong sản xuất.
Chip AI của Microsoft được thiết kế để hỗ trợ, chứ không phải loại bỏ, các tùy chọn của bên thứ ba.
“Chúng tôi có mối quan hệ đối tác tuyệt vời với Nvidia và AMD. Họ đang đổi mới. Chúng tôi cũng đang đổi mới,” Nadella nói.
“Tôi nghĩ nhiều người chỉ bàn luận về việc ai đang dẫn trước. Hãy nhớ rằng, bạn phải dẫn đầu trong mọi thời điểm. Việc chúng ta có thể tích hợp theo chiều dọc không có nghĩa là chúng ta chỉ tích hợp theo chiều dọc mà thôi.”
Maia 200 là bộ xử lý tập trung vào suy luận mà Microsoft mô tả là được xây dựng đặc biệt để chạy các mô hình AI lớn một cách hiệu quả thay vì huấn luyện chúng từ đầu.
Con chip này được thiết kế để xử lý các khối lượng công việc liên tục phụ thuộc nhiều vào băng thông bộ nhớ, truy cập RAM nhanh và di chuyển dữ liệu nhanh chóng giữa các đơn vị tính toán và hệ thống lưu trữ dựa trên SSD.
Microsoft đã chia sẻ các so sánh hiệu năng cho thấy họ có ưu thế hơn so với các chip tự sản xuất của các nhà cung cấp dịch vụ đám mây khác, mặc dù việc xác thực độc lập vẫn còn hạn chế.
Theo lãnh đạo Microsoft, nhóm Superintelligence của họ sẽ được ưu tiên tiếp cận phần cứng Maia 200.
Nhóm này, do Mustafa Suleyman dẫn đầu, phát triển các mô hình nội bộ tiên tiến nhất của Microsoft.
Mặc dù Maia 200 cũng sẽ hỗ trợ các khối lượng công việc OpenAI chạy trên Azure, nhưng nhu cầu tính toán nội bộ vẫn rất cao.
Suleyman đã công khai tuyên bố rằng ngay cả trong nội bộ Microsoft, việc tiếp cận phần cứng mới nhất cũng được coi là một nguồn lực khan hiếm. Sự khan hiếm này giải thích lý do tại sao Microsoft tiếp tục phụ thuộc vào các nhà cung cấp bên ngoài.
Việc huấn luyện và vận hành các mô hình quy mô lớn đòi hỏi mật độ tính toán khổng lồ, thông lượng bộ nhớ ổn định và khả năng mở rộng đáng tin cậy trên nhiều trung tâm dữ liệu.
Hiện tại, không có thiết kế chip nào đáp ứng được tất cả các yêu cầu này trong điều kiện thực tế, và do đó, Microsoft tiếp tục đa dạng hóa các nguồn phần cứng của mình thay vì hoàn toàn đặt cược vào một kiến trúc duy nhất.
Những hạn chế về nguồn cung từ Nvidia, chi phí tăng cao và thời gian sản xuất kéo dài đã thúc đẩy các công ty chuyển sang tự phát triển chip.
Những nỗ lực này không loại bỏ được sự phụ thuộc vào các nhà cung cấp bên ngoài. Thay vào đó, chúng lại làm tăng thêm một lớp phức tạp cho hệ sinh thái phần cứng vốn đã phức tạp.
Các công cụ AI hoạt động ở quy mô lớn nhanh chóng bộc lộ những điểm yếu, cho dù đó là về khả năng xử lý bộ nhớ, giới hạn nhiệt độ hay tắc nghẽn kết nối.
Việc sở hữu một phần lộ trình phát triển phần cứng mang lại cho Microsoft sự linh hoạt hơn, nhưng điều đó không loại bỏ những ràng buộc về cấu trúc ảnh hưởng đến toàn bộ ngành công nghiệp.
Nói một cách đơn giản, con chip tùy chỉnh này được thiết kế để giảm áp lực chứ không phải định nghĩa lại áp lực, đặc biệt là khi nhu cầu về điện toán tiếp tục tăng nhanh hơn nguồn cung.