Phương tiện lưu trữ dữ liệu mới của Microsoft, có tuổi thọ 10.000 năm: thủy tinh.

Tác giả dangkhoa 25/02/2026 20 phút đọc

Phương tiện lưu trữ dữ liệu mới của Microsoft, có tuổi thọ 10.000 năm: thủy tinh.

Tia laser femtosec khắc dữ liệu vào một môi trường rất ổn định.    

Một mặt bàn phủ đầy thấu kính và thiết bị quang học, với một kính hiển vi đặt ở một bên.
 
Hiện tại, phần cứng Silica vẫn chưa hoàn toàn sẵn sàng để thương mại hóa. Nguồn: Microsoft Research
 

Lưu trữ dữ liệu lâu dài đặt ra rất nhiều thách thức. Chúng ta cần phương tiện lưu trữ có mật độ dữ liệu cực cao và ổn định trong nhiều thế kỷ hoặc hơn, và lý tưởng nhất là không tiêu thụ năng lượng khi không được truy cập. Nhiều ý tưởng đã được đưa ra — thậm chí cả DNA cũng đã được xem xét — nhưng một trong những ý tưởng đơn giản nhất là khắc dữ liệu vào thủy tinh. Nhiều loại thủy tinh rất ổn định về mặt vật lý và hóa học, và việc tạo ra các chi tiết trên đó tương đối dễ dàng.

Đã có rất nhiều nghiên cứu sơ bộ chứng minh các khía cạnh khác nhau của hệ thống lưu trữ dựa trên thủy tinh. Nhưng trong số báo ra ngày thứ Tư của tạp chí Nature, Microsoft Research đã công bố Dự án Silica, một bản trình diễn hoạt động của hệ thống có thể đọc và ghi dữ liệu vào các tấm thủy tinh nhỏ với mật độ hơn một Gigabit trên mỗi milimét khối.

 

Viết trên kính

Chúng ta thường nghĩ thủy tinh dễ vỡ, dễ bị nứt và có thể chảy xuống theo thời gian, mặc dù nhận định cuối cùng là một điều hoang đường. Thủy tinh là một loại vật liệu, và nhiều loại hóa chất khác nhau có thể tạo thành thủy tinh. Với hóa chất ban đầu phù hợp, có thể tạo ra một loại thủy tinh mà theo các nhà nghiên cứu, “ổn định về nhiệt và hóa học, đồng thời có khả năng chống lại sự xâm nhập của hơi ẩm, sự thay đổi nhiệt độ và nhiễu điện từ”. Mặc dù vẫn cần được xử lý theo cách để giảm thiểu hư hại, thủy tinh cung cấp loại độ ổn định mà chúng ta mong muốn cho việc lưu trữ lâu dài.

Việc đưa dữ liệu vào thủy tinh đơn giản như việc khắc lên bề mặt (cần làm rõ, về mặt kỹ thuật, đây không phải là khắc, mà là sự biến đổi hóa học bề mặt thủy tinh—ở đây, tia laser đốt cháy các đặc điểm vào bên trong thủy tinh). Nhưng đó là một trong những thách thức, vì quá trình ghi thường diễn ra chậm. Tuy nhiên, sự phát triển của laser femtosec—loại laser phát ra các xung chỉ kéo dài 10-15 giây và có thể phát ra hàng triệu xung mỗi giây—có thể rút ngắn đáng kể thời gian ghi và cho phép tập trung khắc vào một khu vực rất nhỏ, làm tăng mật độ dữ liệu tiềm năng.

Để đọc lại dữ liệu, có một số lựa chọn. Chúng ta đã đạt được thành công lớn khi sử dụng tia laser để đọc dữ liệu từ đĩa quang, mặc dù tốc độ chậm. Nhưng bất cứ thứ gì có thể thu nhận được các chi tiết nhỏ được khắc trên thủy tinh đều có thể hoạt động được.

Với những cân nhắc nêu trên, về mặt lý thuyết, mọi thứ đã sẵn sàng cho Dự án Silica. Câu hỏi lớn đặt ra là làm thế nào để kết hợp chúng lại thành một hệ thống hoạt động hiệu quả. Microsoft quyết định, để thận trọng, sẽ trả lời câu hỏi đó hai lần.

Một hệ thống thực tế

Sự khác biệt giữa hai câu trả lời này nằm ở cách một đơn vị dữ liệu riêng lẻ (gọi là voxel) được ghi vào thủy tinh. Một loại voxel mà họ đã thử dựa trên hiện tượng lưỡng chiết , trong đó sự khúc xạ của photon phụ thuộc vào sự phân cực của chúng. Có thể khắc voxel vào thủy tinh để tạo ra hiện tượng lưỡng chiết bằng cách sử dụng ánh sáng laser phân cực, tạo ra các đặc điểm nhỏ hơn giới hạn nhiễu xạ. Trên thực tế, điều này liên quan đến việc sử dụng một xung laser để tạo ra một khoảng trống hình bầu dục, sau đó là một xung phân cực thứ hai để tạo ra hiện tượng lưỡng chiết. Danh tính của một voxel dựa trên hướng của hình bầu dục; vì chúng ta có thể phân giải nhiều hướng khác nhau, nên có thể lưu trữ nhiều hơn một bit trong mỗi voxel.

Phương pháp thay thế liên quan đến việc thay đổi cường độ hiệu ứng khúc xạ bằng cách thay đổi lượng năng lượng trong xung laser. Một lần nữa, có thể phân biệt được nhiều hơn hai trạng thái trong các voxel này, cho phép lưu trữ nhiều bit dữ liệu trong mỗi voxel.

 
Silica_Figure_1
 
Dữ liệu bản đồ từ Microsoft Flight Simulator  được khắc lên môi trường lưu trữ Silica. Nguồn: Microsoft Research

Việc đọc các thông tin này trên Silica liên quan đến việc sử dụng kính hiển vi có khả năng phát hiện sự khác biệt về chỉ số khúc xạ. (Đối với những người đam mê kính hiển vi, điều này có nghĩa là “họ đã sử dụng kính hiển vi tương phản pha”). Kính hiển vi đặt ra giới hạn về số lượng lớp voxel có thể được đặt trong một mảnh kính duy nhất. Trong quá trình khắc, các lớp được tách ra với khoảng cách đủ lớn để chỉ có một lớp nằm trong mặt phẳng tiêu điểm của kính hiển vi tại một thời điểm. Quá trình khắc cũng kết hợp các ký hiệu cho phép hệ thống kính hiển vi tự động định vị thấu kính phía trên các điểm cụ thể trên kính. Từ đó, hệ thống từ từ thay đổi mặt phẳng tiêu điểm, di chuyển qua chồng lớp và chụp ảnh bao gồm các lớp voxel khác nhau.

Để diễn giải những hình ảnh hiển vi này, Microsoft đã sử dụng mạng nơ-ron tích chập kết hợp dữ liệu từ các hình ảnh nằm trong và gần mặt phẳng tiêu điểm cho một lớp voxel nhất định. Điều này hiệu quả vì ảnh hưởng của các voxel lân cận làm thay đổi cách hiển thị của một voxel nhất định một cách tinh tế mà hệ thống AI có thể nhận biết được nếu được cung cấp đủ dữ liệu huấn luyện.

Mảnh ghép cuối cùng của bức tranh là mã hóa dữ liệu. Hệ thống Silica nhận luồng bit thô của dữ liệu cần lưu trữ và thêm chức năng sửa lỗi bằng mã kiểm tra chẵn lẻ mật độ thấp (cùng loại mã sửa lỗi được sử dụng trong mạng 5G). Các bit liền kề sau đó được kết hợp để tạo ra các ký hiệu tận dụng khả năng lưu trữ nhiều hơn một bit của các voxel. Khi một luồng ký hiệu được tạo ra, nó đã sẵn sàng để được ghi lên kính.

Hiệu suất

Việc ghi dữ liệu vẫn là điểm nghẽn trong hệ thống, vì vậy Microsoft đã phát triển phần cứng có thể ghi đồng thời lên một tấm kính bằng bốn tia laser mà không tạo ra quá nhiều nhiệt. Điều này đủ để cho phép ghi với tốc độ 66 megabit mỗi giây, và nhóm nghiên cứu cho rằng có thể bổ sung thêm tới hàng chục tia laser nữa. Điều này có thể cần thiết, vì có thể lưu trữ tới 4,84TB dữ liệu trên một tấm kính duy nhất (các tấm kính có kích thước 12 cm x 12 cm và dày 0,2 cm). Như vậy, việc ghi đầy đủ dữ liệu lên một tấm kính sẽ mất hơn 150 giờ.

Khía cạnh “tối đa” của hệ thống lưu trữ liên quan đến mật độ dữ liệu có thể đạt được với hai phương pháp ghi dữ liệu khác nhau. Phương pháp dựa trên hiện tượng lưỡng chiết đòi hỏi nhiều phần cứng quang học hơn và chỉ hoạt động trên các loại kính chất lượng cao, nhưng có thể chứa nhiều voxel hơn trong cùng một thể tích, do đó có mật độ dữ liệu cao hơn đáng kể. Phương pháp thay thế chỉ có thể chứa hơn hai terabyte trong cùng một tấm kính, nhưng có thể thực hiện với phần cứng đơn giản hơn và có thể hoạt động trên bất kỳ loại vật liệu trong suốt nào.

Thủy tinh borosilicate có độ ổn định cực cao; các thí nghiệm lão hóa tăng tốc của Microsoft cho thấy dữ liệu sẽ ổn định trong hơn 10.000 năm ở nhiệt độ phòng. Điều đó đã khiến Microsoft tuyên bố: “Kết quả của chúng tôi chứng minh rằng Silica có thể trở thành giải pháp lưu trữ lâu dài cho kỷ nguyên kỹ thuật số.”

Có lẽ nói như vậy hơi phóng đại một chút. Ví dụ, kính viễn vọng Square Kilometer Array dự kiến ​​sẽ cần lưu trữ 700 petabyte dữ liệu mỗi năm. Điều đó có nghĩa là cần hơn 140.000 tấm kính để lưu trữ dữ liệu từ chỉ riêng kính viễn vọng này. Ngay cả khi giả sử tốc độ ghi có thể được tăng cường bằng cách bổ sung thêm đáng kể các tia laser, bạn vẫn cần hơn 600 máy Silica hoạt động song song để đáp ứng nhu cầu. Và Square Kilometer Array không phải là dự án duy nhất tạo ra lượng dữ liệu khổng lồ.

Tuy nhiên, Silica cũng có một số đặc điểm khiến nó trở nên rất phù hợp với loại hình này, đáng chú ý nhất là việc hoàn toàn không cần năng lượng để bảo quản dữ liệu, và khả năng khôi phục nhanh chóng nếu cần (khác hẳn với việc cần đến vài ngày để khôi phục thông tin từ DNA chẳng hạn). Thêm vào đó, tôi thừa nhận mình bị thu hút bởi một hệ thống có phương tiện lưu trữ trông giống như thứ gì đó bước ra từ phim khoa học viễn tưởng .

Tác giả dangkhoa Admin
Bài viết trước Claude Cowork của Anthropic đang cắm AI vào những thứ doanh nghiệp nhàm chán hơn

Claude Cowork của Anthropic đang cắm AI vào những thứ doanh nghiệp nhàm chán hơn

Bài viết tiếp theo

Discord triển khai xác minh độ tuổi toàn cầu: bước đi vì an toàn hay cơn ác mộng quyền riêng tư?

Discord triển khai xác minh độ tuổi toàn cầu: bước đi vì an toàn hay cơn ác mộng quyền riêng tư?
Viết bình luận
Thêm bình luận

Bài viết liên quan

Thông báo

0917111899