Năm của các tác nhân AI? Nhiều sự cố hơn? Dưới đây là những gì đang chờ đợi các nhóm CNTT trong năm 2026.

Tác giả thanhtrung 04/02/2026 23 phút đọc
Hình ảnh minh họa thể hiện các nguyên tắc an ninh mạng.

Nytt DDoS-rekord (Tín dụng hình ảnh: Shutterstock / ZinetroN)

Từ AWS đến Cloudflare, năm 2025 là một năm đầy rẫy các sự cố ngừng hoạt động lớn và các cuộc tấn công mạng. Đặc biệt, những sự kiện này đã phơi bày sự phụ thuộc vào một số ít nhà cung cấp dịch vụ đám mây và những lỗ hổng trong hệ thống CNTT phức tạp. Đây cũng là năm mà trí tuệ nhân tạo (AI) tiếp tục chuyển đổi cách thức hoạt động của các tổ chức.

 

Các công cụ mới đang định hình lại cách các nhóm CNTT quản lý cơ sở hạ tầng của họ, trong khi các nhiệm vụ cấp độ cơ bản ngày càng được trí tuệ nhân tạo (AI) đảm nhiệm, làm thay đổi mạnh mẽ những kỹ năng cần thiết trong lực lượng lao động và cách đào tạo nhân viên về những kỹ năng đó.

Năm 2026, những xu hướng này sẽ chi phối cách các tổ chức quản lý và hiện đại hóa hệ thống CNTT của mình. Nhưng các công ty cần làm gì để đảm bảo cơ sở hạ tầng của họ vẫn bền vững, an toàn và thích ứng tốt trong năm tới?

Năm của tác nhân AI

Chúng ta đang chứng kiến ​​sự thay đổi trong cách các tổ chức và đội ngũ của họ tương tác với AI. Năm 2026 chắc chắn sẽ là năm của trợ lý ảo AI – về cơ bản, đó là một trợ lý ảo có thể tự động làm việc thay bạn để hoàn thành một nhiệm vụ hoặc mục tiêu nhất định.

 

Các nhóm CNTT sẽ có thể tự động xây dựng các cơ chế kiểm soát và cân bằng, điều này có nghĩa là việc triển khai các nhiệm vụ sẽ thông minh hơn, vượt ra ngoài phạm vi "nhiệm vụ A dẫn đến nhiệm vụ B". Các tác nhân sẽ có thể hoạt động trong thời gian thực với sự can thiệp tối thiểu của con người để đảm bảo việc giám sát liên tục hệ thống CNTT.

Nhìn chung, điều này sẽ giúp xây dựng kiến ​​trúc có khả năng phục hồi và tự sửa chữa tốt hơn. Về phía hệ thống cũ, nó sẽ thúc đẩy việc sử dụng AI để giúp hiểu công nghệ lỗi thời hoặc xây dựng các phương thức để truyền đạt hoặc chuyển đổi nó cho mục đích sử dụng hiện đại.

Kỹ thuật kiểm soát hỗn loạn sẽ rất quan trọng để ngăn chặn sự hỗn loạn.

Thật không may, chúng ta sẽ chứng kiến ​​nhiều sự cố ngừng hoạt động quy mô lớn hơn trong năm nay. Sau khi AWS, Cloudflare và Azure trở thành nạn nhân của những sự cố như vậy trong năm nay, các doanh nghiệp sẽ cần đánh giá khả năng phục hồi hoạt động của mình cho năm mới.

Một trong những cách quan trọng để thực hiện điều này là kiểm tra khả năng chuyển đổi dự phòng thực tế, tức là mô phỏng một thảm họa trong thế giới thực như sự cố mất điện, để đánh giá hiệu quả của kế hoạch phục hồi sau thảm họa.

Điều này có nghĩa là tiến hành các thử nghiệm hỗn loạn định kỳ hàng quý trong môi trường sản xuất với phạm vi ảnh hưởng được kiểm soát (tác động của sự cố hoặc vi phạm) để xác thực khả năng phục hồi thực tế, chứ không phải các kịch bản vận hành lý thuyết.

Về mặt kỹ thuật, các nhóm sẽ cần lập bản đồ các lĩnh vực kinh doanh quan trọng và phân tách chúng về mặt kiến ​​trúc. Điều này bao gồm việc xác định những dịch vụ nào tuyệt đối không được phép gặp sự cố cùng nhau và xây dựng các ranh giới rõ ràng giữa chúng.

Tiếp theo, để nhận được sự đồng thuận từ toàn bộ tổ chức, tầm quan trọng của khả năng phục hồi cần được định nghĩa bằng thuật ngữ kinh doanh cho hội đồng quản trị. Các nhóm CNTT sẽ phải tính toán sự suy giảm Giá trị vòng đời khách hàng (CLV) do thời gian ngừng hoạt động (ví dụ: tỷ lệ khách hàng bỏ đi 25% sau các sự cố về độ tin cậy), định lượng các hình phạt theo quy định và liên kết các chỉ số thời gian hoạt động với tác động đến doanh thu.

Sự chuyển dịch mạnh mẽ hơn sang các mô hình đa nhà cung cấp

Nguy cơ gián đoạn hoạt động dường như cao hơn bao giờ hết. Do đó, chúng tôi dự đoán sẽ thấy việc phân bổ khối lượng công việc một cách chiến lược hơn và tư duy "không chạy mọi thứ ở mọi nơi".

Các nhóm sẽ bắt đầu phân bổ khối lượng công việc dựa trên thế mạnh của nhà cung cấp (AWS cho phạm vi phủ sóng rộng, Azure cho khả năng tích hợp với Microsoft , GCP cho dữ liệu/AI) đồng thời đảm bảo các đường dẫn quan trọng có khả năng chuyển đổi dự phòng giữa các nền tảng đám mây.

Để đạt được điều này, việc sử dụng cơ sở hạ tầng dưới dạng mã sẽ cho phép triển khai không phụ thuộc vào nền tảng đám mây, trong khi việc kết hợp các nhà cung cấp đám mây khu vực và chuyên biệt sẽ giảm thiểu rủi ro tập trung vượt ra ngoài thế độc quyền của các nhà cung cấp siêu quy mô.

Các sự cố ngừng hoạt động định kỳ có thể khiến các nhóm áp dụng thiết kế hướng theo miền (domain-driven design) để hạn chế phạm vi ảnh hưởng. Ví dụ, việc tách biệt các hệ thống theo khả năng kinh doanh sẽ giúp tránh trường hợp sự cố dịch vụ thanh toán làm sập toàn bộ nền tảng thương mại điện tử .

Đối với các trường hợp sử dụng cụ thể với nhu cầu tài nguyên ổn định, cơ sở hạ tầng tại chỗ có thể được coi là tiết kiệm chi phí và đáng tin cậy hơn so với mô hình vận hành đám mây.

Nợ kỹ thuật sẽ tiếp tục ảnh hưởng đến độ tin cậy của hệ thống.

Báo cáo gần đây của chúng tôi cho thấy chỉ có 10% các công ty trong lĩnh vực chính phủ, sản xuất và tài chính không có bất kỳ khoản nợ kỹ thuật Windows nào (các chi phí và rủi ro tiềm ẩn phát sinh khi các tổ chức trì hoãn việc cập nhật hoặc hiện đại hóa hệ thống CNTT của họ).

Điều này cho thấy bức tranh tổng thể rộng hơn về việc sử dụng các ứng dụng lỗi thời như các ứng dụng đã hết hạn hỗ trợ của Windows, tạo ra các điểm tích hợp dễ bị lỗi và các lỗ hổng bảo mật.

Việc giám sát các kết nối giữa các dịch vụ điện toán đám mây hiện đại và các máy tính chủ cũ kỹ hàng chục năm tuổi trở nên khó khăn và dễ trở thành điểm yếu để tin tặc khai thác khi các ứng dụng lỗi thời thiếu các tính năng xác thực, mã hóa hoặc quản lý bản vá hiện đại.

Các ứng dụng cũ không thể tham gia vào các mô hình khả năng phục hồi hiện đại, do đó chúng trở thành giới hạn về độ tin cậy bất kể mức độ trưởng thành của cơ sở hạ tầng đám mây.

Điều quan trọng là, khoản nợ công nghệ này đang tạo ra một khoảng cách về nhân tài. Với dự kiến ​​thiếu hụt 100.000 lập trình viên, việc tìm kiếm người để chẩn đoán và sửa chữa các lỗi hệ thống cũ trong thời gian ngừng hoạt động sẽ mất nhiều thời gian hơn và tốn kém hơn.

Trí tuệ nhân tạo sẽ đóng vai trò tích cực trong việc giảm thiểu những rủi ro này.

Trước những rủi ro ngày càng lớn, các công cụ phục hồi dựa trên trí tuệ nhân tạo (AI) sẽ ngày càng trở nên quan trọng trong việc bảo vệ hệ thống CNTT. Ví dụ, việc sử dụng khả năng quan sát dựa trên AI sẽ là yếu tố cơ bản để dự đoán sự cố và phát hiện vấn đề trước khi xảy ra gián đoạn.

Việc này sẽ bao gồm triển khai các nền tảng có khả năng giám sát toàn bộ hệ thống CNTT, nhật ký ứng dụng và dữ liệu kinh doanh để xác định các mô hình cho thấy các sự cố sắp xảy ra (rò rỉ bộ nhớ, lỗi thời gian chờ tích hợp) và tự động kích hoạt các hành động phòng ngừa.

Sau đó, hệ thống tự động hóa tự phục hồi sẽ xử lý các tình huống lỗi thường gặp mà không cần chờ sự can thiệp của con người, trong khi việc giám sát tuân thủ liên tục dựa trên AI và phát hiện sai lệch sẽ tự động cảnh báo các rủi ro mới trong môi trường hệ thống cũ và đưa ra các khuyến nghị khắc phục.

Tất cả những điều này sẽ giúp các nhóm CNTT có thêm thời gian để lập chiến lược và chủ động quản lý cơ sở hạ tầng của họ.

Trí tuệ nhân tạo (AI) cũng sẽ được khai thác như một phương pháp hiệu quả để khắc phục các mã nguồn và ngôn ngữ lập trình lỗi thời. Ví dụ, AI tạo sinh có thể thu thập mã nguồn có tuổi đời hàng chục năm, dịch nó sang ngôn ngữ tự nhiên và tạo ra các đặc tả nghiệp vụ mà các nhóm nhân viên phải mất hàng tháng trời để thực hiện thủ công.

Điều này bao gồm việc tự động chuyển đổi các ngôn ngữ cũ sang các công nghệ hiện đại một cách có thể dự đoán được và trên quy mô lớn.

Và liên quan đến vấn đề thiếu hụt nhân tài, AI sẽ có khả năng cung cấp các gợi ý lập trình và hỗ trợ theo thời gian thực cho các nhà phát triển chưa quen thuộc với các ngôn ngữ lập trình cũ, từ đó nhân lên năng suất của những chuyên gia khan hiếm.

2026: Ít phụ thuộc hơn, chủ động hơn

Các rủi ro và mối đe dọa đối với CNTT chưa bao giờ lớn đến thế. Nhưng các công cụ quản lý hệ thống CNTT cũng chưa bao giờ tiên tiến hơn thế. Trí tuệ nhân tạo (AI), kỹ thuật kiểm soát sự cố (chaos engineering) và xu hướng chuyển dịch khỏi các nhà cung cấp đám mây đơn lẻ đều được dự đoán sẽ thống trị năm tới.

Khi các công ty tìm cách tự bảo vệ mình trước những sự cố ngừng hoạt động tốn kém và các cuộc tấn công mạng, việc hiện đại hóa các ứng dụng cũ và liên tục giám sát hệ thống CNTT của họ để phát hiện rủi ro sẽ rất cần thiết để đảm bảo khả năng phục hồi.

Để luôn dẫn đầu, các nhà lãnh đạo CNTT nên bắt đầu bằng việc lập bản đồ các rủi ro từ hệ thống cũ và ưu tiên khắc phục nợ kỹ thuật, thử nghiệm các tác nhân AI cho các tác vụ thường ngày và triển khai cơ sở hạ tầng dưới dạng mã để cho phép khả năng di chuyển lên đám mây .

Lên lịch các cuộc diễn tập kỹ thuật hỗn loạn hàng quý để xác thực khả năng phục hồi trong điều kiện thực tế và định lượng tác động tài chính của thời gian ngừng hoạt động, từ doanh thu bị mất đến tỷ lệ khách hàng bỏ đi, nhằm đảm bảo sự ủng hộ từ cấp hội đồng quản trị.

Những bước này không chỉ giúp tăng cường khả năng chống chịu sự cố của hệ thống CNTT mà còn định vị khả năng phục hồi như một lợi thế chiến lược thay vì một biện pháp ứng phó.

Tác giả thanhtrung Admin
Bài viết trước Tôi thậm chí còn không biết Netflix có trên PS3, nhưng điều đó sẽ sớm không còn quan trọng nữa — ứng dụng xem phim trực tuyến này sẽ rời khỏi máy chơi game này sau 16 năm vào tháng tới.

Tôi thậm chí còn không biết Netflix có trên PS3, nhưng điều đó sẽ sớm không còn quan trọng nữa — ứng dụng xem phim trực tuyến này sẽ rời khỏi máy chơi game này sau 16 năm vào tháng tới.

Bài viết tiếp theo

Vấn đề nhận dạng và bảo mật dữ liệu đang hội tụ, gây ra rắc rối cho các nhóm bảo mật: Báo cáo

Vấn đề nhận dạng và bảo mật dữ liệu đang hội tụ, gây ra rắc rối cho các nhóm bảo mật: Báo cáo
Viết bình luận
Thêm bình luận

Bài viết liên quan

Thông báo

0917111899