DeepSeek: mọi thứ bạn cần biết về AI đã soán ngôi ChatGPT

Tác giả thuytrang 30/09/2025 50 phút đọc

DeepSeek: mọi thứ bạn cần biết về AI đã soán ngôi ChatGPT

 

Một công ty khởi nghiệp mới thành lập một năm tại Trung Quốc đang gây chấn động ngành công nghiệp AI sau khi ra mắt một chatbot có hiệu năng ngang ngửa ChatGPT nhưng lại chỉ tốn một phần nhỏ chi phí điện năng, làm mát và đào tạo so với các hệ thống của OpenAI, Google và Anthropic. Dưới đây là tất cả những gì bạn cần biết về các mô hình V3 và R1 của Deepseek và lý do tại sao công ty này có thể đảo ngược hoàn toàn tham vọng AI của nước Mỹ.

DeepSeek là gì?

DeepSeek (tên kỹ thuật là "Công ty TNHH Nghiên cứu Công nghệ Cơ bản Trí tuệ Nhân tạo Hàng Châu DeepSeek") là một công ty khởi nghiệp AI của Trung Quốc, ban đầu được thành lập như một phòng thí nghiệm AI cho công ty mẹ High-Flyer vào tháng 4 năm 2023. Tháng 5 năm đó, DeepSeek được tách thành công ty riêng (với High-Flyer vẫn là nhà đầu tư) và cũng đã ra mắt mô hình DeepSeek-V2. V2 mang lại hiệu suất ngang bằng với các công ty AI hàng đầu khác của Trung Quốc, chẳng hạn như ByteDance, Tencent và Baidu, nhưng với chi phí vận hành thấp hơn nhiều.

Video được đề xuất
  
         
biểu tượng
  
  
  
       
 
00:00
 
 
 
 
 
00:00
  
  
 
 
      
 
  
 

Công ty tiếp tục phát hành V3 vào tháng 12 năm 2024. V3 là một mô hình 671 tỷ tham số được cho là chỉ mất chưa đầy 2 tháng để đào tạo . Hơn nữa, theo một phân tích gần đây từ Jeffries, "chi phí đào tạo của DeepSeek chỉ 5,6 triệu đô la Mỹ (giả sử chi phí thuê 2 đô la/giờ 800 giờ). Con số này thấp hơn 10% chi phí của Llama của Meta". Con số này chỉ là một phần rất nhỏ so với hàng trăm triệu đến hàng tỷ đô la mà các công ty Mỹ như Google, Microsoft, xAI và OpenAI đã chi cho việc đào tạo các mô hình của họ.

Các bài kiểm tra chuẩn cho thấy hiệu suất của V3 ngang bằng với GPT-4o và Claude 3.5 Sonnet. Một bài xã luận trên tờ The Hill tháng 12 năm 2024 đã gọi thành công của DeepSeek là "Khoảnh khắc Sputnik" của nước Mỹ.

DeepSeek đã phát hành mô hình R1-Lite-Preview vào tháng 11 năm 2024, tuyên bố rằng mô hình mới này có thể vượt trội hơn dòng mô hình suy luận o1 của OpenAI (và với mức giá chỉ bằng một phần nhỏ). Công ty ước tính rằng chi phí vận hành mô hình R1 thấp hơn từ 20 đến 50 lần, tùy thuộc vào tác vụ, so với mô hình o1 của OpenAI. Sau đó, DeepSeek đã phát hành DeepSeek-R1 và DeepSeek-R1-Zero vào tháng 1 năm 2025. Không giống như đối thủ o1, mô hình R1 là mã nguồn mở, nghĩa là bất kỳ nhà phát triển nào cũng có thể sử dụng.

Nhờ đó, V3 và R1 đã trở nên cực kỳ phổ biến kể từ khi ra mắt, với Trợ lý AI được hỗ trợ bởi V3 của DeepSeek đã vượt mặt ChatGPT để chiếm vị trí dẫn đầu các cửa hàng ứng dụng . Trong một bài đăng gần đây trên mạng xã hội, nhà đầu tư mạo hiểm Marc Andreesen đã gọi chatbot của DeepSeek  là "một trong những đột phá tuyệt vời và ấn tượng nhất mà tôi từng thấy" và là "một món quà sâu sắc cho thế giới".

DeepSeek có thể làm gì?

Là một mô hình ngôn ngữ lớn nguồn mở, các chatbot của DeepSeek về cơ bản có thể làm mọi thứ mà ChatGPT, Gemini và Claude có thể làm. Điều đó bao gồm tạo văn bản, âm thanh, hình ảnh và video. Hơn nữa, dòng mô hình đa phương thức mới ra mắt của DeepSeek, được gọi là Janus Pro , được cho là vượt trội hơn DALL-E 3 cũng như PixArt-alpha, Emu3-Gen và Stable Diffusion XL, trên một cặp chuẩn mực công nghiệp. DeepSeek-R1, cạnh tranh với o1, được thiết kế đặc biệt để thực hiện các tác vụ suy luận phức tạp, đồng thời tạo ra các giải pháp từng bước cho các vấn đề và thiết lập "chuỗi suy nghĩ logic", trong đó nó giải thích quy trình suy luận của mình theo từng bước khi giải quyết một vấn đề. 

Điều mà các sản phẩm của DeepSeek không thể làm được là nói về Quảng trường Thiên An Môn. Hay các cuộc biểu tình Dù Vàng. Hay hình ảnh Chủ tịch Tập Cận Bình giống Gấu Pooh. Về cơ bản, nếu đó là một chủ đề bị Đảng Cộng sản Trung Quốc coi là cấm kỵ, chatbot của DeepSeek sẽ không đề cập hoặc tham gia một cách có ý nghĩa nào.

Ai có thể sử dụng DeepSeek?

Lệnh cấm đăng ký tạm thời của DeepSeek

Là một LLM mã nguồn mở, mô hình DeepSeek có thể được bất kỳ nhà phát triển nào sử dụng miễn phí. OpenAI tính phí 200 đô la mỗi tháng cho gói đăng ký Pro cần thiết để truy cập o1. Các mô hình của DeepSeek có sẵn trên web, thông qua API của công ty và qua các ứng dụng di động. Bạn sẽ cần đăng ký một tài khoản miễn phí tại trang web DeepSeek để sử dụng, tuy nhiên công ty đã tạm thời dừng đăng ký mới để ứng phó với "các cuộc tấn công độc hại quy mô lớn vào các dịch vụ của DeepSeek". Người dùng hiện tại có thể đăng nhập và sử dụng nền tảng như bình thường, nhưng vẫn chưa có thông tin về thời điểm người dùng mới có thể tự mình dùng thử DeepSeek.

Tại sao DeepSeek lại đột nhiên trở thành vấn đề lớn như vậy?

Kể từ khi ChatGPT được phát hành vào tháng 11 năm 2023, các công ty AI của Mỹ đã tập trung vào việc xây dựng các mô hình ngôn ngữ lớn lớn hơn, mạnh mẽ hơn, mở rộng hơn, mạnh mẽ hơn và sử dụng nhiều tài nguyên hơn. Thay vì tìm cách xây dựng các LLM tiết kiệm chi phí và năng lượng hơn, các công ty như OpenAI, Microsoft, Anthropic và Google lại thấy phù hợp để chỉ đơn giản là ép buộc sự tiến bộ của công nghệ bằng cách, theo truyền thống của Mỹ, chỉ cần ném một lượng tiền và tài nguyên vô lý vào vấn đề. Chỉ riêng trong năm 2024, Giám đốc điều hành xAI Elon Musk dự kiến ​​sẽ chi cá nhân hơn 10 tỷ đô la cho các sáng kiến ​​AI. OpenAI và các đối tác của mình vừa công bố sáng kiến ​​Dự án Stargate trị giá 500 tỷ đô la sẽ đẩy nhanh đáng kể việc xây dựng các tiện ích năng lượng xanh và trung tâm dữ liệu AI trên khắp Hoa Kỳ. Theo Giám đốc điều hành Sundar Pichai, Google có kế hoạch ưu tiên mở rộng nền tảng Gemini trong suốt năm 2025 và dự kiến ​​sẽ chi hàng tỷ đô la trong năm nay để theo đuổi mục tiêu đó. Meta đã thông báo vào giữa tháng 1 rằng họ sẽ chi tới 65 tỷ đô la trong năm nay cho việc phát triển AI.

DeepSeek vừa cho thế giới thấy rằng tất cả những điều đó thực sự không cần thiết — rằng "cơn sốt AI" đã thúc đẩy nền kinh tế Mỹ trong những tháng gần đây và giúp các công ty GPU như Nvidia giàu lên gấp bội so với tháng 10 năm 2023, có thể chỉ là một trò lừa bịp — và "sự hồi sinh" của năng lượng hạt nhân cũng đi kèm với nó. Tiết lộ này cũng đặt ra câu hỏi về việc Mỹ thực sự dẫn đầu đến đâu trong lĩnh vực AI, bất chấp việc liên tục cấm vận chuyển các GPU tiên tiến sang Trung Quốc trong năm qua.

Chỉ cần nhìn vào lượng vốn hóa thị trường mà Nvidia đã mất trong vài giờ sau khi V3 ra mắt chẳng hạn. Giá trị cổ phiếu của công ty đã giảm 17% và bốc hơi 600 tỷ đô la (với mã B ) chỉ trong một phiên giao dịch. Theo Forbes , đây là mức lỗ trong một ngày lớn nhất của một công ty trong lịch sử thị trường chứng khoán Mỹ - vượt qua kỷ lục lỗ trước đó của công ty (và của thị trường chứng khoán) được thiết lập vào tháng 9 năm 2024 với giá trị 279 tỷ đô la. Nvidia thực sự đã mất một khoản định giá tương đương với toàn bộ tập đoàn Exxon/Mobile chỉ trong một ngày.

"Điểm mấu chốt là sự vượt trội của Hoa Kỳ được thúc đẩy bởi công nghệ và vị thế dẫn đầu của các công ty Hoa Kỳ trong lĩnh vực AI", Keith Lerner, một nhà phân tích tại Truist, nói với CNN . "Việc triển khai mô hình DeepSeek đang khiến các nhà đầu tư đặt câu hỏi về vị thế dẫn đầu của các công ty Hoa Kỳ, về mức độ chi tiêu và liệu khoản chi tiêu đó có dẫn đến lợi nhuận (hay chi tiêu quá mức) hay không."

Tóm lại, DeepSeek vừa đánh bại ngành công nghiệp AI của Mỹ ngay trên sân chơi của chính mình, cho thấy câu thần chú hiện tại "tăng trưởng bằng mọi giá" không còn đúng nữa. "DeepSeek rõ ràng không có khả năng tiếp cận nhiều máy tính như các công ty siêu quy mô của Mỹ và bằng cách nào đó đã phát triển được một mô hình có vẻ rất cạnh tranh", Srini Pajjuri, nhà phân tích bán dẫn tại Raymond James, nói với CNBC . Nếu một công ty khởi nghiệp Trung Quốc có thể xây dựng một mô hình AI hoạt động tốt như mô hình mới nhất và tuyệt vời nhất của OpenAI, và làm được điều đó trong vòng chưa đầy hai tháng và với chi phí chưa đến 6 triệu đô la, thì Sam Altman còn có ích gì nữa?

"Thời gian sẽ trả lời liệu mối đe dọa từ DeepSeek có thực sự tồn tại hay không — cuộc đua vẫn đang diễn ra về việc công nghệ nào sẽ hoạt động hiệu quả và các công ty lớn phương Tây sẽ phản ứng và phát triển như thế nào", Michael Block, chiến lược gia thị trường tại Third Seven Capital, nói với CNN. "Thị trường đã quá tự mãn vào đầu kỷ nguyên Trump 2.0 và có thể đã tìm kiếm một cái cớ để thoái lui — và họ đã có một cái cớ tuyệt vời ở đây."

Người Mỹ sẽ làm gì về vấn đề này?

Chúng ta đã thấy những phản ứng dữ dội từ các công ty Mỹ , cũng như từ Nhà Trắng. "Việc phát hành DeepSeek, một AI từ một công ty Trung Quốc, nên là một lời cảnh tỉnh cho các ngành công nghiệp của chúng ta rằng chúng ta cần tập trung cao độ vào việc cạnh tranh để giành chiến thắng", Donald Trump phát biểu, theo BBC . "Chúng ta luôn có ý tưởng, chúng ta luôn đi đầu. Tôi cho rằng đây có thể là một bước tiến rất tích cực. Thay vì chi hàng tỷ đô la, bạn sẽ chi ít hơn, và hy vọng là bạn sẽ tìm ra giải pháp tương tự."

Về phần mình, CEO của Meta, Mark Zuckerberg, đã "tập hợp bốn nhóm kỹ sư" với nhiệm vụ duy nhất là tìm ra công thức bí mật của DeepSeek. Theo Fortune , hai nhóm đang điều tra cách DeepSeek quản lý năng lực của mình với chi phí thấp như vậy, trong khi nhóm còn lại tìm cách khám phá các tập dữ liệu mà DeepSeek sử dụng. Nhóm cuối cùng chịu trách nhiệm tái cấu trúc Llama, có lẽ là để sao chép chức năng và thành công của DeepSeek.

CEO của xAI, Elon Musk, vừa lên mạng và bắt đầu "cà khịa" những tuyên bố về hiệu suất của DeepSeek. Công ty của ông hiện đang nỗ lực xây dựng " cụm đào tạo AI mạnh mẽ nhất thế giới ", ngay ngoại ô Memphis, Tennessee. Ngược lại, CEO của OpenAI, Sam Altman, đã chào đón DeepSeek vào cuộc đua AI, tuyên bố "r1 là một mô hình ấn tượng, đặc biệt là về những gì họ có thể mang lại với mức giá này", trong một bài đăng gần đây trên X. "Rõ ràng chúng tôi sẽ cung cấp những mô hình tốt hơn nhiều và việc có một đối thủ cạnh tranh mới cũng rất đáng khích lệ! Chúng tôi sẽ tung ra một số bản phát hành."

Sam Altman trên DeepSeek

Ngay cả Hải quân Hoa Kỳ cũng đang vào cuộc . Lực lượng vũ trang đã đưa ra cảnh báo cho các thủy thủ vào tháng 1 rằng DeepSeek không được sử dụng "trong bất kỳ trường hợp nào" vì "những lo ngại tiềm ẩn về an ninh và đạo đức liên quan đến nguồn gốc và cách sử dụng mô hình này". Bản ghi nhớ email viết rằng "bắt buộc" các quân nhân không được sử dụng DeepSeek "cho bất kỳ nhiệm vụ liên quan đến công việc hoặc mục đích cá nhân nào".

 
 


 

Tác giả thuytrang Admin
Bài viết trước ChatGPT ra mắt tính năng kiểm soát của phụ huynh để cảnh báo rủi ro an toàn cho trẻ

ChatGPT ra mắt tính năng kiểm soát của phụ huynh để cảnh báo rủi ro an toàn cho trẻ

Bài viết tiếp theo

Cách Tắt Hiệu Ứng Trong Suốt Trên Windows 10 Nhanh Chóng Và Hiệu Quả

Cách Tắt Hiệu Ứng Trong Suốt Trên Windows 10 Nhanh Chóng Và Hiệu Quả
Viết bình luận
Thêm bình luận

Bài viết liên quan

Thông báo

0917111899