Siêu AI DeepSeek của Trung Quốc giáng đòn mạnh vào Nvidia, khiến 589 tỷ USD vốn hóa bị bốc hơi.
DeepSeek hiện được xem là “mối đe dọa lớn” đối với thị trường công nghệ Mỹ, khi một công ty Trung Quốc có thể tạo ra mô hình AI vượt trội với chi phí thấp đáng kinh ngạc.
Cuộc cách mạng từ DeepSeek V3
Trong lĩnh vực trí tuệ nhân tạo (AI), các mô hình ngôn ngữ lớn (LLM) đóng vai trò quan trọng, là nền tảng cho các chatbot như ChatGPT. Điểm then chốt của LLM nằm ở số lượng tham số, yếu tố quyết định khả năng xử lý dữ liệu phức tạp và đưa ra dự đoán chính xác.
Thế nhưng, DeepSeek V3 – mô hình của một startup tại Hàng Châu, Trung Quốc – đã làm cả ngành công nghệ sửng sốt khi đạt tới 671 tỷ tham số chỉ sau 2 tháng huấn luyện, với chi phí vỏn vẹn 5,58 triệu USD. Con số này thấp hơn rất nhiều so với nguồn lực khổng lồ mà các “ông lớn” như Meta hay OpenAI phải chi trả để phát triển mô hình AI.
Thung lũng Silicon chao đảo
Sự xuất hiện của DeepSeek không chỉ gây chấn động mà còn tác động mạnh mẽ đến thị trường tài chính. Sau phiên giao dịch ngày 27/1, cổ phiếu Nvidia – hãng bán dẫn hàng đầu cung cấp GPU cho các công ty AI – sụt giảm 24%, làm bay hơi 589 tỷ USD vốn hóa thị trường, đánh dấu ngày tồi tệ nhất kể từ năm 2020.
Tại châu Âu, tình hình cũng không khả quan hơn. Cổ phiếu của ASML Holding – nhà sản xuất thiết bị chip lớn – giảm 11%. Chỉ số biến động Cboe (VIX) tăng vọt, và Nasdaq 100 cùng chỉ số công nghệ Stoxx 600 ở châu Âu mất tổng cộng hơn 1 nghìn tỷ USD vốn hóa.
“DeepSeek đã chứng minh rằng việc phát triển mô hình AI mạnh mẽ với chi phí thấp hơn là hoàn toàn khả thi. Điều này có thể làm lung lay nền tảng đầu tư vào chuỗi cung ứng AI, vốn dựa trên những khoản chi tiêu khổng lồ của các công ty lớn,” ông Vey-Sern Ling, Giám đốc điều hành tại Union Bancaire Privée, nhận xét.
Bước ngoặt mang tính toàn cầu
DeepSeek đang được ví như “Sputnik” của ngành AI, ám chỉ sự kiện Liên Xô phóng vệ tinh đầu tiên vào không gian và gây chấn động nước Mỹ. Startup này không chỉ chứng minh sức mạnh công nghệ mà còn thách thức các lệnh trừng phạt của Mỹ.
CEO Liang Wenfeng của DeepSeek cho biết mặc dù các hạn chế xuất khẩu từ Mỹ đã gây khó khăn, đội ngũ của ông vẫn tận dụng tối đa các tài nguyên hiện có. Nhờ kinh nghiệm từ quỹ đầu cơ High Flyer-Quant, DeepSeek đã tìm cách tối ưu hóa GPU Nvidia cũ để đạt hiệu suất vượt trội.
“Những kỹ sư của chúng tôi biết cách khai thác tiềm năng của các GPU, ngay cả khi chúng không phải là mẫu tiên tiến nhất,” một chuyên gia AI nhận định.
Thay đổi cuộc chơi trong ngành AI
Sự thành công của DeepSeek không chỉ đến từ công nghệ mà còn từ chiến lược tuyển dụng độc đáo. Công ty ưu tiên các nhân tài trẻ, từ sinh viên mới tốt nghiệp đến những người chỉ có một hoặc hai năm kinh nghiệm. Chính sách này đã giúp DeepSeek tập trung hoàn toàn vào việc đổi mới và chia sẻ các đột phá khoa học thay vì bảo vệ chúng vì lợi nhuận thương mại.
Cùng với ByteDance – công ty mẹ của TikTok – DeepSeek được đánh giá là một trong những doanh nghiệp trả thù lao cao nhất cho các kỹ sư AI tại Trung Quốc, với các văn phòng đặt tại Hàng Châu và Bắc Kinh.
Theo ông Ritwik Gupta, nhà nghiên cứu AI tại Đại học California, thành công của DeepSeek minh chứng cho việc những người đi sau hoàn toàn có thể đạt được thành tựu lớn với chi phí thấp hơn và nhanh hơn so với người tiên phong.
DeepSeek đang đặt ra những câu hỏi lớn về hiệu quả của các khoản đầu tư khổng lồ vào cơ sở hạ tầng AI tại Mỹ. Sự trỗi dậy mạnh mẽ của startup này không chỉ làm rung chuyển ngành công nghệ mà còn là lời cảnh báo đối với những “ông lớn” trên toàn cầu. Đây không chỉ là cuộc chơi về công nghệ mà còn là cuộc đối đầu chiến lược trong bối cảnh cạnh tranh Mỹ – Trung ngày càng căng thẳng.