Phát triển DeepSeek tốn 1,6 tỷ USD chứ không phải 6 triệu USD?

DeepSeek tiêu tốn hơn 1 tỷ USD thay vì 5,6 triệu USD cho phát triển AI.

DeepSeek, công ty chuyên nghiên cứu và phát triển AI, được cho là đã tiêu tốn hơn 1,6 tỷ USD để phát triển các mô hình AI, thay vì chỉ 5,6 triệu USD như những gì công ty công bố. Một nghiên cứu từ SemiAnalysis cho thấy chi phí phần cứng của DeepSeek đã vượt quá 500 triệu USD, trong khi việc tạo dữ liệu tổng hợp cho mô hình đào tạo cũng tốn kém một khoản chi phí lớn. Số tiền 5,6 triệu USD mà công ty công bố chỉ tính riêng chi phí đào tạo, không bao gồm các chi phí nghiên cứu, phát triển, chuẩn bị dữ liệu, bảo trì phần cứng và các yếu tố khác.

Phân tích cho thấy chi phí đầu tư vào các máy chủ của DeepSeek có thể lên đến 1,6 tỷ USD, trong đó 944 triệu USD là chi phí vận hành các cụm máy. Bên cạnh đó, công ty cũng phải thử nghiệm, thiết kế các kiến trúc mới, thu thập và xử lý dữ liệu, trả lương cho nhân viên, cùng nhiều khoản chi phí khác.

Xem thêm

Copilot+ PC: Sức mạnh AI sắp có mặt trên máy tính để bàn với chip Intel mới

Meta vung tiền săn chuyên gia AI với lương gần nửa triệu USD

Google mang AI Gemini vào trường học với loạt tính năng mới

DeepSeek có thể đã tiếp cận tới khoảng 10.000 GPU Nvidia H800 giảm hiệu năng và 10.000 GPU H100, cùng với các phiên bản H20 để đào tạo mô hình AI. Những GPU này được chia sẻ giữa DeepSeek và quỹ đầu tư High-Flyer, và được sử dụng cho các công việc như giao dịch, suy luận, đào tạo và nghiên cứu.

Mặc dù DeepSeek liên tục tổ chức tuyển dụng và quảng cáo về “cơ hội truy cập 10.000 GPU không giới hạn”, công ty vẫn chưa đưa ra thông tin chính thức về chi phí tổng thể. Trước đó, DeepSeek đã được đánh giá là tối ưu chi phí huấn luyện AI, nhưng số liệu 5,6 triệu USD chỉ là một phần nhỏ trong tổng chi phí.

Các chuyên gia cho rằng chi phí đầu tư vào AI không chỉ bao gồm đào tạo mà còn liên quan đến cơ sở hạ tầng suy luận, phục vụ nhu cầu của hàng triệu người dùng. Theo đó, khi mức độ phổ biến của AI tăng cao, DeepSeek sẽ phải chi thêm nhiều tiền cho việc vận hành cơ sở hạ tầng này.

Công ty cũng được cho là đã sử dụng kỹ thuật “chưng cất” để đạt hiệu suất cao với chi phí thấp hơn, một chiến lược mà OpenAI đã nghi ngờ trong các mô hình của DeepSeek.