DeepSeek tiếp tục khẳng định vị thế trong lĩnh vực AI mã nguồn mở khi công bố kế hoạch phát hành mã nguồn đằng sau mô hình mô phỏng lý luận tiên tiến.
Động thái này không chỉ tăng cường tính minh bạch mà còn tạo điều kiện cho cộng đồng nghiên cứu AI toàn cầu tiếp cận và phát triển công nghệ một cách cởi mở hơn. Liệu DeepSeek có thực sự vượt xa OpenAI và các đối thủ khác trong cuộc đua AI mã nguồn mở?
Tháng trước, Deepseek đã khiến cộng đồng ai xôn xao khi ra mắt một mô hình mô phỏng lý luận tiên tiến, cho phép tải về và sử dụng miễn phí theo giấy phép mit. Giờ đây, công ty tiếp tục thúc đẩy sự minh bạch bằng kế hoạch công bố mã nguồn đằng sau mô hình này, với cam kết sẽ phát hành năm kho mã nguồn mở bắt đầu từ tuần tới.
Cam kết minh bạch qua tuần lễ mã nguồn mở
Trong một bài đăng trên mạng xã hội tối thứ năm, Deepseek tuyên bố rằng họ sẽ công bố mã nguồn hằng ngày trong tuần lễ mang tên open source week. Những kho mã này sẽ mang đến góc nhìn sâu hơn về các nền tảng cơ bản của hệ thống mà Deepseek đã sử dụng, triển khai và thử nghiệm thực tế.
Chúng tôi tin rằng mỗi dòng mã được chia sẻ đều đóng góp vào động lực chung, giúp đẩy nhanh hành trình tiến tới những đột phá mới trong ai, công ty nhấn mạnh.
Dù Deepseek chưa tiết lộ cụ thể loại mã nguồn nào sẽ được công bố, nhưng trang github deepseek open infra của họ hé lộ rằng đây sẽ là mã đã giúp dự án nhỏ bé của chúng tôi tiến về phía trước, đồng thời khẳng định tính minh bạch tuyệt đối trong quá trình phát triển. Trang này cũng dẫn lại một bài nghiên cứu từ năm 2024, mô tả kiến trúc đào tạo và nền tảng phần mềm mà Deepseek sử dụng.
Sự đối lập với Openai và cơ hội tiếp cận rộng rãi
Quyết định mở mã nguồn của Deepseek càng làm nổi bật sự khác biệt so với Openai, công ty đứng sau Chatgpt, vốn vẫn giữ các mô hình của mình ở dạng đóng hoàn toàn. Động thái này có thể giúp Deepseek tiếp cận dễ dàng hơn với cộng đồng nghiên cứu ai toàn cầu, đặc biệt trong bối cảnh ứng dụng của họ đang đối mặt với hạn chế quốc tế do lo ngại về quyền riêng tư.
Thế nào mới là mở thực sự
Trước đó, khi ra mắt mô hình ai, Deepseek đã cung cấp open weights – tức là cho phép truy cập vào trọng số của mô hình, giúp người dùng tinh chỉnh với dữ liệu mới để phục vụ các mục đích cụ thể.
Nhiều mô hình ai lớn như Google Gemma, Meta Llama, và thậm chí các phiên bản cũ hơn như gpt-2 của Openai cũng được phát hành theo cách này. Tuy nhiên, một câu hỏi lớn đặt ra là liệu Deepseek có công khai mã nguồn đào tạo hay không.
Theo Open source initiative, để một ai được xem là hoàn toàn mã nguồn mở, nó phải bao gồm:
- Mã nguồn của mô hình, bao gồm cả trọng số weights
- Mã nguồn quá trình huấn luyện, giúp người khác có thể tái tạo mô hình từ đầu
- Thông tin chi tiết về dữ liệu đào tạo, giúp đảm bảo tính minh bạch và khả năng kiểm chứng
Nếu Deepseek thực sự công bố mã nguồn đào tạo, điều này sẽ giúp các nhà nghiên cứu có cái nhìn sâu sắc hơn về cách mô hình hoạt động, phát hiện thiên kiến bias, và thậm chí tái tạo mô hình từ đầu với dữ liệu huấn luyện mới.
Bước đi quan trọng trong cuộc đua ai mã nguồn mở
Deepseek không phải công ty ai duy nhất theo đuổi mã nguồn mở. Trước đó, Elon Musk’s xai đã công bố mã nguồn inference time của Grok 1 vào tháng 3 năm 2024 và hứa sẽ làm điều tương tự với Grok 2 trong vài tuần tới
Hugging face đã tạo ra một bản sao mã nguồn mở của tính năng deep research của Openai chỉ vài giờ sau khi Openai phát hành tính năng này
Tuy nhiên, nhiều mô hình như Grok 3 của xai vẫn giữ quyền kiểm soát và chỉ cung cấp cho người dùng cao cấp. Điều này đặt ra một câu hỏi lớn Deepseek có thực sự đi xa hơn những công ty khác hay không
Quyết định mở mã nguồn của Deepseek là một bước đi quan trọng, không chỉ giúp tăng cường tính minh bạch mà còn có thể định hình tương lai của ai mã nguồn mở. Nếu công ty thực sự công khai mã nguồn đào tạo, điều này có thể thúc đẩy sự phát triển của ai phi tập trung, đồng thời tạo ra nhiều cơ hội nghiên cứu và cải tiến trong cộng đồng ai toàn cầu.
Tuy nhiên, vẫn còn nhiều câu hỏi chưa được giải đáp về phạm vi mã nguồn mà Deepseek sẽ công bố. Liệu đây có phải là một mô hình ai hoàn toàn mở, hay chỉ là một phiên bản mở giới hạn như nhiều công ty khác. Câu trả lời sẽ rõ ràng hơn trong open source week sắp tới.
Hãy cùng chờ xem Deepseek sẽ tạo ra tác động lớn đến đâu trong cuộc chơi ai mã nguồn mở.