Giới công nghệ AI mã nguồn mở vừa chứng kiến một cuộc lật đổ ngoạn mục. Qwen3 – dòng mô hình ngôn ngữ mới toanh của Alibaba – chính thức vượt qua DeepSeek-R1 trên nền tảng đánh giá độc lập LiveBench, vốn nổi tiếng với các bài kiểm tra toàn diện về lập trình, toán học, phân tích dữ liệu và khả năng xử lý ngôn ngữ.
Ra mắt ngày 28/4, Qwen3 không chỉ khiến cộng đồng AI dõi theo bởi sức mạnh của mình, mà còn bởi tuyên bố đầy tham vọng từ Alibaba: đây là dòng mô hình có thể sánh ngang – thậm chí vượt – GPT-4 của OpenAI hay Gemini của Google trong một số tác vụ nhất định.
Với kiến trúc dựa trên “mixture of experts” (MoE), Qwen3 khéo léo phân bổ năng lực tính toán tùy theo yêu cầu nhiệm vụ – một cách tiếp cận giúp tối ưu hóa hiệu suất mà không đòi hỏi chi phí huấn luyện quá lớn. Mỗi mô hình trong bộ sưu tập này có thể linh hoạt giữa hai chế độ: xử lý nhanh các yêu cầu đơn giản hoặc dành nhiều thời gian suy luận cho các bài toán phức tạp.
Cấu hình khủng với 235 tỷ tham số, Qwen3 gần như ngang hàng với DeepSeek-V2 (236 tỷ) và vượt GPT-4 (ước tính 175 tỷ). Điều đáng chú ý là Alibaba dự kiến sẽ phát hành Qwen3 theo giấy phép mở trên các nền tảng phổ biến như Hugging Face và GitHub, cho phép cộng đồng dễ dàng tiếp cận và phát triển.
Không chỉ mạnh mẽ về mặt kỹ thuật, Qwen3 còn thể hiện chiều sâu trong dữ liệu đào tạo. Theo công bố từ Alibaba, mô hình này được huấn luyện trên khoảng 36.000 tỷ token – tương đương 27.000 tỷ từ – bao gồm đủ loại tài nguyên từ sách vở, mã lập trình đến dữ liệu sinh ra bởi AI. Ngoài ra, Qwen3 còn hỗ trợ tới 119 ngôn ngữ khác nhau, mở rộng đáng kể phạm vi ứng dụng toàn cầu.
Tuy nhiên, dù đã vươn lên dẫn đầu nhóm mô hình mã nguồn mở, Qwen3 vẫn còn khoảng cách đáng kể so với các đối thủ “đóng” hàng đầu thế giới. Các mô hình như o3 của OpenAI, Gemini Pro 2.5 của Google hay Claude 3.7 của Anthropic hiện vẫn chiếm lĩnh những vị trí cao nhất trên bảng xếp hạng tổng thể của LiveBench. Đặc biệt, o3-mini high – mô hình mới nhất được Microsoft hậu thuẫn – đang giữ ngôi đầu bảng toàn cầu.
Dù vậy, sự trỗi dậy của Qwen3 là minh chứng cho sự chuyển động nhanh chóng của thế giới AI nguồn mở. Alibaba đã gửi đi một thông điệp rõ ràng: cuộc chơi không còn là cuộc độc diễn của phương Tây.