Alibaba ra mắt và mã nguồn mở Qwen3, mô hình AI lý luận lai đầu tiên của Trung Quốc

Alibaba công bố Qwen3, mô hình AI kết hợp đầu tiên của Trung Quốc với hai chế độ lý luận.

: Alibaba giới thiệu Qwen3, mô hình ngôn ngữ lớn tích hợp chế độ tư duy nhanh và chậm giúp giảm chi phí tính toán. Các mô hình trong dòng Qwen3 bao gồm Qwen3-30B-A3B tinh chỉnh và Qwen3-235B-A22B với hơn 235 tỷ thông số. Các chế độ lý luận của Qwen3 cho phép thay đổi giữa câu trả lời chi tiết hoặc phản hồi nhanh tùy theo độ phức tạp của nhiệm vụ. Alibaba Cloud đã mở mã nguồn cho các mô hình chính và tuyên bố khả năng cạnh tranh với các mô hình hàng đầu khác.

Alibaba đã công bố ra mắt Qwen3 vào ngày 29 tháng 4, xác định đây là mô hình ngôn ngữ lớn và mô hình lý luận lai đầu tiên của Trung Quốc. Qwen3 được thiết kế để tích hợp hai chế độ tư duy gồm tư duy nhanh và chậm, giúp giảm thiểu chi phí tính toán. Điều này có ý nghĩa đặc biệt trong bối cảnh ngày càng có nhiều yêu cầu về hiệu suất và hiệu quả từ các hệ thống trí tuệ nhân tạo lớn.

Mô hình Qwen3 bao gồm nhiều phiên bản như Qwen3-30B-A3B được tinh chỉnh và Qwen3-235B-A22B, mô hình chính của Alibaba Cloud với hơn 235 tỷ thông số. Alibaba đã quyết định mở mã nguồn cho các Mô hình pha trộn chuyên gia (Mixture-of-Experts, MoE), giúp thúc đẩy đà đổi mới và phát triển cộng đồng.

Theo thông tin từ Alibaba Cloud, Qwen3-235B-A22B cho kết quả cạnh tranh trên các tiêu chuẩn mã hóa, toán học và lý luận chung. Sức mạnh này đem lại cho mô hình vị thế tương tự các đối thủ hàng đầu trong ngành, bao gồm DeepSeek-R1, o1 và o3-mini của 01.AI, Grok-3, và Gemini 2.5 Pro.

Thông qua việc thiết kế linh hoạt để cân bằng giữa tốc độ và trí tuệ, Qwen3 cho phép người dùng chuyển đổi giữa các câu trả lời từng bước chi tiết hoặc phản hồi nhanh tùy thuộc vào độ phức tạp của nhiệm vụ. Đây là bước cải tiến đáng kể, mở ra khả năng ứng dụng rộng lớn hơn cho các mô hình AI trong tương lai.

Trên các nền tảng lớn, mô hình cơ bản đã được cung cấp, hứa hẹn mang đến nhiều cơ hội nghiên cứu và ứng dụng cho các nhà phát triển và doanh nghiệp. Sự kết hợp của chế độ lý luận nhanh và chậm cũng như việc mở mã nguồn chắc chắn sẽ thúc đẩy các xu hướng mới trong ngành công nghiệp AI.

Nguồn: Alibaba Cloud, TechNode