Alibaba giới thiệu Qwen3, một họ mô hình AI suy luận 'lai'

Alibaba công bố Qwen3, mô hình AI lai, vượt trội mô hình của Google và OpenAI.

: Alibaba đã phát hành Qwen3, một loạt mô hình AI với khả năng tốt hơn các mô hình từ Google và OpenAI. Có thể tải xuống trên Hugging Face và GitHub, các mô hình này trải từ 0.6 tới 235 tỷ tham số. Các mô hình này có khả năng 'suy luận' giống như OpenAI, nhưng có độ trễ cao hơn. Qwen3 hỗ trợ 119 ngôn ngữ và đã được huấn luyện trên gần 36 nghìn tỷ token.

Alibaba đã ra mắt Qwen3, một nhóm mô hình AI dự kiến sẽ trở thành đối thủ nặng ký trước các mô hình hàng đầu hiện có từ Google và OpenAI. Theo Alibaba, Qwen3 không chỉ sánh tầm, mà trong một số trường hợp còn có thể vượt trội hơn các mô hình hàng đầu trên thị trường. Các mô hình Qwen3 có dải tham số từ 0.6 tỷ đến 235 tỷ, được cho là sẽ cung cấp khả năng giải quyết vấn đề hiệu quả hơn.

Những mô hình này sẽ sớm có sẵn để tải về trên các nền tảng phát triển AI như Hugging Face và GitHub, mang lại cho nhà phát triển cơ hội tiếp cận và nghiên cứu sâu vào cấu trúc của chúng. Trong bối cảnh các mô hình AI đang ngày càng phát triển mạnh mẽ ở Trung Quốc, việc giới thiệu Qwen3 càng tạo thêm áp lực lên các phòng thí nghiệm AI ở Hoa Kỳ như OpenAI trong việc phát triển các công nghệ AI tiên tiến hơn.

'Mô hình Qwen3 của chúng tôi được tối ưu hoá để xử lý thông tin một cách có hiệu quả, đồng thời cung cấp cho người dùng khả năng kiểm soát chi tiêu tài nguyên suy nghĩ', đội ngũ Qwen viết trong một bài đăng. Một trong những tính năng nổi bật của Qwen3 là khả năng tích hợp các chế độ suy nghĩ và không suy nghĩ linh hoạt, giúp người dùng cấu hình ngân sách cho từng nhiệm vụ cụ thể.

Có khả năng hỗ trợ 119 ngôn ngữ, Qwen3 đã được đào tạo trên một tập dữ liệu khổng lồ gồm gần 36 nghìn tỷ token, tương đương với hàng triệu từ. Những cải tiến này, cùng với nhiều yếu tố nâng cao khác, đã cải thiện đáng kể khả năng của Qwen3 so với người tiền nhiệm Qwen2, khiến cho Qwen3 trở thành một nền tảng AI mạnh mẽ và cạnh tranh.

Qwen3 hiện đã hỗ trợ từ các nhà cung cấp đám mây như Fireworks AI và Hyperbolic, mở rộng sự truy cập và ứng dụng của các mô hình AI này. Theo Tuhin Srivastava, CEO của Baseten, Qwen3 là một bằng chứng cho xu hướng mô hình mở đang theo kịp với các hệ thống đóng như của OpenAI. Những động thái này phản ánh rằng doanh nghiệp đang dần xây dựng công cụ riêng của mình cũng như sử dụng các sản phẩm từ các công ty mô hình đóng như Anthropic và OpenAI.

Nguồn: TechCrunch, X