Sau khi R1 của DeepSeek gây chấn động thế giới AI, Alibaba đáp trả bằng mô hình được cho là mạnh mẽ hơn

Alibaba ra mắt Qwen 2.5-Max mạnh hơn DeepSeek-V3 trong dịp Tết Nguyên Đán.

: Alibaba bất ngờ giới thiệu mô hình AI mới, Qwen 2.5-Max, ngay trong ngày đầu tiên của Tết Nguyên Đán, được cho là vượt trội hơn DeepSeek-V3 của DeepSeek. Mô hình mới của Alibaba được huấn luyện trên hơn 20 nghìn tỷ token với kiến trúc MoE tiết kiệm tài nguyên. DeepSeek trước đó đã gây ảnh hưởng lớn đến các đối thủ quốc tế, khiến giá cổ phiếu Nvidia giảm mạnh và buộc các doanh nghiệp Trung Quốc phải tìm cách đáp trả. Qwen 2.5-Max của Alibaba không chỉ nổi bật về hiệu suất mà còn về chi phí vận hành thấp.

Alibaba đã bất ngờ giới thiệu mô hình AI mới, Qwen 2.5-Max, ngay ngày đầu tiên của Tết Nguyên Đán, chứng tỏ sự cấp thiết trong việc đáp trả sau khi DeepSeek gây chấn động trong ngành AI. Qwen 2.5-Max được tuyên bố vượt trội so với các mô hình tiên tiến của OpenAI và Meta như GPT-4o và LLaMa-3.1-405B.

DeepSeek-V3 được biết đến với chi phí thấp và hiệu quả cao, khiến các nhà đầu tư đặt câu hỏi về việc chi tiêu khổng lồ của các công ty công nghệ Mỹ. Các doanh nghiệp Trung Quốc bao gồm Alibaba và ByteDance đã nhanh chóng giới thiệu các mô hình mới nhằm cạnh tranh, với ByteDance cũng tuyên bố vượt qua GPT-3.5 của OpenAI.

Trước đó, mô hình DeepSeek-V2 đã gây ra một cuộc chiến giá khốc liệt tại Trung Quốc vào tháng 5 khi chỉ tính phí 1 nhân dân tệ cho mỗi triệu token. Với hiệu suất cao và chi phí vận hành thấp, Qwen 2.5-Max cũng tránh né các chủ đề nhạy cảm chính trị liên quan đến Trung Quốc, tương tự DeepSeek.