DeepSeek cập nhật mô hình trí tuệ nhân tạo R1, phát hành trên Hugging Face
DeepSeek công bố bản nâng cấp AI R1 trên Hugging Face với 685 tỷ tham số, dưới giấy phép MIT.

DeepSeek, một startup AI đến từ Trung Quốc, vừa phát hành phiên bản cập nhật của mô hình suy luận R1, có tên R1-0528, trên nền tảng Hugging Face. Bản cập nhật này được công bố một cách âm thầm qua một bài đăng trên WeChat mà không có thông cáo báo chí chính thức. Dù vậy, mô hình đã cho thấy kết quả mạnh mẽ trong các bài kiểm tra tạo mã trên LiveCodeBench, chỉ xếp sau o4 mini và o3 của OpenAI, đồng thời vượt qua các đối thủ như Grok 3 mini của xAI và Qwen 3 của Alibaba.
Mô hình DeepSeek-R1 gốc, ra mắt vào tháng 1 năm 2025, đã thu hút sự chú ý nhờ hiệu suất tương đương với mô hình o1 của OpenAI trong các tác vụ toán học, lập trình và suy luận – nhưng với chi phí thấp hơn nhiều. Mô hình này được phát triển bằng cách tiếp cận huấn luyện mới: học tăng cường (RL) mà không cần tinh chỉnh có giám sát (SFT), kết hợp với dữ liệu khởi động lạnh trước RL. Kiến trúc lõi dựa trên DeepSeek-V3-Base và hỗ trợ ngữ cảnh lên đến 128K token.
Để hỗ trợ cộng đồng nghiên cứu AI, DeepSeek đã mã nguồn mở không chỉ mô hình R1 chính mà còn nhiều biến thể chưng cất khác dựa trên kiến trúc Qwen và Llama. Các mô hình này có quy mô từ 1.5 tỷ đến 70 tỷ tham số và đạt được kết quả ấn tượng trên nhiều bảng xếp hạng. Đặc biệt, DeepSeek-R1-Distill-Qwen-32B vượt qua o1-mini của OpenAI trong nhiều tác vụ suy luận và tạo mã.
Quá trình phát triển hiệu quả của DeepSeek đã thách thức quan điểm rằng các mô hình AI hàng đầu phải cần tài nguyên khổng lồ. Công ty cho biết mô hình V3 của họ chỉ tiêu tốn chưa đến 6 triệu USD để huấn luyện – thấp hơn rất nhiều so với mức 100 triệu USD mà OpenAI chi cho GPT-4. Cách tiếp cận tiết kiệm này đang làm thay đổi cục diện cạnh tranh của ngành AI, khiến nhiều công ty phải điều chỉnh chiến lược giá và lịch phát hành.
Trong khi cộng đồng AI đang chờ đợi phiên bản nâng cao hơn là R2 của DeepSeek, bản cập nhật R1-0528 tiếp tục phản ánh sứ mệnh của công ty trong việc dân chủ hóa quyền truy cập vào các mô hình suy luận mạnh mẽ. Tất cả phiên bản của DeepSeek-R1 đều có sẵn miễn phí trên Hugging Face, mời gọi các nhà phát triển và nghiên cứu trên toàn thế giới thử nghiệm và xây dựng với AI mã nguồn mở.
Nguồn: Reuters, TechCrunch, Hugging Face