Các nhà nghiên cứu của Hugging Face đang cố gắng xây dựng một phiên bản mở hơn của mô hình 'lập luận' AI của DeepSeek
Hugging Face phát triển mô hình AI mở Open-R1 từ R1 của DeepSeek.

Các nhà nghiên cứu của Hugging Face, đứng đầu là Leandro von Werra, đang nỗ lực xây dựng mô hình AI Open-R1 từ mô hình R1 của DeepSeek. Mục tiêu là tạo ra một phiên bản mở hoàn toàn và công khai tất cả thành phần cấu tạo cũng như dữ liệu đào tạo của R1.
Được phát hành gần đây, mô hình R1 của DeepSeek thực hiện rất tốt trong việc lập luận và kiểm tra tính đúng đắn của thông tin nó nhận được. Tuy nhiên, nhiều công cụ phát triển của R1 không được chia sẻ công khai, khiến việc nghiên cứu sâu hơn trở nên khó khăn.
Open-R1 tận dụng Science Cluster, một máy chủ nghiên cứu chuyên dụng của Hugging Face, với 768 GPU Nvidia H100 để tạo ra dữ liệu đào tạo tương tự như R1. Với sự tham gia đông đảo từ cộng đồng AI, dự án nhanh chóng đạt được 10.000 sao trên GitHub, mở ra cơ hội phát triển mô hình lập luận nguồn mở tương lai.