Các nhà nghiên cứu của Hugging Face đang cố gắng xây dựng một phiên bản mở hơn của mô hình 'lập luận' AI của DeepSeek

Hugging Face phát triển mô hình AI mở Open-R1 từ R1 của DeepSeek.

: Chưa đầy một tuần sau khi DeepSeek ra mắt mô hình AI R1, các nhà nghiên cứu của Hugging Face bắt tay vào xây dựng bản mở Open-R1. Dự án này không chỉ nhằm tái tạo mô hình R1 mà còn muốn công khai toàn bộ thành phần và dữ liệu. Open-R1 nhận được sự chú ý lớn với 10,000 sao trên GitHub chỉ trong ba ngày đầu tiên. Thành công của Open-R1 sẽ giúp các nhà nghiên cứu AI phát triển thế hệ mới của mô hình lập luận nguồn mở.

Các nhà nghiên cứu của Hugging Face, đứng đầu là Leandro von Werra, đang nỗ lực xây dựng mô hình AI Open-R1 từ mô hình R1 của DeepSeek. Mục tiêu là tạo ra một phiên bản mở hoàn toàn và công khai tất cả thành phần cấu tạo cũng như dữ liệu đào tạo của R1.

Được phát hành gần đây, mô hình R1 của DeepSeek thực hiện rất tốt trong việc lập luận và kiểm tra tính đúng đắn của thông tin nó nhận được. Tuy nhiên, nhiều công cụ phát triển của R1 không được chia sẻ công khai, khiến việc nghiên cứu sâu hơn trở nên khó khăn.

Open-R1 tận dụng Science Cluster, một máy chủ nghiên cứu chuyên dụng của Hugging Face, với 768 GPU Nvidia H100 để tạo ra dữ liệu đào tạo tương tự như R1. Với sự tham gia đông đảo từ cộng đồng AI, dự án nhanh chóng đạt được 10.000 sao trên GitHub, mở ra cơ hội phát triển mô hình lập luận nguồn mở tương lai.