Các nhà nghiên cứu mở mã nguồn Sky-T1, một mô hình AI 'suy luận' có thể được huấn luyện với chi phí dưới 450 đô la
Sky-T1-32B-Preview của NovaSky, mô hình AI suy luận, chỉ tốn dưới 450 đô la để huấn luyện.

NovaSky tại phòng thí nghiệm Sky Computing của UC Berkeley đã ra mắt Sky-T1-32B-Preview, một mô hình AI 'suy luận' mở có thể huấn luyện với chi phí dưới 450 đô la. Họ đã công khai bộ dữ liệu và mã huấn luyện cần thiết, cho phép Sky-T1 tiếp cận được từ đầu.
Sky-T1-32B-Preview được huấn luyện trong 19 giờ bằng 8 GPU Nvidia H100, sử dụng dữ liệu ban đầu từ mô hình QwQ-32B-Preview của Alibaba. Kết quả cho thấy Sky-T1 vượt qua bản o1-preview của OpenAI trên loạt thử thách MATH500 và LiveCodeBench, nhưng chưa đạt chất lượng tốt trên GPQA-Diamond.
NovaSky nhấn mạnh sáng kiến nhằm phát triển mô hình nguồn mở với khả năng suy luận mạnh mẽ và giá thành rẻ. Họ cam kết cải tiến hiệu quả và độ chính xác của các mô hình trong tương lai, đồng thời nghiên cứu các kỹ thuật tiên tiến để nâng cao hiệu suất của mô hình.