DeepSeek khiến Silicon Valley xôn xao
DeepSeek vừa công bố mô hình AI R1, gây chú ý với khả năng và hiệu quả chi phí so với đối thủ Mỹ.
Công ty AI Trung Quốc, DeepSeek, đã công khai mô hình suy luận R1, làm dấy lên nhiều ý kiến trong ngành công nghệ về những đột phá mà họ đạt được và ý nghĩa đối với AI. Mô hình này dường như sánh ngang hoặc vượt qua mô hình o1 của OpenAI trong một số thước đo AI và chỉ tốn 5.6 triệu USD để huấn luyện.
Việc này đạt được dù gặp phải lệnh cấm vận từ Mỹ, cản trở việc bán chip tiên tiến cho các công ty Trung Quốc. Liang Wenfeng của DeepSeek thừa nhận với Thủ tướng Trung Quốc rằng các hạn chế xuất khẩu từ Mỹ vẫn là một nút thắt cổ chai.
Tranh luận xoay quanh việc liệu DeepSeek có sử dụng chiêu trò để hạ thấp chi phí hay không, dù điều này đã bị bác bỏ do thiếu chứng cứ. Yann LeCun khẳng định mô hình nguồn mở đang vượt qua mô hình độc quyền của OpenAI, và DeepSeek đã phát triển từ nghiên cứu mở và mã nguồn mở như PyTorch và Llama từ Meta.