Reddit kiện Anthropic, cáo buộc sử dụng dữ liệu trái phép
Reddit kiện Anthropic vì sử dụng dữ liệu người dùng trái phép từ năm 2021.

Vào ngày 4 tháng 6 năm 2025, Reddit đã đệ đơn kiện công ty khởi nghiệp AI Anthropic, cáo buộc công ty này thu thập trái phép nội dung do người dùng Reddit tạo ra để huấn luyện chatbot Claude. Đơn kiện cho biết các bot của Anthropic đã truy cập máy chủ của Reddit hơn 100.000 lần kể từ tháng 7 năm 2024, mặc dù trước đó Anthropic tuyên bố đã ngừng hoạt động thu thập dữ liệu. Reddit cho rằng hành vi này vi phạm thỏa thuận người dùng và gây ảnh hưởng đến các hợp đồng thương mại của họ với các đối tác như Google và OpenAI.
Reddit nhấn mạnh rằng các thỏa thuận cấp phép dữ liệu của họ đều có điều khoản bảo vệ quyền riêng tư người dùng, bao gồm việc tôn trọng các bài đăng đã bị xóa và ngăn chặn việc sử dụng sai mục đích. Trong khi đó, đơn kiện cho rằng Anthropic đã từ chối ký kết hợp đồng và sử dụng dữ liệu Reddit mà không được phép — bao gồm cả các bài viết đã bị người dùng xóa — để huấn luyện mô hình AI. Reddit yêu cầu bồi thường thiệt hại và lệnh cấm Anthropic tiếp tục sử dụng dữ liệu của họ.
Anthropic — công ty nhận được đầu tư từ Amazon và Google — đã phủ nhận các cáo buộc và tuyên bố sẽ tích cực tự bảo vệ trước tòa. Công ty khẳng định rằng quá trình huấn luyện mô hình của họ tuân thủ pháp luật và họ luôn tôn trọng chính sách sử dụng dữ liệu. Tuy nhiên, vụ kiện một lần nữa làm dấy lên tranh luận về quyền sở hữu nội dung trên mạng và việc sử dụng nội dung đó trong phát triển AI.
Vụ kiện cũng cho thấy sự mâu thuẫn trong vai trò của Reddit: vừa là nền tảng mở cho cộng đồng chia sẻ thông tin, vừa là người kiểm soát và khai thác dữ liệu thương mại. Một số nhà phê bình cho rằng Reddit đã từ lâu hưởng lợi từ nội dung cộng đồng mà không đền bù xứng đáng cho người dùng, khiến lập trường của họ trong vụ kiện trở nên gây tranh cãi.
Kết quả của vụ kiện này có thể tạo tiền lệ quan trọng. Nếu Reddit thắng kiện, các nền tảng nội dung sẽ có thêm quyền kiểm soát dữ liệu của họ. Ngược lại, nếu Anthropic thắng, điều đó có thể củng cố lập luận rằng nội dung công khai trên mạng vẫn là "miễn phí" để AI sử dụng cho huấn luyện.
Nguồn: AP News, The Wall Street Journal, Investopedia, Business Insider, The Verge