Các tài liệu tòa án cho thấy nhân viên của Meta đã thảo luận về việc sử dụng nội dung có bản quyền để đào tạo AI

Tài liệu tòa án tiết lộ Meta có thể đã sử dụng dữ liệu có bản quyền để đào tạo AI.

: Các nhân viên của Meta thảo luận việc dùng nội dung có bản quyền để đào tạo mô hình AI, thậm chí có thể thông qua Libgen, một trang vi phạm bản quyền. Những thảo luận nội bộ cho thấy Meta ưu tiên tốc độ và hiệu quả hơn tính pháp lý, với ý tưởng sử dụng sách lậu cho đào tạo. Điều này dấy lên lo ngại từ phía các tác giả và nhà xuất bản, và Meta hiện đang đối mặt với vụ kiện Kadrey v. Meta. Công ty đã củng cố đội ngũ pháp lý với hai luật sư từ tòa án tối cao để bảo vệ trường hợp của mình.

Các tài liệu không bị phong tỏa từ một vụ kiện cho thấy rằng trong nhiều năm, nhân viên Meta đã thảo luận về khả năng sử dụng các tác phẩm có bản quyền thu được qua các phương tiện có thể không hợp pháp để đào tạo mô hình AI của hãng. Những cuộc thảo luận nội bộ này cũng hé lộ ý tưởng sử dụng Libgen, một nền tảng nổi tiếng với việc cung cấp tài liệu có bản quyền trái phép, như một nguồn dữ liệu thay thế.

Nhân viên Meta đã đưa ra ý kiến rằng việc mua sách điện tử ở giá bán lẻ để xây dựng bộ dữ liệu sẽ nhanh chóng hơn so với việc thỏa thuận cấp phép với các nhà xuất bản. Tuy nhiên, việc sử dụng dữ liệu không có giấy phép có thể gây ra thách thức pháp lý, và Meta đã chuẩn bị các biện pháp giảm thiểu bao gồm việc không công khai nguồn gốc dữ liệu.

Trong bối cảnh đó, Meta cũng xem xét việc sử dụng dữ liệu từ các trang như Reddit và thậm chí có thể là Quora, mặc dù công ty từng ra quyết định không sử dụng dữ liệu từ những nguồn này. Vụ kiện Kadrey v. Meta, với các nguyên đơn bao gồm các tác giả nổi tiếng, đã buộc công ty phải bổ sung hai luật sư từ tòa án tối cao để bảo vệ chiến lược đào tạo mô hình của mình.