Vụ kiện vi phạm bản quyền chống lại Meta có thể tạo tiền lệ cho việc tải về trái phép các tác phẩm có bản quyền trong huấn luyện trí tuệ nhân tạo

Vụ kiện Meta sử dụng dữ liệu vi phạm bản quyền để huấn luyện AI gây tranh cãi lớn về luật bản quyền.

: Một nhóm tác giả đã kiện Meta ở California vào tháng 1 năm 2024 vì sử dụng trái phép tác phẩm của họ để huấn luyện mô hình Llama. Meta thừa nhận dùng dữ liệu Book3 chứa 195,000 sách có bản quyền, khẳng định việc này nằm trong qui định 'Fair Use'. Tài liệu cho thấy Meta đã sử dụng torrent để tải hàng terabyte sách có bản quyền, vượt ra ngoài quy mô của Book3. Dù vụ việc có vẻ rõ ràng, thẩm phán Vince Chhabria không rành về torrent, có thể cần thêm chuyên gia tư vấn trước khi đưa ra phán quyết.

Một vụ kiện đáng chú ý đang diễn ra tại California khi một nhóm tác giả tố cáo Meta (công ty mẹ của Facebook) đã sử dụng sách có bản quyền của họ để huấn luyện trí tuệ nhân tạo, cụ thể là mô hình ngôn ngữ Llama. Vụ kiện được đệ trình vào tháng 1 năm 2024 và nhắm đến việc Meta sử dụng dữ liệu từ Book3, một tập dữ liệu gồm 195,000 sách có bản quyền, để xác minh rằng việc này vi phạm luật sở hữu trí tuệ.

Theo các tài liệu chưa niêm phong được tiết lộ vào đầu năm nay, Meta đã sử dụng phương thức torrent để tải lượng lớn dữ liệu này, điều này thể hiện sự nỗ lực có chủ ý để vi phạm bản quyền qua hành vi tải tài liệu từ các nguồn không hợp pháp. Bằng cách sử dụng torrent, Meta có thể tải xuống nhanh chóng hơn và vượt qua các hạn chế sẵn có khi tải từng cuốn sách một.

Các nguyên đơn nhấn mạnh rằng không có lý do pháp lý nào biện minh cho việc sử dụng tài liệu có bản quyền trong AI là hợp lý, ngay cả khi Meta viện dẫn chính sách 'Sử dụng Hợp lý'. Họ tuyên bố rõ ràng rằng hành vi này đã vượt quá giới hạn và tỏ ra lo ngại về khả năng này có thể tạo ra một tiền lệ nguy hiểm cho việc vi phạm bản quyền trong phát triển AI.

Tuy vậy, thẩm phán Vince Chhabria, người đang xử lý vụ kiện, thừa nhận rằng ông không quen thuộc với các khái niệm trong công nghệ torrent như leeching hay seeding, điều này khiến cho việc ra phán quyết có thể sẽ kéo dài hơn dự kiến. Khả năng ông sẽ triệu tập các chuyên gia để giải thích sâu về các thuật ngữ và quy trình cần thiết trước khi đưa ra quyết định cuối cùng.

Vụ kiện này đang tạo ra một cuộc tranh luận lớn lao trong cộng đồng công nghệ và pháp lý. Kết quả của vụ này có khả năng mở cửa cho các vụ kiện tương tự trong tương lai nếu Meta thua kiện, hoặc sẽ tạo ra một cơ sở pháp lý cho phép các công ty công nghệ lớn sử dụng các dữ liệu có bản quyền mà không phải chịu trách nhiệm bồi thường cho chủ sở hữu.

Nguồn: Cal Jeffrey, Ars Technica, TechSpot