API mở của Bluesky đồng nghĩa rằng bất kỳ ai cũng có thể trích xuất dữ liệu của bạn để huấn luyện AI

API mở của Bluesky cho phép bên thứ ba trích xuất dữ liệu công khai để huấn luyện AI.

: Bluesky không trực tiếp huấn luyện hệ thống AI từ nội dung người dùng, nhưng các bên thứ ba có thể làm điều này qua API Firehose. Máy tính thư viện máy học tại Hugging Face đã trích xuất 1 triệu bài đăng công khai từ Bluesky để nghiên cứu. Mặc dù dữ liệu đã được gỡ bỏ do tranh cãi, điều này nhắc nhở rằng nội dung công khai trên Bluesky là công khai. Bluesky đang tìm cách cho người dùng thể hiện sự đồng ý, nhưng không thể thực thi ngoài hệ thống của mình.

API mở của Bluesky có nghĩa rằng các bên thứ ba có thể trích xuất dữ liệu công khai từ nền tảng để phục vụ cho mục tiêu huấn luyện AI. Việc này gây ra lo ngại về quyền bảo mật và công khai của dữ liệu mà người dùng chia sẻ trên Bluesky.

Một thư viện máy học từ công ty AI Hugging Face đã sử dụng API Firehose của Bluesky để thu thập 1 triệu bài đăng công khai cho mục đích nghiên cứu học máy. Dù dữ liệu này sau đó đã được gỡ bỏ do tranh cãi, tình huống này nhấn mạnh rằng mọi bài đăng công khai có thể được truy cập bởi bất cứ ai.

Bluesky hiện đang xem xét cách để cho phép người dùng thể hiện sự đồng ý chia sẻ dữ liệu ra bên ngoài. Hãng cũng thừa nhận rằng sẽ khó thực thi sự đồng ý này khi dữ liệu đã ra ngoài hệ thống và đang tìm các giải pháp từ kỹ sư và luật sư.