Perplexity bị cáo buộc đã lấy dữ liệu từ các trang web chặn việc thu thập thông tin của AI

Cloudflare cáo buộc Perplexity vượt qua các quy tắc chặn thu thập thông tin của website.

: Công ty khởi nghiệp AI Perplexity bị cáo buộc thu thập dữ liệu từ các trang web mà họ không được phép, theo Cloudflare. Hành vi này bị phát hiện trên hàng chục nghìn miền và hàng triệu yêu cầu mỗi ngày. Jesse Dwyer từ Perplexity đã bác bỏ cáo buộc này và cho rằng bot được nhắc đến không thuộc về họ. Động thái từ Cloudflare như phản ứng với sự lo ngại từ các khách hàng của họ về hành vi này.

Perplexity, một startup trí tuệ nhân tạo, bị Cloudflare cáo buộc thu thập thông tin từ các trang web mà không có sự cho phép và thậm chí cố tình vượt qua các cản trở. Cloudflare, công ty cung cấp hạ tầng internet, cho biết đã phát hiện hành vi này thông qua hàng triệu yêu cầu từ các trang web và sử dụng trí tuệ nhân tạo cùng các tín hiệu mạng để xác định bot này. Jesse Dwyer, người phát ngôn của Perplexity, bác bỏ cáo buộc này, nói rằng bot mà Cloudflare nhắc đến không phải của họ.

Cloudflare cũng đã gỡ bỏ các bot của Perplexity khỏi danh sách đã xác minh và thêm các kỹ thuật mới để ngăn chặn chúng. Tháng trước, Cloudflare đã giới thiệu một thị trường cho phép các chủ sở hữu trang web tính phí các AI bot khi chúng đến thu thập thông tin từ trang của họ, trong lúc giám đốc điều hành Matthew Prince cho rằng AI đang phá vỡ mô hình kinh doanh của internet.

Tham số 'Robots.txt' là một phương tiện để các trang web hướng dẫn các công cụ tìm kiếm và các công ty AI biết trang nào có thể được lập chỉ mục và trang nào thì không, nhưng việc thực thi gặp nhiều khó khăn. Đặc biệt khi các công ty như Perplexity sử dụng các phương pháp biến đổi 'user agent' để che giấu danh tính của các bot.

Các trang web công khai khác cũng đã cáo buộc Perplexity về việc thu thập dữ liệu bất hợp pháp trước đây. Các tổ chức tin tức Wired từng cáo buộc công ty này đạo văn và lạm dụng nội dung từ các trang web khác mà không có sự chấp thuận.

Công ty Cloudflare không chỉ nhắm tới Perplexity; họ đang tăng cường các nỗ lực để thắt chặt kiểm soát AI trên toàn bộ mạng. Matthew Prince cũng nêu ra việc các công ty AI đang gây áp lực lớn đối với các hoạt động kinh doanh truyền thông thông qua hành vi thu thập thông tin không có giấy phép.

Nguồn: Cloudflare, TechCrunch, Wired, Reuters