Anthropic đang tìm kiếm để tài trợ cho các chuẩn đánh giá AI thế hệ mới toàn diện hơn

Anthropic khởi động chương trình tài trợ phát triển các chuẩn đánh giá AI toàn diện mới, tập trung vào an toàn và tác động xã hội của mô hình AI.

: Anthropic vừa khởi động chương trình tài trợ phát triển các chuẩn đánh giá mới cho AI, đặc biệt là mô hình sinh như Claude. Chương trình nhắm vào việc đo lường khả năng và tác động xã hội của AI. Chương trình còn hỗ trợ nghiên cứu liên quan đến an ninh quốc gia và các nhiệm vụ phức tạp khác.

Anthropic khởi động chương trình tài trợ nhằm phát triển các chuẩn đánh giá mới cho AI, bao gồm cả mô hình sinh của chính họ là Claude. Chương trình sẽ cung cấp tài chính cho các tổ chức thứ ba để đo lường hiệu quả và tác động của các mô hình AI, đặc biệt nhắm vào khả năng như thực hiện tấn công mạng và cải thiện vũ khí hủy diệt hàng loạt.

Anthropic nhấn mạnh việc tạo ra các chuẩn đánh giá khó khăn nhưng cần thiết, tập trung vào an toàn AI và tác động xã hội qua các công cụ, hạ tầng và phương pháp mới. Công ty cũng xây dựng một hệ thống cảnh báo sớm để xác định và đánh giá rủi ro liên quan đến an ninh quốc gia.

Chương trình còn hỗ trợ nghiên cứu về các nhiệm vụ tổng thể như hỗ trợ nghiên cứu khoa học, giao tiếp đa ngôn ngữ, và tự kiểm duyệt độc tính. Các nền tảng mới sẽ cho phép các chuyên gia phát triển đánh giá riêng và thử nghiệm quy mô lớn với hàng ngàn người dùng, cùng sự hỗ trợ từ đội ngũ chuyên môn của Anthropic.