Công cụ pháp y 'hồi sinh' 'trí não' của AI gặp lỗi để hiểu điều đã xảy ra

Ai Psychiatry giúp kiểm tra nguyên nhân sự cố AI bằng cách tái tạo mô hình nghi phạm.

: Công cụ pháp y AI Psychiatry có thể phục hồi và kiểm tra các mô hình AI gặp lỗi. Phương pháp này sử dụng các thuật toán pháp y để cô lập và tái tạo dữ liệu quyết định của hệ thống AI. Nhóm nghiên cứu tại Georgia Institute of Technology đã thử nghiệm thành công trên 30 mô hình AI, tái tạo các mô hình bị 'backdoored' để đưa ra kết quả sai. Công cụ này mở ra tiềm năng lớn cho các cuộc kiểm tra và thử nghiệm các hệ thống AI trong môi trường an toàn.

Với sự phát triển nhanh chóng của hệ thống AI trong đời sống hàng ngày, từ việc giao thuốc bằng drone đến trợ lý kỹ thuật số thực hiện các công việc hằng ngày, thách thức mới xuất hiện khi các hệ thống AI gặp lỗi hoặc trở thành mục tiêu của tin tặc. Công cụ AI Psychiatry, phát triển bởi nhóm nghiên cứu của Georgia Institute of Technology, hỗ trợ điều tra các nguyên nhân dẫn đến sự cố này bằng cách 'hồi sinh' các mô hình AI nghi phạm để kiểm tra trong môi trường kiểm soát.

Công cụ này sử dụng một chuỗi các thuật toán pháp y nhằm cô lập dữ liệu đằng sau quyết định của hệ thống AI. Qua việc này, dữ liệu được tái tạo thành một mô hình hoạt động giống với bản gốc, giúp các nhà điều tra có thể đưa vào kiểm tra với các đầu vào độc hại để xác định xem có tồn tại hành vi có hại hoặc ẩn chứa không. Điều này đặc biệt cần thiết khi không thể dễ dàng truy cập dữ liệu nội bộ của AI sau khi gặp sự cố.

Các nhà nghiên cứu đang cải thiện tính minh bạch của AI, nhưng cho đến khi điều đó đạt được, vẫn cần các công cụ điều tra để hiểu các lỗi của AI.

Từ kết quả thử nghiệm, AI Psychiatry đã giúp phục hồi và kiểm tra thành công cả những mô hình bị 'backdoored', một loại gặp lỗi thường do tin tặc khai thác lỗ hổng trong mã nguồn. Điều này cho phép các nhà điều tra không chỉ tìm ra nguyên nhân và xác nhận có tồn tại lỗ hổng hay không, mà còn có thể loại trừ các yếu tố nhân tạo để tập trung vào các nguyên nhân khác như lỗi phần cứng.

AI Psychiatry mang lại một phương thức pháp y độc lập, cho phép các chuyên gia điều tra không cần kiến thức trước về kiến trúc chính xác của mô hình AI. Công cụ này đang được phát triển như một dự án mã nguồn mở, giúp các nhà điều tra, nhà kiểm toán có thể áp dụng phương pháp pháp y nhất quán cho các AI khác nhau trong các bối cảnh khác nhau.

Vai trò của AI Psychiatry dự kiến sẽ ngày càng lớn trong tương lai, khi các hệ thống AI ngày càng được tích hợp sâu vào các quy trình của các cơ quan chính phủ và yêu cầu giám sát kiểm toán AI trở thành tiêu chuẩn phổ biến. Công cụ này sẽ tạo ra giá trị lớn cho cả người tạo ra lẫn những người bị ảnh hưởng bởi các nhiệm vụ mà AI thực hiện.

Nguồn: Gizmodo, The Conversation