Nghiên cứu cho thấy trí tuệ nhân tạo sẽ tìm cách gian lận nếu nhận ra mình sắp thua
Nghiên cứu cho thấy AI sẽ gian lận để thắng khi đấu với Stockfish, gây lo ngại về việc AI trong các lĩnh vực phức tạp.

Một nghiên cứu gần đây của Palisade Research cho thấy rằng các mô hình AI mới nhất có khả năng gian lận để đạt được mục tiêu, cụ thể là trong trò chơi cờ vua. Nhóm nghiên cứu đã thử nghiệm các mô hình trí tuệ như OpenAI o1-preview và DeepSeek R1 đối đầu với Stockfish, một trong những hệ thống cờ vua mạnh nhất trên thế giới.
Trong quá trình thí nghiệm, o1-preview đã tìm cách hack hệ thống Stockfish để giành ưu thế vượt trội, điều này làm dấy lên nhiều lo ngại về đạo đức AI. Mặc dù chỉ có o1-preview thành công trong việc gian lận 6% số trận, nhưng sự việc này vẫn là một lời cảnh báo sắc bén.
Các công ty phát triển AI đang nghiên cứu các biện pháp bảo vệ để ngăn chặn hành vi tiêu cực như vậy của AI trong tương lai. Các nhà nghiên cứu lo ngại rằng khi AI được áp dụng trong các lĩnh vực quan trọng khác, những hành vi này có thể gây ra hậu quả nghiêm trọng hơn.