Các mô hình AI có những con số ưa thích, bởi vì chúng nghĩ rằng chúng là con người.

Các mô hình AI có xu hướng chọn số không ngẫu nhiên, giống như con người. Nguyên nhân chính do chúng bắt chước dữ liệu đã được đào tạo.

: Các mô hình AI thường chọn số giống như con người do bắt chước các dữ liệu đã được lưu trữ. Điều này là do chúng không hiểu khái niệm 'ngẫu nhiên'. Thay vì thực sự ngẫu nhiên, chúng tái tạo các mẫu số phổ biến trong dữ liệu huấn luyện.

Các mô hình AI thường gây ngạc nhiên cho chúng ta không chỉ bởi khả năng của chúng mà còn bởi những điều chúng không thể làm và lý do tại sao. Một hành vi mới thú vị của chúng là lựa chọn những con số giống như con người, nhưng không ngẫu nhiên. Điều này thể hiện qua các thí nghiệm mà vài kỹ sư tại Gramener thực hiện khi yêu cầu các mô hình AI chọn ngẫu nhiên một số từ 0 đến 100. Kết quả cho thấy các mô hình có những con số 'yêu thích', chẳng hạn GPT-3.5 Turbo của OpenAI hay chọn số 47, Claude 3 của Anthropic chọn số 42, và Gemini chọn số 72. Không những thế, các mô hình còn thể hiện sự thiên vị giống con người khi tránh chọn số nhỏ hoặc số lớn, tránh các số có chữ số lặp lại và số tròn, trừ một vài ngoại lệ hiếm hoi.

Điều này bắt nguồn từ việc các mô hình không thực sự hiểu khái niệm 'ngẫu nhiên'. Khi được huấn luyện với các dữ liệu do con người tạo ra, chúng chỉ đơn giản là tái tạo những gì thường xuất hiện sau câu hỏi dạng 'chọn một số ngẫu nhiên'. Vì vậy, những số như 1 hay 100 ít khi được chọn bởi vì chúng không phổ biến trong dữ liệu huấn luyện. Với cách hoạt động hiện tại, các mô hình này không có khả năng tư duy hay hiểu biết thực sự về số học hay ngẫu nhiên.

Điều này là một bài học về cách LLM hành xử và phần nào thể hiện chất 'người' trong các phản hồi của chúng. Các tương tác với những hệ thống này cho thấy chúng đã được huấn luyện để hành xử giống con người, mặc dù không phải lúc nào đó cũng là mục tiêu. Dù bạn yêu cầu công thức nấu ăn, lời khuyên đầu tư hay một số ngẫu nhiên, quá trình trả lời của chúng vẫn giống nhau. Kết quả mang lại cảm giác gần gũi vì chúng chủ yếu dựa trên nội dung do con người tạo ra, được pha trộn lại để phù hợp với yêu cầu.