xAI có nói dối về các điểm chuẩn của Grok 3 không?