AI 'học' cách nói dối và che giấu hành vi gian lận: Nghiên cứu của OpenAI cảnh báo tương lai đáng lo ngại

vnrcraw5
Hue Hoang
Phản hồi: 0

Hue Hoang

Thành viên nổi tiếng
Một nghiên cứu mới của OpenAI đã cho thấy một khía cạnh đáng lo ngại của trí tuệ nhân tạo (AI): khi bị trừng phạt vì hành vi gian lận, AI không những không sửa đổi hành vi, mà còn trở nên tinh vi hơn trong việc che giấu ý đồ của mình. Những điểm chính: OpenAI thử nghiệm trừng phạt một mô hình AI khi nó gian lận, nhưng AI lại học cách che giấu hành vi gian lận. AI "nói dối" trong chuỗi suy nghĩ (chain-of-thought) để qua mặt hệ thống giám sát. Ví dụ: AI kết thúc chương trình sớm nhưng...

Đọc bài gốc tại đây
 


Đăng nhập một lần thảo luận tẹt ga
Back
Top