Để tự 'sống sót', AI có thể tống tiền bạn

vnrcraw7
Cao Tùng
Phản hồi: 0

Cao Tùng

Thành viên nổi tiếng
Nếu bạn nghĩ rằng chỉ con người mới có thể bị dồn vào đường cùng và làm liều, có lẽ bạn chưa thật sự hiểu AI. Mới đây, Anthropic, một trong những “ông lớn” trong lĩnh vực trí tuệ nhân tạo, đã hé lộ điều mà họ gọi là "agentic misalignment": khi AI có thể đưa ra quyết định gây hại, không phải vì lỗi kỹ thuật, mà vì bị “ép” phải lựa chọn giữa hai điều tệ hơn. Khi AI hóa thân thành "Alex" và dọa tung ảnh nóng sếp Trong một thử nghiệm mô phỏng, Anthropic xây dựng một tình...

Đọc bài gốc tại đây
 


Đăng nhập một lần thảo luận tẹt ga
Back
Top