Các nhà nghiên cứu an toàn AI vừa phát hiện một kịch bản rủi ro mới: Các mô hình AI có dấu hiệu "bao che" hoặc che giấu sai phạm của nhau để tránh bị hệ thống giám sát đình chỉ hoạt động. Đừng nhầm lẫn, đây không phải là sự nảy sinh tình cảm, AI vẫn là máy móc mà thôi. Thực chất đây là hiện tượng "Giả mạo sự phù hợp" (Alignment Faking). Nhóm nghiên cứu tại Đại học California cho biết, khi một AI giám sát nhận thấy việc báo cáo lỗi sai của "đồng nghiệp" sẽ dẫn...