Cách Echo Chamber thao túng AI, tạo ra các nội dung cực kỳ nguy hiểm

Một nhà nghiên cứu của Neural Trust đã phát hiện ra cách khai thác điểm yếu của các mô hình AI như GPT hay Gemini, thông qua kỹ thuật có tên "Echo Chamber" – tức là tạo ra một chuỗi lời nhắc dường như vô hại nhưng lại dẫn mô hình đến việc tạo ra nội dung nguy hiểm. Cách thức hoạt động của Echo Chamber Khác với những kiểu tấn công trực diện, kỹ thuật này không đưa ra yêu cầu rõ ràng mà dùng những lời nhắc ngầm, từng bước dẫn dắt mô hình tạo ra nội dung trái phép....
Đọc bài gốc tại
đây
Đăng nhập một lần thảo luận tẹt ga
window.googletag = window.googletag || {cmd: []};
googletag.cmd.push(function() {
window.uk_delivery_1753154734465 = googletag.defineSlot('/57976558/Ureka_Supply_home.vn_Outstream_1x1_270225', [1,1], 'div-gpt-ad-1753154734465-0').addService(googletag.pubads());
googletag.pubads().enableSingleRequest();
googletag.enableServices();
googletag.display('div-gpt-ad-1753154734465-0');
});
googletag.cmd.push(function() {
if(googletag.pubads().isInitialLoadDisabled() && !window.uk_delivery_1753154734465.getResponseInformation()){
googletag.pubads().refresh([window.uk_delivery_1753154734465])
}
});
window.googletag = window.googletag || {cmd: []};
googletag.cmd.push(function() {
window.uk_delivery_1753685560510 = googletag.defineSlot('/57976558/Ureka_Supply_home.vn_InpageMB_1x1_110325', [1,1], 'div-gpt-ad-1753685560510-0').addService(googletag.pubads());
googletag.pubads().enableSingleRequest();
googletag.enableServices();
googletag.display('div-gpt-ad-1753685560510-0');
});
googletag.cmd.push(function() {
if(googletag.pubads().isInitialLoadDisabled() && !window.uk_delivery_1753685560510.getResponseInformation()){
googletag.pubads().refresh([window.uk_delivery_1753685560510])
}
});