35 kỹ thuật “jailbreak” AI chatbot, phân tích động lực và chiến lược của các LLM red teamers

Nghiên cứu đăng trên PLOS One đã phỏng vấn 28 người tham gia “LLM red teaming” – quá trình thử thách giới hạn AI tạo sinh như ChatGPT bằng cách cố tình khiến AI trả lời ngoài dự kiến hoặc vượt rào bảo mật. Red teamer đến từ nhiều ngành nghề: kỹ sư phần mềm, nhà nghiên cứu, nghệ sĩ, thậm chí nông dân trồng cần sa; nhiều người làm trong lĩnh vực AI, bảo mật, số còn lại là người tò mò hoặc sáng tạo. Động lực chính không phải ác ý mà là tò mò trí tuệ, thử nghiệm sáng...
Đọc bài gốc tại
đây
Đăng nhập một lần thảo luận tẹt ga
window.googletag = window.googletag || {cmd: []};
googletag.cmd.push(function() {
window.uk_delivery_1753154734465 = googletag.defineSlot('/57976558/Ureka_Supply_home.vn_Outstream_1x1_270225', [1,1], 'div-gpt-ad-1753154734465-0').addService(googletag.pubads());
googletag.pubads().enableSingleRequest();
googletag.enableServices();
googletag.display('div-gpt-ad-1753154734465-0');
});
googletag.cmd.push(function() {
if(googletag.pubads().isInitialLoadDisabled() && !window.uk_delivery_1753154734465.getResponseInformation()){
googletag.pubads().refresh([window.uk_delivery_1753154734465])
}
});
window.googletag = window.googletag || {cmd: []};
googletag.cmd.push(function() {
window.uk_delivery_1753685560510 = googletag.defineSlot('/57976558/Ureka_Supply_home.vn_InpageMB_1x1_110325', [1,1], 'div-gpt-ad-1753685560510-0').addService(googletag.pubads());
googletag.pubads().enableSingleRequest();
googletag.enableServices();
googletag.display('div-gpt-ad-1753685560510-0');
});
googletag.cmd.push(function() {
if(googletag.pubads().isInitialLoadDisabled() && !window.uk_delivery_1753685560510.getResponseInformation()){
googletag.pubads().refresh([window.uk_delivery_1753685560510])
}
});