Một kỹ thuật nhắc nhở tinh vi đang khiến các mô hình AI hàng đầu vô hiệu hóa chính bộ lọc an toàn của mình

Các nhà nghiên cứu bảo mật vừa xác định một kỹ thuật bẻ khóa tinh vi mang tên Chuỗi ngữ nghĩa (Semantic Chaining), cho phép vượt qua các bộ lọc an toàn của những mô hình AI đa phương thức hàng đầu như Grok 4 và Gemini Nano Banana Pro. Các nhà nghiên cứu phát hiện ra cuộc tấn công chuỗi ngữ nghĩa Lỗ hổng này khai thác cách các mô hình xử lý suy luận nhiều bước, từ đó tạo ra nội dung bị cấm, bao gồm cả văn bản và văn bản được nhúng trong hình ảnh, mà không kích...
Đọc bài gốc tại
đây
Đăng nhập một lần thảo luận tẹt ga
window.googletag = window.googletag || {cmd: []};
googletag.cmd.push(function() {
window.uk_delivery_1753154734465 = googletag.defineSlot('/57976558/Ureka_Supply_home.vn_Outstream_1x1_270225', [1,1], 'div-gpt-ad-1753154734465-0').addService(googletag.pubads());
googletag.pubads().enableSingleRequest();
googletag.enableServices();
googletag.display('div-gpt-ad-1753154734465-0');
});
googletag.cmd.push(function() {
if(googletag.pubads().isInitialLoadDisabled() && !window.uk_delivery_1753154734465.getResponseInformation()){
googletag.pubads().refresh([window.uk_delivery_1753154734465])
}
});
window.googletag = window.googletag || {cmd: []};
googletag.cmd.push(function() {
window.uk_delivery_1753685560510 = googletag.defineSlot('/57976558/Ureka_Supply_home.vn_InpageMB_1x1_110325', [1,1], 'div-gpt-ad-1753685560510-0').addService(googletag.pubads());
googletag.pubads().enableSingleRequest();
googletag.enableServices();
googletag.display('div-gpt-ad-1753685560510-0');
});
googletag.cmd.push(function() {
if(googletag.pubads().isInitialLoadDisabled() && !window.uk_delivery_1753685560510.getResponseInformation()){
googletag.pubads().refresh([window.uk_delivery_1753685560510])
}
});