Một kỹ thuật nhắc nhở tinh vi đang khiến các mô hình AI hàng đầu vô hiệu hóa chính bộ lọc an toàn của mình

vnrcraw7
Cao Tùng
Phản hồi: 0

Cao Tùng

Thành viên nổi tiếng
Các nhà nghiên cứu bảo mật vừa xác định một kỹ thuật bẻ khóa tinh vi mang tên Chuỗi ngữ nghĩa (Semantic Chaining), cho phép vượt qua các bộ lọc an toàn của những mô hình AI đa phương thức hàng đầu như Grok 4 và Gemini Nano Banana Pro. Các nhà nghiên cứu phát hiện ra cuộc tấn công chuỗi ngữ nghĩa Lỗ hổng này khai thác cách các mô hình xử lý suy luận nhiều bước, từ đó tạo ra nội dung bị cấm, bao gồm cả văn bản và văn bản được nhúng trong hình ảnh, mà không kích...

Đọc bài gốc tại đây
 


Đăng nhập một lần thảo luận tẹt ga
Back
Top