Kinh thật! Một câu lệnh đơn giản có thể đánh sập mọi hệ thống AI an toàn, bạn đã biết cách phòng thủ?

vnrcraw5 · 25/04/2025

Nhóm nghiên cứu HiddenLayer phát hiện một kỹ thuật nhắc nhở mới mang tên “Policy Puppetry” có thể vượt qua mọi rào cản an toàn của các mô hình AI lớn, bất kể nhà cung cấp, kiến trúc hay quy trình huấn luyện. Kỹ thuật này sử dụng nhắc cấu trúc tương tự như hệ thống cấu hình (XML, JSON), kết hợp mã hóa leetspeak và script đóng vai hư cấu hình, khiến AI hiểu nhầm các hợp lệ lệnh nguy hiểm nguy hiểm. Lời nhắc này đã thử nghiệm thành công trên ChatGPT (từ o1 đến 4o), Google Gemini, Anthropic Claude,...

Đọc bài gốc tại đây

thanhsonhoangtuan1994 · 25/04/2025

thật là nguy hiểm

Có thể bạn quan tâm

Có thể bạn quan tâm

Kinh thật! Một câu lệnh đơn giản có thể đánh sập mọi hệ thống AI an toàn, bạn đã biết cách phòng thủ?

Hue Hoang

Thành viên nổi tiếng

Son Luong Thanh

Thành viên nổi tiếng

Thành viên mới đăng

“Nhà cao cửa rộng nhưng toàn tôi ở” - lời chia sẻ gây sốt của bác giúp việc

Con trượt cả 3 nguyện vọng lớp 10, phản ứng “không giống ai” của bố và bà nội gây chú ý

Dừng thi công tượng 'NỮ THẦN KHAI PHÓNG ' sau phản ứng của dư luận

Pin dự phòng Belkin 10.000mAh: Màn hình hiển thị, sạc 25W Qi2 cho iPhone và Pixel

Dongfeng-61 và tham vọng hiện đại hóa lực lượng tên lửa đạn đạo liên lục địa của Trung Quốc

Trung Quốc hoàn thành hồ chứa Hồng Nham Sơn giữa sa mạc sau nhiều năm, vì sao Mỹ từng phản đối quyết liệt dự án này?

Tiện ích chặn quảng cáo trên Chrome với hơn 10 triệu lượt cài đặt tiềm ẩn nguy cơ chèn mã độc

AI biến nghệ thuật thiết kế chip RFIC thành khoa học đột phá

Giá GTA 6 chính thức lộ diện: Cao hơn mọi dự đoán, mở đặt trước 25/6

Vụ nổ súng gây rúng động ở Lào Cai: 1 người tử vong tại chỗ, nghi phạm tự gây thương tích sau khi rời hiện trường

Vừa bình luận

Nhạc sĩ Giáng Son thắng kiện BH Media sau 5 năm theo đuổi vụ bản quyền "Giấc mơ trưa"

Chuyến tàu đặc biệt chở hơn 500 bác sĩ đi làm mỗi ngày đã khởi động!

Du côn đường phố cần bị trừng phạt như thế nào qua vụ chém liên tiếp vào kính nhiều ô tô đỗ ven đường?

Vì sao con vừa đỗ lớp 10, đừng vội cho con học mọi thứ mà cần có một lộ trình?

Chuyện về huyền thoại La Văn Cầu – người duy nhất được đặt tên đường khi còn sống

Bài viết hay

“Nhà cao cửa rộng nhưng toàn tôi ở” - lời chia sẻ gây sốt của bác giúp việc

Con trượt cả 3 nguyện vọng lớp 10, phản ứng “không giống ai” của bố và bà nội gây chú ý

Nổ súng giữa trưa ở Lào Cai: Một người chết, nghi phạm tự bắn vào đầu

Dừng thi công tượng 'NỮ THẦN KHAI PHÓNG ' sau phản ứng của dư luận

Vụ nổ súng gây rúng động ở Lào Cai: 1 người tử vong tại chỗ, nghi phạm tự gây thương tích sau khi rời hiện trường

“Nhà cao cửa rộng nhưng toàn tôi ở” - lời chia sẻ gây sốt của bác giúp việc

Con trượt cả 3 nguyện vọng lớp 10, phản ứng “không giống ai” của bố và bà nội gây chú ý

Nổ súng giữa trưa ở Lào Cai: Một người chết, nghi phạm tự bắn vào đầu