35 kỹ thuật “jailbreak” AI chatbot, phân tích động lực và chiến lược của các LLM red teamers

Hue Hoang

Thành viên nổi tiếng

Hue Hoang
24/04/2025

Nghiên cứu đăng trên PLOS One đã phỏng vấn 28 người tham gia “LLM red teaming” – quá trình thử thách giới hạn AI tạo sinh như ChatGPT bằng cách cố tình khiến AI trả lời ngoài dự kiến hoặc vượt rào bảo mật. Red teamer đến từ nhiều ngành nghề: kỹ sư phần mềm, nhà nghiên cứu, nghệ sĩ, thậm chí nông dân trồng cần sa; nhiều người làm trong lĩnh vực AI, bảo mật, số còn lại là người tò mò hoặc sáng tạo. Động lực chính không phải ác ý mà là tò mò trí tuệ, thử nghiệm sáng...

Đọc bài gốc tại đây

Có thể bạn quan tâm

Có thể bạn quan tâm

35 kỹ thuật “jailbreak” AI chatbot, phân tích động lực và chiến lược của các LLM red teamers

Hue Hoang

Thành viên nổi tiếng

Thành viên mới đăng

Vì sao Trung Quốc gom mạnh bạc, toàn cầu lo thiếu hụt nguyên liệu?

Quá khủng khiếp: Thiếu nữ đẻ trong nhà vệ sinh của người khác, bỏ con sau bồn cầu

Điều đáng sợ nhất về hantavirus không chỉ là tỷ lệ tử vong lên tới 50%

Tên lửa YJ-15 của Trung Quốc xuất hiện ở Trung Đông, và một tàu chiến Mỹ 3.200 tấn bị mắc kẹt ở eo biển Hormuz, hoàn toàn không thể phản công.

Liệu ông Zelensky có ra lệnh tấn công Nga trong cuộc duyệt binh tại Quảng trường Đỏ Moscow sắp tới không?

Toàn bộ cửa hàng xăng dầu PVOIL trên cả nước sẽ lắp tủ đổi pin xe máy điện

Vinmec Times City trở thành “bệnh viện hạt nhân” Dược lâm sàng

Iran tuyên bố tấn công 3 tàu khu trục Mỹ ở eo biển Hormuz khiến hạm đội phải tháo chạy

Sắp đấu giá trực tuyến 2 túi Hermes của bà Trương Mỹ Lan, người tham gia phải đặt trước 20% giá khởi điểm

Oppo ra mắt tai nghe siêu nhẹ và tai nghe khử ồn pin 54 giờ ở Việt Nam

Vừa bình luận

Quá khủng khiếp: Thiếu nữ đẻ trong nhà vệ sinh của người khác, bỏ con sau bồn cầu

Iran tuyên bố tấn công 3 tàu khu trục Mỹ ở eo biển Hormuz khiến hạm đội phải tháo chạy

Quy định dùng để buộc tội cựu hiệu trưởng 'thu sai tiền dạy thêm' bị xác định trái luật

Putin lại sắp thăm Trung Quốc

Một buổi sáng Hà Nội của Hoàng gia Thụy Điển

Bài viết hay

Vì sao Trung Quốc gom mạnh bạc, toàn cầu lo thiếu hụt nguyên liệu?

Quá khủng khiếp: Thiếu nữ đẻ trong nhà vệ sinh của người khác, bỏ con sau bồn cầu

Chuyên gia dự báo vàng và bạc sắp quay lại đỉnh lịch sử

Không uống rượu vẫn bị gan nhiễm mỡ nặng, bác sĩ chỉ ra thủ phạm nhiều người mắc mỗi ngày

Vinmec Times City trở thành “bệnh viện hạt nhân” Dược lâm sàng

Vì sao Trung Quốc gom mạnh bạc, toàn cầu lo thiếu hụt nguyên liệu?

Quá khủng khiếp: Thiếu nữ đẻ trong nhà vệ sinh của người khác, bỏ con sau bồn cầu

Tên lửa YJ-15 của Trung Quốc xuất hiện ở Trung Đông, và một tàu chiến Mỹ 3.200 tấn bị mắc kẹt ở eo biển Hormuz, hoàn toàn không thể phản công.