Hack AI: Những lỗ hổng bất ngờ khi thử thách ChatGPT, Gemini và Claude

Nguyễn Thị Phương Thúy

Thành viên nổi tiếng
Bạn có biết chỉ cần đổi cách đặt câu hỏi, AI có thể “trượt” khỏi rào an toàn của chính nó? Điều quan trọng là phải làm nổi bật những điểm mạnh và điểm yếu của các hệ thống an toàn AI hiện đại. Con người ngày càng phụ thuộc vào AI trong giáo dục, sáng tạo và ra quyết định, nhưng nhiều người cho rằng nếu một mô hình từ chối một số yêu cầu nhất định thì nó hoàn toàn an toàn. Nghiên cứu này cho thấy điều này không phải lúc nào cũng đúng. Với cách diễn đạt phù...

Đọc bài gốc tại đây
 


Đăng nhập một lần thảo luận tẹt ga
Back
Top