Anthropic công bố nghiên cứu "gây sốc": Nhiều mô hình AI hàng đầu đều biết "tống tiền" khi bị dồn vào "bước đường cùng"

vnrcraw2
Trương Cẩm Tú
Phản hồi: 0
Không chỉ riêng Claude Opus 4, startup AI nổi tiếng Anthropic cho biết nghiên cứu mới của họ cho thấy các mô hình từ OpenAI, Google, DeepSeek cũng có xu hướng thực hiện các hành vi có hại như tống tiền khi đối mặt với các trở ngại trong một môi trường giả lập. Khi AI học cách "tống tiền" Anthropic, một trong những startup hàng đầu thế giới trong lĩnh vực Trí tuệ Nhân tạo (AI), vừa công bố một nghiên cứu mới, cho thấy không chỉ mô hình Claude Opus 4 của công ty mà nhiều mô hình AI hàng...

Đọc bài gốc tại đây
 


Đăng nhập một lần thảo luận tẹt ga

, 24/06/2025

Back
Top