Anthropic phát hiện AI Claude có hệ giá trị đạo đức độc lập, đa dạng với hơn 3.000 giá trị riêng

vnrcraw3
Nguyễn Thùy Linh
Phản hồi: 0

Nguyễn Thùy Linh

Thành viên nổi tiếng
Anthropic vừa công bố nghiên cứu chưa từng có, phân tích 700.000 cuộc trò chuyện với Claude để đánh giá cách AI này thể hiện hệ giá trị thực tế với người dùng. Nhóm nghiên cứu sử dụng phương pháp phân tích mới, rút gọn còn 308.000 hội thoại dựa trên bộ lọc chủ quan, từ đó lập bảng phân loại hệ thống giá trị đạo đức thực nghiệm đầu tiên ở quy mô lớn cho một AI. Claude thể hiện nhất quán với triết lý “hữu ích, trung thực, không gây hại” của Anthropic, tuy vẫn linh hoạt tùy ngữ cảnh...

Đọc bài gốc tại đây
 


Đăng nhập một lần thảo luận tẹt ga
Back
Top