Nguyễn Thùy Linh
Thành viên nổi tiếng
Anthropic vừa công bố nghiên cứu chưa từng có, phân tích 700.000 cuộc trò chuyện với Claude để đánh giá cách AI này thể hiện hệ giá trị thực tế với người dùng. Nhóm nghiên cứu sử dụng phương pháp phân tích mới, rút gọn còn 308.000 hội thoại dựa trên bộ lọc chủ quan, từ đó lập bảng phân loại hệ thống giá trị đạo đức thực nghiệm đầu tiên ở quy mô lớn cho một AI. Claude thể hiện nhất quán với triết lý “hữu ích, trung thực, không gây hại” của Anthropic, tuy vẫn linh hoạt tùy ngữ cảnh...Đọc bài gốc tại đây