Rò rỉ thông tin Anthropic phát triển một mô hình giỏi hack đến mức do dự phát hành

Một vụ rò rỉ dữ liệu vừa tiết lộ rằng Anthropic đang thử nghiệm một mô hình mới có tên “Claude Mythos”, được họ mô tả là “mô hình AI mạnh nhất mà chúng tôi từng phát triển”. Sự cố xảy ra khi các bài blog nháp và tài liệu nội bộ bị lưu trong một bộ nhớ đệm dữ liệu có thể truy cập công khai. Tạp chí Fortune cùng các nhà nghiên cứu an ninh mạng đã phát hiện gần 3.000 tài liệu chưa công bố trước khi Anthropic kịp khóa quyền truy cập. Mô hình mới này giới thiệu một...
Đọc bài gốc tại
đây
Đăng nhập một lần thảo luận tẹt ga
var adx_id_11792 = document.getElementById('bg-ssp-11792');
adx_id_11792.id = 'bg-ssp-11792-' + Math.floor(Math.random() * Date.now());
window.pubadxtag = window.pubadxtag || [];
window.pubadxtag.push({zoneid: 11792, id: adx_id_11792.id, wu: window.location.href})