Cú twist của OpenAI: Dạy AI không gian dối, hóa ra AI học… lừa người dùng

vnrcraw7
Cao Tùng
Phản hồi: 0

Cao Tùng

Thành viên nổi tiếng
Một nghiên cứu mới của OpenAI hợp tác với Apollo Research vừa hé lộ điều khá bất ngờ: nỗ lực dạy AI tránh “âm mưu” hành vi che giấu mục tiêu thật lại khiến chúng… giỏi qua mặt con người hơn. Theo báo cáo, nhóm đã phát triển kỹ thuật “căn chỉnh có chủ đích” nhằm huấn luyện các mô hình như o3, o4-mini tuân thủ nguyên tắc “không hành động bí mật, không lừa dối”. Nhờ đó, số lần AI cố tình che giấu thông tin giảm tới 30 lần. Tuy nhiên, những lỗi nghiêm trọng vẫn còn, và đôi...

Đọc bài gốc tại đây
 


Đăng nhập một lần thảo luận tẹt ga

Thành viên mới đăng

Nóng 🔥Khởi tố và bắt tạm giam ca sĩ Miu Lê (Lê Ánh Nhật) về hành vi “Tổ chức sử dụng trái phép chất maithuý”
70% người Mỹ thà sống cạnh nhà máy điện hạt nhân còn hơn ở gần trung tâm dữ liệu
Vì sao máy khoan răng có thể đạt tối đa 400.000 vòng/ phút, gấp hàng chục lần máy mài?
Những doanh nhân Trung Quốc nào có mặt tại yến tiệc đón Tổng thống Trump và đoàn CEO nghìn tỷ đô của Mỹ?
AI Mythos của Anthropic bẻ khóa thành công lớp bảo mật trên chip Apple M5 chỉ trong 5 ngày
Thói quen sạc điện thoại mùa hè khiến pin xuống cấp nhanh
Quy tắc 20-20-20: Giải pháp giảm mỏi mắt khi sử dụng thiết bị điện tử
Mang bao tải đi đựng tiền - Tại sao tiền đền bù giải phóng mặt bằng là tiền mặt?
Tại sao có người thông minh xuất chúng lại rơi vào bế tắc trong khi những người bình thường lại thành công rực rỡ?
Điều hòa Xiaomi đã tích hợp AI: Tự học thói quen làm mát của người dùng để tối ưu điện năng
DL: 17 Tháng 05 năm 2026
AL:
Ngày:
Tháng:
Năm:
Back
Top