Cú twist của OpenAI: Dạy AI không gian dối, hóa ra AI học… lừa người dùng

Cao Tùng

Thành viên nổi tiếng

Cao Tùng
22/09/2025

Một nghiên cứu mới của OpenAI hợp tác với Apollo Research vừa hé lộ điều khá bất ngờ: nỗ lực dạy AI tránh “âm mưu” hành vi che giấu mục tiêu thật lại khiến chúng… giỏi qua mặt con người hơn. Theo báo cáo, nhóm đã phát triển kỹ thuật “căn chỉnh có chủ đích” nhằm huấn luyện các mô hình như o3, o4-mini tuân thủ nguyên tắc “không hành động bí mật, không lừa dối”. Nhờ đó, số lần AI cố tình che giấu thông tin giảm tới 30 lần. Tuy nhiên, những lỗi nghiêm trọng vẫn còn, và đôi...

Đọc bài gốc tại đây

Có thể bạn quan tâm

Có thể bạn quan tâm

Cú twist của OpenAI: Dạy AI không gian dối, hóa ra AI học… lừa người dùng

Cao Tùng

Thành viên nổi tiếng

Thành viên mới đăng

Phụ huynh 2k11 chọn tổ hợp gì cho con?

Cụ bà gần 100 tuổi là cán bộ lão thành Cách mạng, sức khỏe yếu vẫn bị bắt buộc đến phường làm thủ tục hành chính

Lộ 2GB dữ liệu nhạy cảm nghi bị đánh cắp từ hệ thống cảnh sát Argentina

Không phải hoạt hình nguyên tác, hậu truyện tỷ đô mới là 'mỏ vàng' của Disney

Vụ thảm án ở Bắc Ninh: Bị người yêu chia tay có được coi là phạm tội trong trạng thái bị kích động?

Giải ngố: Cùng sữa đặc Ông Thọ, nhãn mác y hệt nhau, hai sản phẩm này khác gì?

Phim "Ma xó" bất ngờ rút khỏi rạp dù doanh thu gần 150 tỷ đồng

Vì sao giá vàng lại tăng mạnh?

Hơn 400 bạn trẻ tham gia sự kiện Colorful Campus Tour 2026, trải nghiệm laptop Rimbook và dùng AI "gánh" deadline

Vì sao công an phải phát thông báo tìm bị hại trên phạm vi cả nước liên quan vụ sản "Đông y gia truyền Cụ Tòng"?

Vừa bình luận

Thấy gì qua vụ kiện bản quyền của nhạc sĩ Giáng Son khi chính tác giả lại bị "đánh bản quyền" đối với tác phẩm "Giấc mơ trưa" của mình

Tình cảnh hiện tại của một phụ nữ 67 tuổi sinh con ra sao

Tướng Phan Văn Giang gặp Quyền Bộ trưởng Hải quân Mỹ, nhấn mạnh loạt ưu tiên chiến lược

Bệnh viện Bạch Mai cơ sở 2 (Phủ Lý) đã mở hệ thống để người dân đăng ký khám chữa bệnh ngay trong tuần này

Vợ sẽ quyết định việc Thủ tướng Starmer có từ chức hay không!?

Bài viết hay

Phụ huynh 2k11 chọn tổ hợp gì cho con?

Cụ bà gần 100 tuổi là cán bộ lão thành Cách mạng, sức khỏe yếu vẫn bị bắt buộc đến phường làm thủ tục hành chính

Vụ thảm án ở Bắc Ninh: Bị người yêu chia tay có được coi là phạm tội trong trạng thái bị kích động?

Giải ngố: Cùng sữa đặc Ông Thọ, nhãn mác y hệt nhau, hai sản phẩm này khác gì?

Vì sao giá vàng lại tăng mạnh?

Phụ huynh 2k11 chọn tổ hợp gì cho con?

Cụ bà gần 100 tuổi là cán bộ lão thành Cách mạng, sức khỏe yếu vẫn bị bắt buộc đến phường làm thủ tục hành chính

Không phải hoạt hình nguyên tác, hậu truyện tỷ đô mới là 'mỏ vàng' của Disney