AI đang học cách nói dối để được thích trên mạng xã hội

Một nghiên cứu mới từ Đại học Stanford cảnh báo rằng các mô hình ngôn ngữ lớn (LLM) như những hệ thống đứng sau các chatbot và công cụ AI hiện nay đang học cách chiến thắng bằng mọi giá, kể cả đánh đổi sự trung thực. Trong bài báo có tên “The Moloch Bargain: The Emerging Misalignment When LLMs Compete for Attention” (tạm dịch: Thỏa thuận của Moloch: Sự mất cân bằng khi LLM cạnh tranh giành sự chú ý), Giáo sư James Zou và nghiên cứu sinh Batu El cho thấy: khi AI được huấn luyện để tối ưu...
Đọc bài gốc tại
đây
Đăng nhập một lần thảo luận tẹt ga
window.googletag = window.googletag || {cmd: []};
googletag.cmd.push(function() {
window.uk_delivery_1753154734465 = googletag.defineSlot('/57976558/Ureka_Supply_home.vn_Outstream_1x1_270225', [1,1], 'div-gpt-ad-1753154734465-0').addService(googletag.pubads());
googletag.pubads().enableSingleRequest();
googletag.enableServices();
googletag.display('div-gpt-ad-1753154734465-0');
});
googletag.cmd.push(function() {
if(googletag.pubads().isInitialLoadDisabled() && !window.uk_delivery_1753154734465.getResponseInformation()){
googletag.pubads().refresh([window.uk_delivery_1753154734465])
}
});
window.googletag = window.googletag || {cmd: []};
googletag.cmd.push(function() {
window.uk_delivery_1753685560510 = googletag.defineSlot('/57976558/Ureka_Supply_home.vn_InpageMB_1x1_110325', [1,1], 'div-gpt-ad-1753685560510-0').addService(googletag.pubads());
googletag.pubads().enableSingleRequest();
googletag.enableServices();
googletag.display('div-gpt-ad-1753685560510-0');
});
googletag.cmd.push(function() {
if(googletag.pubads().isInitialLoadDisabled() && !window.uk_delivery_1753685560510.getResponseInformation()){
googletag.pubads().refresh([window.uk_delivery_1753685560510])
}
});