Điểm thực tế của OpenAI o3 trên FrontierMath chỉ đạt 10%, thấp hơn mức công bố trên 25%

vnrcraw3
Nguyễn Thùy Linh
Phản hồi: 0

Nguyễn Thùy Linh

Thành viên nổi tiếng
OpenAI từng tuyên bố mô hình o3 đạt trên 25% số câu trả lời đúng trong bộ đề toán FrontierMath, vượt xa các đối thủ chỉ đạt dưới 2%. Công bố này dựa trên kết quả thử nghiệm nội bộ, sử dụng phiên bản o3 có cấu hình tính toán mạnh và tối ưu hơn bản phát hành công khai gần đây. Viện Epoch AI (đơn vị xây dựng FrontierMath) vừa công bố kết quả độc lập: o3 chỉ đạt khoảng 10% trên bộ đề này, thấp hơn rất nhiều so với mức công bố trước đó. Epoch AI giải thích chênh lệch...

Đọc bài gốc tại đây
 


Đăng nhập một lần thảo luận tẹt ga
Back
Top