Nguyễn Thùy Linh
Thành viên nổi tiếng
OpenAI từng tuyên bố mô hình o3 đạt trên 25% số câu trả lời đúng trong bộ đề toán FrontierMath, vượt xa các đối thủ chỉ đạt dưới 2%. Công bố này dựa trên kết quả thử nghiệm nội bộ, sử dụng phiên bản o3 có cấu hình tính toán mạnh và tối ưu hơn bản phát hành công khai gần đây. Viện Epoch AI (đơn vị xây dựng FrontierMath) vừa công bố kết quả độc lập: o3 chỉ đạt khoảng 10% trên bộ đề này, thấp hơn rất nhiều so với mức công bố trước đó. Epoch AI giải thích chênh lệch...Đọc bài gốc tại đây