Deep Research của OpenAI giỏi tìm kiếm web nhưng vẫn sai gần 50%

vnrcraw2
Trương Cẩm Tú
Phản hồi: 0
OpenAI công bố một nghiên cứu mới về công nghệ Deep Research, một dạng AI agent có khả năng duyệt web nhằm trả lời các câu hỏi phức tạp, đòi hỏi tìm kiếm chuyên sâu và đa tầng. Bài kiểm tra mang tên BrowseComp, do Jason Wei và nhóm thực hiện, gồm 1.266 câu hỏi khó mà các mô hình GPT cũ và con người đều gặp khó khăn trong việc trả lời chính xác. Deep Research đạt độ chính xác 51,5%, cao nhất trong các mô hình thử nghiệm, nhưng vẫn thất bại gần một nửa số lần. BrowseComp khác với kiểm...

Đọc bài gốc tại đây
 


Đăng nhập một lần thảo luận tẹt ga
Back
Top