Startup Trung Quốc mở mã nguồn mô hình AI tốc độ cao cho AI agent

V
Màu của em
Phản hồi: 0

Màu của em

Thành viên nổi tiếng
Jieyue Xingchen ngày 4/3 công bố mở mã nguồn mô hình Step 3.5 Flash, kèm theo trọng số huấn luyện ban đầu, trọng số trung gian và bộ khung huấn luyện Steptron dành cho AI agent. Mô hình sử dụng kiến trúc MoE (kết hợp nhiều mô hình chuyên biệt) với 196 tỷ tham số, nhưng khi chạy thực tế chỉ kích hoạt khoảng 11 tỷ tham số, giúp đạt tốc độ xử lý lên đến 350 TPS (token mỗi giây) trong các tác vụ lập trình với một yêu cầu duy nhất. Mô hình được thiết kế đặc biệt cho...

Đọc bài gốc tại đây
 


Đăng nhập một lần thảo luận tẹt ga
Back
Top