Startup Trung Quốc mở mã nguồn mô hình AI tốc độ cao cho AI agent

V
Màu của em
Phản hồi: 0

Màu của em

Thành viên nổi tiếng
Jieyue Xingchen ngày 4/3 công bố mở mã nguồn mô hình Step 3.5 Flash, kèm theo trọng số huấn luyện ban đầu, trọng số trung gian và bộ khung huấn luyện Steptron dành cho AI agent. Mô hình sử dụng kiến trúc MoE (kết hợp nhiều mô hình chuyên biệt) với 196 tỷ tham số, nhưng khi chạy thực tế chỉ kích hoạt khoảng 11 tỷ tham số, giúp đạt tốc độ xử lý lên đến 350 TPS (token mỗi giây) trong các tác vụ lập trình với một yêu cầu duy nhất. Mô hình được thiết kế đặc biệt cho...

Đọc bài gốc tại đây
 


Đăng nhập một lần thảo luận tẹt ga

Thành viên mới đăng

Ngày mai là ngày đầu tiên của tháng Hai âm lịch. Hãy ăn thỏa thích bốn món này sẽ giúp bạn có một khởi đầu tốt đẹp
Ai quyết định hạn sử dụng thực phẩm? Thực phẩm đã quá hạn sử dụng một ngày có còn an toàn để ăn không?
Meta "thanh trừng" 159 triệu quảng cáo lừa đảo trên Facebook, Messenger, WhatsApp, tung "mẻ lưới" AI bảo vệ người dùng toàn cầu và Việt Nam
Du lịch đến những vùng cao và bị say độ cao, liệu bạn có trở nên phụ thuộc vào oxy bổ sung không?
Người dẫn chương trình dám hỏi: quay cảnh nóng có phản ứng sinh lý không, câu trả lời của Lưu Diệc Phi quá cao
Iran vừa công bố lô máy bay không người lái Shahed-136 mới từ kho vũ khí ngầm, với hàng ngàn chiếc được xếp hàng để kiểm tra!
Tại sao Iran bắn mãi không hết tên lửa? Mấu chốt  Iran đang nắm giữ hai con át chủ bài
Làm thế nào khám ở Bệnh viện Bạch Mai không phải xếp hàng từ nửa đêm?
Trung Quốc phát hiện chân gà bán trên mạng bị tẩy trắng bằng hóa chất công nghiệp độc hại!
Hàn Quốc được ưu tiên tiếp cận nguồn cung dầu thô của UAE và sẽ nhập khẩu thêm 18 triệu thùng dầu thô
Back
Top