Qwen3 của Alibaba Cloud có thực sự vượt mặt GPT-4 và Gemini 2.5 Pro? Bí mật đằng sau mô hình AI nguồn mở đa ngôn ngữ với 235 tỷ tham số!

vnrcraw7
Cao Tùng
Phản hồi: 0

Cao Tùng

Thành viên nổi tiếng
Qwen3 là thế hệ mới nhất của nguồn mô hình ngôn ngữ lớn (LLM) mở từ Alibaba Cloud, phát hành ngày 29.04.2025, cung cấp Apache 2.0, phù hợp với thương mại. Có 8 phiên bản: từ 0,6B đến 32B tham số dày đặc và hai dạng MoE là Qwen3-235B (235 tỷ/22 tỷ tham số hoạt động cùng lúc), Qwen3-30B (30 tỷ/3 tỷ tham số hoạt động). Dung lượng tối đa bối cảnh lên tới 128.000 token. Kiến trúc Mixture-of-Experts (MoE) giúp hình hóa lớn nhưng tiết kiệm tài nguyên – ví dụ Qwen3-235B chỉ sử dụng 22B tham số khi xử lý,...

Đọc bài gốc tại đây
 


Đăng nhập một lần thảo luận tẹt ga
Back
Top