DeepSeek mở nguồn ba dự án liên tiếp để chứng minh hiệu quả đào tạo mô hình AI

vnrcraw7
Cao Tùng
Phản hồi: 0

Cao Tùng

Thành viên nổi tiếng
DeepSeek đang tổ chức "Tuần lễ nguồn mở" kéo dài 5 ngày từ 24/2 đến 28/2, trong đó họ lần lượt mở mã nguồn 5 dự án công nghệ AI. Ba ngày đầu tiên, công ty đã công bố ba dự án quan trọng, giúp giải thích cách họ đạt được hiệu quả cao trong đào tạo mô hình ngôn ngữ lớn với chi phí thấp hơn đáng kể so với các đối thủ. Ba dự án mã nguồn mở đầu tiên Ngày 1: FlashMLA Đây là một lõi giải mã MLA (Multi-head Latent Attention) hiệu quả cho GPU kiến trúc NVIDIA Hopper,...

Đọc bài gốc tại đây
 


Đăng nhập một lần thảo luận tẹt ga
Back
Top