Một rào cản lớn ngăn cản việc ứng dụng rộng rãi các Mô hình ngôn ngữ lớn (LLM) mạnh mẽ như Llama 3 hay Qwen 2.5 trên các thiết bị cá nhân chính là kích thước khổng lồ và yêu cầu phần cứng "khủng" (GPU đắt tiền, nhiều bộ nhớ RAM) của chúng. Tuy nhiên, một nhóm nghiên cứu quốc tế bao gồm các nhà khoa học từ Yandex Research (Nga), MIT (Mỹ), Viện Khoa học và Công nghệ Áo (ISTA), Đại học Johannes Gutenberg (Đức) và Đại học KAUST (Ả Rập Saudi) vừa công bố một kỹ thuật đột...