[NS : ord3389] 用16G及以下显存跑Qwen3.6-35B-A3B模型轰出120t/s实现token自由

实测效果最新的Qwen3.6-35B-A3B的测试数据,比上代Qwen3.5-35B-A3B智能体编程能力(大幅增强)模型采用APEX量子化技术量子化的MoE模型,什么是APEX?APEX是一种针对专家混合(Mixture-of-Experts,简称MoE)模型的量化策略,超越了统一的位宽分配。它根据每个张量的角色
 
 
Back to Top