JNews

[NS : ord3389] 用16G及以下显存跑Qwen3.6-35B-A3B模型轰出120t/s实现token自由

实测效果最新的Qwen3.6-35B-A3B的测试数据，比上代Qwen3.5-35B-A3B智能体编程能力（大幅增强）模型采用APEX量子化技术量子化的MoE模型，什么是APEX？APEX是一种针对专家混合（Mixture-of-Experts，简称MoE）模型的量化策略，超越了统一的位宽分配。它根据每个张量的角色