[NS : usover] DeepSeek 发布 DeepGEMM 重大更新:推出 Mega MoE 融合算子并支持 FP4 精度

DeepSeek旗下高性能算子库DeepGEMM于2026年4月16日发布重大更新,正式推出MegaMoE融合算子。该算子通过将dispatch、SwiGLU等多个计算步骤与NVLink通信重叠,实现了计算与通信的高效融合。此外,本次更新还新增了FP8xFP4GEMM算子、FP4Indexer以及PDL(程序化依赖
 
 
Back to Top