4 月 16 日,DeepSeek 开源了其高性能 CUDA 算子库 DeepGEMM 的重大更新(PR #304),新增 Mega MoE 融合算子、FP8×FP4 GEMM、FP4 Indexer、PDL 支持等,同时在 JIT 编译