DeepSeek OpenSourceWeek

DeepSeek OpenSourceWeek 速览

2025年初 DeepSeek 在 X 宣布开源周 (Feb 24-28) (知乎速通)

项目仓库简述架构
FlashMLAhttps://github.com/deepseek-ai/FlashMLA高效 MLA 解码核Hopper
DeepEPhttps://github.com/deepseek-ai/DeepEP第一个用于MoE训练和推理的开源专家并行(EP)通信库Hopper
DeepGEMMhttps://github.com/deepseek-ai/DeepGEMMFP8 通用矩阵乘法库(GEMM) 支持 dense 和 MoEHopper && sm_90a
DualPipehttps://github.com/deepseek-ai/DualPipe优化的并行策略/
EPLBhttps://github.com/deepseek-ai/EPLB专家并行的负载均衡/
3FShttps://github.com/deepseek-ai/3FS基于SSD和RDMA的并行文件系统 (19年就有了)/

DeepSeek 推理系统分析

知乎刘聪解读: https://www.zhihu.com/question/13730017341/answer/113528218599

Hopper 架构的显卡估计都是H系列(H100, H800)

Built with Hugo
主题 StackJimmy 设计