财通证券：DeepSeek开源周六连击对计算机行业维持看好评级

2025-03-09 11:50:43

　　智通财经APP获悉，财通证券发布研报称，对计算机行业维持看好评级★★。DeepSeek在2月24日至28日进行了为期5天的开源周“技术轰炸”，开源了5大代码库，覆盖训练★★★、推理、通信、负载均衡以及数据加速的全链路。同时于于第6天惊喜发布关于DeepSeek-V3/R1推理系统概述的文档★，展示了如何通过跨节点并行、负载均衡和动态资源管理实现高吞吐量★★、低延迟和高性价比的推理服务，以实现545%理论成本利润率★★★。

　　DeepSeek开源周上接连不断的技术发布★，彰显了团队的极客精神和开源理念★。正如其官方所言★★：“这里没有象牙塔，只有秉持纯粹的车库创业精神和社区驱动的创新理念★★。”此次FlashMLA项目中同样包含了一行内联代码，这表明DeepSeek团队深入至高级编程语言CUDA和GPU的底层机器代码之间，对GPU的并行计算、内存访问等进行更加细致的控制，进一步提升程序的性能。这不仅体现了团队对算法的深耕，也展现了他们对效率的极致工程化追求。

　　DeepSeek在2月24日至28日进行了为期5天的开源周“技术轰炸★★”，开源了5大代码库★，覆盖训练★★、推理★、通信、负载均衡以及数据加速的全链路，惊喜连连★★★。开源周第1天发布FlashMLA，一款专为Hopper架构打造的高效MLA解码器，可高效处理变长序列，优化内存管理★，榨取GPU极致性能★。开源周第2天发布DeepEP★★★，聚焦通信资源利用，提升数据高效传输，是首个为MoE量身定制的灵活GPU资源控制通信库★。开源周的第三天★★，DeepSeek推出了支持稠密和MoE模型的FP8计算库——DeepGEMM，核心逻辑仅约300行代码直面AI计算中最频繁的矩阵乘法，可为V3/R1的训练和推理提供强大支持★。开源周第4天，DeepSeek推出了一系列优化并行策略★★★，包括DualPipe——一种用于V3/R1模型训练中实现计算与通信重叠的双向流水线并行算法★;以及EPLB——一个针对V3/R1模型的专家并行负载均衡工具，并深入分析了V3/R1模型中的计算与通信重叠机制。开源周的最后一天，DeepSeek发布了3FS并行文件系统，旨在应对人工智能训练和推理工作负载带来的挑战★。该系统利用现代固态硬盘(SSDs)和RDMA网络，提供一个共享存储层，从而简化分布式应用程序的开发，并加速DeepSeek平台上所有数据访问操作。

　　风险提示：技术迭代不及预期的风险★★;商业化落地不及预期的风险;政策支持不及预期风险;全球宏观经济风险★★。

　　在开源周结束5天★★“技术轰炸”后★★，DeepSeek于第6天惊喜发布关于DeepSeek-V3/R1推理系统概述的文档，展示了如何通过跨节点并行、负载均衡和动态资源管理实现高吞吐量★★★、低延迟和高性价比的推理服务，以实现545%理论成本利润率★★。DeepSeek提出了三种负载均衡器：Prefill LoadBalancer、Decode Load Balancer和Expert-Parallel Load Balancer。它们分别针对不同的核心问题进行优化，目标是为每个GPU分配均衡的计算和通信负载，从而提高整体系统效率。

财通证券：DeepSeek开源周六连击对计算机行业维持看好评级

首页

产品展示

解决方案

新闻中心

关于我们

凯发K8国际首页

k8凯发官网入口

粤ICP备15113205号

财通证券：DeepSeek开源周六连击 对计算机行业维持看好评级

首页

产品展示

解决方案

新闻中心

关于我们

凯发K8国际首页

k8凯发官网入口

粤ICP备15113205号

财通证券：DeepSeek开源周六连击对计算机行业维持看好评级