DeepSeek官宣,今日开源DeepEP,据介绍,DeepEP是第一个用于MoE模型训练和推理的EP通信库。特点有:可以实现高效且优化的全对全通信;节点内和节点间均支持NVLink和RDMA;用于训练和推理预填充的高吞吐量内核;用于推理解码的低延迟内核;原生FP8调度支持;灵活的GPU资源控制,实现计算-通信重叠。(本文来自第一财经)
(图侵删)
文章版权声明:除非注明,否则均为伯爵网络原创文章,转载或复制请以超链接形式并注明出处。
DeepSeek官宣,今日开源DeepEP,据介绍,DeepEP是第一个用于MoE模型训练和推理的EP通信库。特点有:可以实现高效且优化的全对全通信;节点内和节点间均支持NVLink和RDMA;用于训练和推理预填充的高吞吐量内核;用于推理解码的低延迟内核;原生FP8调度支持;灵活的GPU资源控制,实现计算-通信重叠。(本文来自第一财经)