Tutel是微软亚洲研究院于2021年发布的高性能混合专家模型(MoE)库,旨在优化大规模深度神经网络训练效率。该库针对MoE模型的计算与通信瓶颈,通过优化GPU内核、all-to-all通信算法及多样化算法支持,兼容PyTorch等主流框架,并集成至Fairseq、DeepSpeed等工具包。其核心技术包括:将输出选通调度时间复杂度从O(N³)降至O(N²),提升运算速度24倍;优化GPU间通信...
Tutel是微软亚洲研究院于2021年发布的高性能混合专家模型(MoE)库,旨在优化大规模深度神经网络训练效率。该库针对MoE模型的计算与通信瓶颈,通过优化GPU内核、all-to-all通信算法及多样化算法支持,兼容PyTorch等主流框架,并集成至Fairseq、DeepSpeed等工具包。其核心技术包括:将输出选通调度时间复杂度从O(N³)降至O(N²),提升运算速度24倍;优化GPU间通信...