Hans的资讯博客

深度学习、机器学习、AI开发技术分享

全面解析大模型训练核心技术,包括分布式训练架构、显存优化、梯度累积、混合精度等关键技术,以及DeepSpeed等主流框架的实践经验。适合AI工程师和研究人员阅读。

阅读全文 »