新闻资讯

当前位置:首页>新闻资讯

蚂蚁用国产芯片训练模型降20%成本?

时间:2025-03-25   访问量:1002

### 蚂蚁用国产芯片训练模型降20%成本?

在科技日新月异的今天,每一个技术突破都可能引领行业的变革。近日,蚂蚁集团的一项创新实践引发了广泛关注——他们成功利用国产芯片训练AI模型,实现了成本降低约20%的显著成效。这一消息如同一颗石子投入平静的湖面,激起了层层涟漪,不仅为AI行业带来了新的思考,也为碧悟科技有限公司这样的科技探索者提供了宝贵的启示。

蚂蚁集团的这一创新实践并非偶然。面对AI大模型训练对高性能硬件的依赖,以及全球芯片供应紧张的现状,蚂蚁集团选择了另辟蹊径。他们深知,依赖昂贵的顶级GPU并非长久之计,尤其是在资源受限的环境下,寻找更经济高效的训练方案显得尤为重要。于是,蚂蚁集团Ling团队开始了对国产芯片的深度探索与优化。

据悉,蚂蚁集团此次成功利用包括阿里巴巴和华为在内的国产芯片,结合混合专家(MoE)机器学习方法,训练出了性能卓越的人工智能模型。这一过程中,蚂蚁集团提出了一系列创新方法,包括动态参数分配、混合精度调度技术、训练异常处理机制升级以及模型评估流程优化等。这些技术的综合运用,使得模型能够在性能较低的硬件上高效运行,无需依赖昂贵的顶级GPU。

其中,动态参数分配技术根据输入内容的复杂度,动态调整激活的模型参数数量。对于简单问题,系统仅使用较少参数;而遇到复杂问题时,才调用更多资源。这种“按需分配”的思想极大地提高了资源利用效率。混合精度调度技术则在不同计算阶段灵活使用不同的数值精度,在保证精度的前提下降低了计算和存储需求。训练异常处理机制的升级,使得自适应容错恢复系统能够缩短中断响应时间,提高训练稳定性。而模型评估流程的优化,则通过自动化评测框架压缩验证周期,加速了迭代进程。

实验结果表明,蚂蚁集团的3000亿参数MoE大模型在使用国产GPU的低性能设备上也能完成高效训练,其性能与完全使用英伟达芯片、同规模的稠密模型及MoE模型相当。这一成果不仅打破了高性能硬件对AI模型训练的束缚,更为国产芯片在AI领域的应用开辟了新道路。

在五种不同的硬件配置下,Ling团队对9万亿个token进行了Ling-Plus的预训练。结果显示,使用高性能硬件配置训练1万亿token的预训练成本约为635万元人民币,而采用蚂蚁优化方法后,低规格硬件训练成本降至508万元左右,节省了近20%的成本。更令人印象深刻的是,这种降本增效并未牺牲模型性能。蚂蚁集团的技术突破,无疑为AI产业的未来发展提供了新的可能。

这一技术突破的意义远不止于此。它首先将大幅降低AI研发门槛,让更多中小企业和研究机构有能力训练自己的大模型。目前业界通常依赖英伟达的H100或H800等高端GPU训练大模型,这些芯片不仅价格昂贵,全球供应还非常紧张。蚂蚁集团的技术成果若得到验证推广,将有助于减少对国外高端芯片的依赖,增强技术自主性。特别是在当前国际芯片供应受限的情况下,这一突破具有战略意义。

此外,通过降低成本,这一技术将加速AI技术的商业化应用,尤其是在资源受限的场景。这将推动AI技术更加普惠,为更广泛的行业和应用场景带来创新。蚂蚁集团的技术突破,无疑为AI产业的未来发展注入了新的活力。

作为碧悟科技有限公司官网的运营人员,我们深感这一热点事件对我们的启示。在科技探索的道路上,勇于创新、敢于突破是我们不断前行的动力。我们将持续关注蚂蚁集团等科技领军者的创新实践,不断学习借鉴,为碧悟科技有限公司的发展贡献我们的智慧和力量。同时,我们也期待与更多志同道合的伙伴携手共进,共同推动科技行业的繁荣发展。

上一篇:男子19天花3万买课挽回女友遭拉黑

下一篇:国足0-2澳大利亚 无缘直通世界杯