大模型训练方兴未艾激发算力产业新生态

2023-09-22 09:37:00　来源：光明网

“大力出奇迹”是大模型训练的基本特征，而庞大的数据量、高性能的算力和高昂的训练成本非一般大模型业者所能承受。如何在数据、模型、算力等方面找到一个更加平衡、经济的方法，是AI业者正在思考和实践的热门话题。

近日，中国智能计算产业联盟秘书长安静表示，大模型的火力值依然未减，正向行业化、个性化、实用化的方向发展，更接近用户需求。多形态的大模型训练将持续影响算力产业发展，实现产业转型升级和大模型生态共建共生的新生态。

大模型训练方兴未艾激发算力产业新生态

中国智能计算产业联盟秘书长财经产业研究院副院长安静

安静认为，多型态的大模型产品陆续亮相，体现了中国人工智能和算力产业的发展新趋势：

首先，平台企业发挥多年积累的应用数据价值，提升MaaS建模和服务能力。一些平台企业其实早已利用其数据和技术优势，推出了超千亿参数的广告推荐、智能客服、NLP等各类大模型产品，在实际应用中不断积累底层算法开发经验和工程实施能力。

其次，充分融合算力资源和企业特征，创造更多场景化、个性化应用，激发创新活力！大模型训练成果与平台企业内部业务和相关产品集成对接，在提升内部管理水平的同时，不断提升优化产品性能，更好满足客户需求，增强客户生态建设能力。

第三，更成熟的大模型训练成果能更快更好地服务前端用户。尽管“百模大战”“万模群舞”，现有大模型应用仍然无法完全杜绝“AI幻觉”等负面影响，严重阻碍大模型对前端用户价值的直接体现，因此出现了不少AI Agents应用，试图缩短大模型到实际应用的距离。大模型研发训练需要沉下心来，不急不躁，创造更好产品，让普通用户能够直接感受到大模型带来的AI产品价值。

第四，超算、智算和通算需要得到更加合理的搭配融合。智算需求的快速爆发并非意味着未来的算力需求都会集中在AI应用上，客户的需求是多层次、多方位的，他们更关心自己的应用效率、效能和成本。在算力资源提供商必须充分考虑多层次算力资源的融合使用，实现客户对算力资源应用的综合效益。

第五，行业应用和算力资源的有效融合将成算力产业价值的引爆点。算力资源的快速扩张和能力提升大大推进了应用效能的显著增长，推动算力产业生产力的快速提升。从用户视角看，针对行业化、个性化的应用是其看得最明白、最直观的应用方式，算力资源和应用软件的深度融合，数据模型的优化提升，将快速改变MaaS服务生态，将成为未来算力产业发展的价值增长爆点！

第六，客户对国产算力的严苛要求让国产芯片和算力资源更快成长。国产算力是填补国内空白，缓解“卡脖子”问题的重要力量，但终端用户对国产算力的选择热情不如预期。尽管我们的整体性能、应用生态一时间无法和国际大厂相抗衡，但其进步速度日新月异，已经出现了在某个领域突破国际厂商围剿的局面。比如以软硬件可重构的多维时空域联合计算为特征的清微智能芯片已经完成流片、安排量产，在大模型训练效果方面甚至超过了国际大厂的性能，在能耗、碳排放和成本指标上远远优于国际同行。

安静表示，庞大的市场需求是我们产业发展的重要根基，国产算力在局部领域的突破，必然会赢得特定产业客户的需求，必将培养出独具特色的行业化生态。从单个企业来看，短期内可能无法与国际大厂相抗衡，但各具特色的国产算力厂商构成了中国特色的产业集群，催生出我们自己的产业和算力生态，走出一条不再被“卡脖子”的人工智能新路径。（战钊）

郑重声明：本文版权归原作者所有，转载文章仅为传播更多信息之目的，如作者信息标记有误，请第一时间联系我们修改或删除，多谢。