从炼大模型到大小模型协同进化 端云协同平台“洛犀”发布

2022-01-26 10:44:00 来源:光明网

1月24日,由中国工程院信息与电子工程学部指导,在中国工程院院刊《Engineering》和分刊《Frontiers of Information Technology & Electronic Engineering》发起主办的第三期“中国工程院院刊:信息领域青年学术前沿论坛”上,上海浙江大学高等研究院、阿里巴巴达摩院、上海人工智能实验室联合发布了“洛犀”端云协同平台。该平台提供一站式的端云协同模型训练、部署、通信能力,致力于促进大小模型协同进化,构建充分利用大模型应用潜力的新一代人工智能体系。

AI大模型在2021年迎来大爆发,但能耗问题限制其参数扩张及应用落地。2022达摩院十大科技趋势指出,大模型参数竞赛正进入冷静期,大小模型将在云边端协同进化——大模型向边、端的小模型输出模型能力,小模型负责实际的推理与执行,同时小模型再向大模型反馈算法与执行成效,让大模型的能力持续强化。

在此背景下,上海浙江大学高等研究院联合阿里巴巴达摩院、上海人工智能实验室研制了“洛犀”端云协同平台。“洛犀”取自宇宙中大小星体间永恒的洛希吸引力,并含强大、坚韧之意,寓意大小模型珠联璧合。

从炼大模型到大小模型协同进化 端云协同平台“洛犀”发布

据了解,洛犀平台沉淀了端云两侧最佳实践的算法组件和平台服务。其中,平台在端侧以python/js package的形式提供服务,包含表征、文本理解、图计算等能力;在端云链路上,平台提供实现端云协同关键的通信能力,包括方案分发、数据通信链路;端云协同的模型训练累积沉淀在云端,包括端模型训练等。

包含10万亿参数的达摩院大模型M6,是目前业界最大的多模态预训练模型。通过洛犀平台技术,联合研究团队成功将3.4亿参数版本的M6模型高精度压缩至百万参数的10MB大小,以1/30的体积还原了90%以上性能,并试点部署于搜索场景,成为业界首个落地的端上预训练模型。此外,团队还借助洛犀完成了图神经网络、排序模型、强化学习等技术在端云协同范式下的部署。

“须弥藏芥子,芥子纳须弥。”浙江大学上海高等研究院常务副院长吴飞教授如此形容大小模型间的辩证关系。庞大的须弥山如何纳入极微小的种子中?答案是取其精髓、化繁为简。大模型通过高精度压缩,化身为终端可用的小模型,小模型的实践累积起来,将不断提升云端大模型的认知推理能力,实现“集众智者无畏于圣人”。

据阿里巴巴达摩院智能计算实验室负责人周靖人博士介绍,团队将进一步探索端云协同框架下端模型和云模型的协同机理,并完善算法方案和业务实践。“洛犀”平台未来计划对开发者开放,让大小模型协同进化的时代加速到来。上海人工智能实验室主任助理王延峰教授也表示,作为我国人工智能领域“突破型、引领型、平台型”一体化的大型综合性研究基地,上海人工智能实验室将坚定地携手各路学术精英、产业翘楚,探索人工智能赋能千行百业的延展性,构建中国自己的,自主可控、具有国际影响力的人工智能生态。

端云协同将成为未来AI产业服务的重要形态,给各种业务算法带来全新机遇,洛犀平台将通过攻坚端云协同技术难题,实践以更广泛、更普惠的人工智能助力产业发展。

未来,上海浙江大学高等研究院也将继续以“上海高度、中国特色、科创内禀”为理念,秉承“求是创新”的浙大精神,围绕“计算+”的基础理论、模型算力、学科交叉赋能应用场景的功能布局,立足国家重大战略需求,汇聚国际顶尖人才,开展前沿科学研究与颠覆性技术研发,推进科技创新与产业发展协同互动,搭建开源、开放、互通的新一代人工智能生态体系,推动中国经济社会的智能化建设。(科文)

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。