新华网 > > 正文
2021 04/29 10:30:05
来源:科技日报

AI进入下半场 目标瞄准“举重若轻”“大材小用”

字体:

  产业的需求决定了要完成的人工智能任务越来越复杂,轻量化人工智能必须通过加速运算效率、提高计算密度才能实现极致的效率。

  ——冷聪 中国科学院自动化研究所副研究员

  人工智能算法的复杂度急剧攀升,神经网络计算的能耗代价越来越高,数据洪水式地涌积堰塞……这些年,人工智能的发展遇到了越来越多的瓶颈。如何将人工智能模型及其计算载体前端化、轻量化成为亟待解决的问题。最新兴起的轻量化人工智能被寄予厚望,以“轻量化”为赛点的人工智能竞赛下半场已经来临。为此,4月27日,科技日报记者采访了中国科学院自动化研究所的相关专家。

  轻量化成为人工智能下半场赛点

  人工智能技术在行业应用中,大多依赖海量的训练数据和大规模服务器的算力支持。

  然而,近年来,随着信息技术领域的摩尔定律逐步放缓,硬件的发展越来越难以满足当前人工智能模型动辄万亿级规模的存储和算力需求,数据堰塞、存储暴涨、隐私泄露、能耗高企等问题随之而来。

  “当前,对于人工智能设备和应用的快速响应、隐私保护以及节能减排的需求越发凸显,轻量化人工智能应运而生,并被寄予厚望。2020年,《麻省理工科技评论》将轻量化人工智能列为‘全球十大突破性技术’。”中国科学院自动化研究所研究员程健说。

  所谓轻量化人工智能,是指以一系列轻量化技术为驱动提高芯片、平台和算法的效率,在更紧密的物理空间上实现低功耗的人工智能训练和应用部署,不需要依赖与云端的交互就能实现智能化操作的人工智能。

  轻量化人工智能被评入“全球十大突破性技术”,《麻省理工科技评论》给出的评选理由是,轻量化智能使现有的服务,比如语音助手、手机拍照等,变得更好更快,不必每次都需要连接云端才能运行深度学习模型;此外,轻量化人工智能也将使新的应用成为可能,比如基于移动端的医学检测分析、对反应时间要求更快的自动驾驶汽车;此外,本地化的人工智能更利于隐私保护,用户的数据不再需要离开设备就能实现服务功能的进化。

  “更重要的是,轻量化人工智能将人工智能推向更主流,它大大降低了人工智能系统的部署难度和成本,把人工智能从一场高门槛的科技巨头竞赛变成更容易普惠民生的智能生态。”程健说,在人工智能领域的角逐中,以轻量化为赛点的下半场已经来临。

  极致效率、极低能耗是最终追求

  在表现上,轻量化人工智能是在做减法,降低能耗、降低对硬件平台性能指标的要求、降低与云端的通讯需求等。

  然而,“实质上,轻量化的内核却是在做加法。”中国科学院自动化研究所副研究员冷聪说,产业的需求决定了要完成的人工智能任务越来越复杂,轻量化人工智能必须通过提高运算速度、计算密度才能实现极致的效率。

  在程健看来,在精度接近无损的前提下,将人工智能模型及其计算载体轻量化,是一个极具挑战性的任务。

  解决这一问题,需要对神经网络进行轻量化设计、计算加速以及设计新的计算架构以实现模型的硬件化,这需要从软件和硬件两方面来着手。

  在软件上,进行模型和算法创新,通过轻量化模型设计、矩阵分解、稀疏表示、量化计算来实现模型的微型化和计算加速;而在硬件上,则要通过流水线设计、存储模式设计等手段进行硬件架构的创新,通过软硬协同设计和优化实现人工智能的轻量化。

  “虽然执行神经网络计算的是硬件,但神经网络结构和人工智能平台决定了计算量的大小和运算方式。”冷聪坦言,所以极致的轻量化必须是软件和硬件的协同轻量化——基于复杂的人工智能应用场景,将芯片、平台和算法充分结合以联合加速。

  作为人工智能的硬件载体,人工智能芯片必须达到更高的性能、更高的效率、更低的功耗和更小的体积。这样才能有足够平价高效的计算平台满足产业需求,承载复杂的人工智能任务,并且使推理和运算从云端迁移到终端。

  同时,轻量化的人工智能平台要以更低的功耗来训练和运行人工智能算法,最大化的发掘硬件的能力。更重要的是,应用轻量化技术的神经网络模型要小规模、少运算量并保持良好的精度。

  未来轻量化人工智能将赋能万物

  程健介绍,中国科学院自动化研究所是轻量化人工智能的先行者,很早就开始了软硬协同轻量化的技术研究,并走在国际前列。

  早在2016年,卷积神经网络大规模迈向应用之初,中国科学院自动化研究所就在国际人工智能顶级期刊发表了多篇神经网络模型轻量化领域的重要论文,成为国际上最早开始人工智能轻量化研究的机构之一,相关成果引起了国内外诸多专家的广泛关注。

  “我们设计开发的轻量化人工智能平台QEngine及轻量化算法已经在数十万终端上部署。2019年,在国际神经信息处理系统大会的微型网络挑战竞赛中,我们与ARM、IBM、高通、Xilinx等国际一流芯片公司同场竞技,获得了轻量化神经网络架构图像类的双冠军。”程健表示。

  2020年,中国科学院自动化研究所自主研发的全球首款极低比特量化神经处理芯片(QNPU)成功流片,绕开了芯片计算领域备受关注的“内存墙”难题,在芯片成本、功耗、计算结构、边缘计算等方面实现革命性的变革。

  “该芯片的面世,也标志着自动化研究所成为了全球为数不多的拥有‘人工智能芯片—平台—算法’全栈轻量化人工智能技术的机构之一。”冷聪说。

  未来,以人工智能驱动的小型化设备会越来越多出现在我们身边。由人工智能芯片、平台和算法组成的轻量化人工智能终端将在越来越多的场景中应用。

  “比如,在电力行业,我国的输电线路覆盖广,野外自然环境复杂,检修维护作业危险系数高、难度大,我们设计的自主巡检无人机、缺陷识别分析便携终端、通道可视化智能感知摄像头具备多种智能识别、检测和分析功能,能够保障输配电线路的安全和电力系统稳定。”程健举例说。

  同时,在消费电子行业,暗光增强、超分辨率等自动化所设计的轻量化算法及轻量化神经网络计算架构,也为手机终端、安防终端提供了影像增强效果。

  程健表示,轻量化人工智能未来将赋能万物,让每个设备都具有环境感知、人机交互、决策控制的能力。(记者 陆成宽)

【纠错】 【责任编辑:周靖杰】