从这场论坛看AI芯片未来。
作者 |  徐珊 杨畅
编辑 |  心缘
AI芯片发展到怎样的阶段?有何新机遇?哪些技术创新和设计理念日益趋近行业主流?
芯东西7月19日报道,在近期举行的2021世界人工智能大会智能芯片定义产业未来论坛上,知名院士专家与国际科技巨头、明星独角兽领军人物同台,分享AI芯片最新风向的观察和思考。
值得一提的是,鲜少公开露面的苹果大中华区最高负责人,苹果公司副总裁、大中华区董事总经理葛越在现场详细讲解了苹果的产品开发逻辑,芯片、系统等软硬件的关键特性和进展。
英特尔研究院副总裁宋继强解读面向异构集成未来的五大技术创新方向,高通中国区董事长孟樸主谈如何运用5G+AI推动多个领域的数字化转型,Cadence公司CEO陈立武谈到快速增长的数据正推动着架构、设计、EDA、IP等芯片创新。
面向边缘及终端AI发展,恩智浦半导体全球资深副总裁李廷伟着重分享了边缘AI/ML的关键特征,德州仪器全球副总裁兼中国区总裁姜寒强调人机交互系统需要更加安全可靠,博世亚太区总裁王宏宇谈及MEMS传感器的新机会与优势。
此外,明星独角兽公司阵营也释放出大量干货。寒武纪公司创始人兼CEO陈天石首次披露寒武纪7nm车载智能芯片细节,单芯算力超200TOPS;天数智芯董事长兼CEO刁石京、燧原科技创始人兼CEO赵立东、爱芯科技董事长兼CEO仇肖莘则在圆桌环节探讨了多个AI芯片发展热门话题。
本文福利:随着人工智能理论和技术的日益成熟,应用范围不断扩大,国内外企业纷纷布局AI芯片。推荐精品研报《AI芯片技术选型目录》,可在公众号聊天栏回复关键词【芯东西125】获取。
01.
中科院院士刘明:
PPACt成IC技术评价新策略
中国科学院院士、复旦大学教授刘明提到此前在IC发展历程中,尺寸微缩是评价芯片技术的标志性策略,而当微缩空间变窄后,PPACt或将成为尺寸微缩之后,业界新的技术评价策略。PPACt分别指性能、功耗、面积、成本以及新一代技术进入市场的时间
根据贝尔定律,能效每提高1000倍,就会衍生出一种新形态计算系统。超算时代,每瓦功耗只能支撑1KOPS的运算;智能手机时代,能效提高至每瓦1TOPS;未来智能终端要达到每瓦1POPS。计算硬件经历了由CPU到XPU的发展历程,但能效仍无法满足未来智能化应用的计算需求。
▲中国科学院院士刘明
在刘明院士看来,IC发展正呈现两大方向特征。一方面,基础器件结构持续演变,从平面、FinFET发展到nanosheet、Forksheet,再演化向CFET;另一方面,新材料、器件、微缩、3D集成等多元技术协同发展,实现整体性能突破。
根据DARPA预测,即使不再做尺寸微缩,这些技术也会让IC芯片性能做到500-1000倍的提升,到2035年有望实现zettaFLOPS级系统性能水平。当然,其中许多工程问题还需持续探讨。
如今异构集成技术趋于热门,能实现集成密度和能效同步改善。例如AMD霄龙系列CPU采用2.5D和3D Chiplet集成技术,带宽可提升逾10倍。
刘明院士认为计算架构的变革依赖于器件的支撑,有了精密的器件,则可以逐步革新冯诺依曼架构,让数据离GPU更近,同时减少能源消耗。
当前计算机在仿照人类大脑的功能,以超低能耗同时运行多项工作,但人们对大脑的探索还相当有限。近存计算本质上是冯诺依曼架构的延续,高算力、高精度以近存计算为主,存内计算也在快速进步。区别于传统冯诺依曼架构以计算为中心,存内计算将部分算力下推至存储,这一领域目前尚且没有非常明确的定义。
此外,神经拟态计算也是新兴技术的热门话题。刘明院士说,它可以被认为是存内计算的某种发展方向,不同于传统神经网络AI芯片,这种芯片结构更偏向“类人脑”。国内外不少企业和学院在做跟存内计算和神经拟态计算相关的研究。
刘明院士认为存内计算对于AI芯片而言是很好的思路,一般的GPU和AI芯片在执行AI负载时会有频繁的数据存取操作,对性能和功耗都有影响,而存内计算架构尤其在低精度计算方面已展现出数量级上的能效优势。不过目前存内计算还面临着商用挑战。
02.
英特尔宋继强:用应用场景推动
多种AI技术的垂直整合
刘明院士提到的神经拟态计算,恰恰是英特尔正在攻坚的前沿研究方向。英特尔研究院副总裁、英特尔中国研究院院长宋继强在演讲中说道,英特尔Loihi神经拟态芯片已经拥有128核、13万神经元、1.3亿个突触,具备可扩展的片上学习能力,没有浮点运算、没有乘加器,且功耗很低。
面向异构集成的未来,除了分享神经拟态计算技术外,宋继强还分别详细解读了英特尔在架构创新、光互连技术、先进封装技术、异构集成的开放软件生态系统oneAPI方面的技术创新。
在架构创新部分,英特尔在至强CPU处理器内部加入了可扩展性的异构计算,将通用服务器性能提升46%,专门针对AI训练和加速已提升74%。
在集成光电部分,宋继强认为光是替代铜的非常好的互连介质,能实现更多跨处理器之间、甚至是跨服务器节点之间的数据交互,从而提升芯片计算能力,所以这方面一定要大力加以创新。
在异构封装部分,英特尔拥有EMIB 2.5D和Foveros 3D封装技术,这些技术可以让很多新的芯片很好地进行互连。
除了硬件之外,软件同样是英特尔重视的内容。英特尔oneAPI软件使得开发者能用跨不同架构的单一代码库来开发应用,降低开发维护成本。
▲英特尔研究院副总裁、英特尔中国研究院院长宋继强
宋继强总结说,如果想推动AI的规模化创新加上应用,必须要做好三件事:一是计算上怎么样能够很好的用高性能、高能效的架构去支持多种数据,同时很好地解决庞大数据之间的传输、存储等硬件问题;二是真正地去拥抱异构集成,通过多种武器,用组合拳去解决产品的领导力;三是需要用应用场景去推动多种AI技术的垂直整合,以及软硬件结合等方案,从而创造更大价值的领域来推动AI技术创新。
03.
苹果葛越:解读苹果自研芯片的设计心经
苹果公司副总裁、大中华区董事总经理葛越的演讲主题,聚焦于苹果自研芯片的开发理念、关键特性和最新进展。
“我们产品和技术的开发永远都是为了打造最好的产品,实现最好的体验,独一无二的软硬件紧密结合让我们能够做到这一点。”葛越谈道。
苹果的端到端产品设计、从芯片到硬件再到软件全栈式覆盖,都是从完整的用户体验来设计。其芯片专为自家特定产品的特定功能而量身定制这种优化贯穿于CPU、GPU、图像信号处理器及更多组件,苹果很早就开始研发能在设备端有效运行复杂机器学习算法的芯片。
“今天,我们几乎所有产品都搭载了Apple自己的芯片。”葛越说。
苹果在2017年推出的A11仿生芯片中已经搭载了神经网络引擎,此后不断增加神经网络引擎的核心和能力,最新iPhone 12系列搭载的A14仿生芯片中的神经网络引擎,能完成每秒11万亿次运算
M1芯片是苹果迄今最强大的自研芯片,是其首款采用5nm制程打造的个人电脑芯片,封装了160亿个晶体管。继去年发布搭载M1芯片的Mac后,今年苹果又发布搭载M1芯片的iPad Pro。
▲苹果公司副总裁、大中华区董事总经理葛越
在自研芯片神经网络引擎的支撑下,苹果产品能支持更强大的机器学习功能。比如,用户向语音助手Siri提问时,语音数据在设备端处理,不会将问题发送到云端再回传,这既提高Siri的响应效率,又更好保护了机主的隐私安全。
葛越强调:“我们坚持在设备端处理数据的努力,不仅更好地保护了隐私,还带来了开创性的新功能。我们认为鱼和熊掌皆可得。
为了进一步发挥苹果自研芯片的计算潜能,苹果还提供其机器学习框架Core ML,让全球数以百万的开发者使用这一框架进行应用创新。
04.
高通孟樸:5G+AI正加速
汽车、云端等多领域变革
高通中国区董事长孟樸对5G时代下的智能互联未来提出了几点看法,并分享了高通如何运用5G、AI和云等技术,推动行业数字化转型。
孟樸认为,5G正协同AI扩大应用领域。通过5G的高速率传输特点,智能边缘终端产生的数据能实时共享到云端,加速AI在云端和边侧端实现规模化应用。在他看来,智能手机将是未来应用最广泛的AI设备。
目前,通过骁龙移动平台,高通的技术已经应用在15亿移动设备上。骁龙888 5G移动平台采用了以高通Hexagon780处理器为核心的第6代高通AI引擎,以及第2代高通传感器中枢。其中,Hexagon 780处理器首次支持了新的融合AI加速器,能让复杂AI任务更早地实现落地应用。
▲高通中国区董事长孟樸
高通在移动终端、物联网、汽车、云端等领域均做出了许多新的尝试。
在移动终端领域,高通有骁龙移动平台、骁龙计算平台以及骁龙XR平台,利用5G和AI技术的组合大幅提高云边端计算能力。在物联网领域,高通正为全球近1万3千家客户提供物联网解决方案。
在汽车领域,高通Snapdragon Ride平台可面向不同自动驾驶场景,提供不同等级的算力,目前已有1.5亿汽车搭载了该Ride平台。在云端AI推理领域,高通Cloud AI 100加速器能解决云端AI推理处理在能效和规模化扩展方面的需求。
最后,孟樸表示,高通希望与全球伙伴一起,推动5G和AI全面发展,共建智能互联的未来。
05.
恩智浦李廷伟:发展边缘AI/ML
需注重安全和正确AI伦理观
恩智浦半导体全球资深副总裁兼大中华区主席李廷伟从技术和行业的角度分享了边缘AI/ML如何助力实现一个可预测和自动化的智能世界,并分享了恩智浦在AI伦理道德方面的观察。
李廷伟说,AI与ML正在走向边缘是大势所趋。到2025年,世界将有超过500亿个包括可穿戴设备、机器、智能手机、家用设备在内的边缘设备,它们将构成智能世界的基础。
覆盖众多行业和领域的视觉、语音和异常检测,有望成为边缘AI/Ml的核心应用,未来围绕着这些应用的创新将十分活跃。
▲恩智浦半导体全球资深副总裁兼大中华区主席李廷伟
而恩智浦致力于为更智能的世界提供安全连接,围绕感知、思考、连接、执行这四个边缘AI的驱动技术深度布局,已形成丰富的芯片产品组合。
恩智浦还为边缘AI/ML而打造了完整的软硬件平台,包括可扩展的人工智能硬件(涵盖传统处理器MCU、跨界处理器MCU和高性能的应用处理器AP),以及eIQ软件开发平台,从而降低开发难度和节省成本。
为了进一步加速创新AI应用的落地,恩智浦推出了基于EdgeReady的生产级交钥匙解决方案,让人脸识别、语音控制等AI/ML技术可以被快捷地集成到智能产品中;并推出Energy FLEX架构,这是一种“异构并行处理+分级细粒度电源划分与管理”的高效边缘计算解决方案,可增强电子电气系统集成、性能、功能和能源管理。
此外,恩智浦特别强调正确的“AI伦理观”。其2020年发布的《算法道德》白皮书中提出了不作恶、人类自主、可解释性、持续关注与警惕、以及通过设计保护安全五大原则。
06.
寒武纪陈天石:首次披露车载智能
芯片细节,算力超200TOPS
寒武纪是专注于AI芯片研发的国内知名公司,其产品线已覆盖云边端,包括训练和推理芯片。而在此次演讲中,寒武纪公司创始人兼CEO陈天石首次披露寒武纪车载智能芯片的关键数据。
此次新披露的寒武纪车载智能芯片,定位于“高等级智能驾驶芯片”,致力于为实现更高级别的自动驾驶提供算力支撑。目前自动驾驶大多停留在L1、L2,自动驾驶每前进一个等级对于算力的需求据估计将提升5~10倍。
▲寒武纪公司创始人兼CEO陈天石
陈天石说,当前市场中的车载芯片几乎很难应对爆发式增长的算力需求。寒武纪“云边端车”四位一体的布局,就是为了满足这些需求。
在云端,寒武纪高性能AI训练芯片负责处理车端收集的海量数据并进行复杂模型训练,再通过OTA推送到车端。
在边缘端,寒武纪基于边缘端智能芯片则可以推送路侧视角、远距离信息、车辆盲区等信息到车端,与自动驾驶车辆形成协同感知。
在终端,基于寒武纪智能处理器IP的各类终端芯片,可以感知和采集数据,赋能地图众包、高清地图等应用,通过云端和路侧设备将数据推送至车辆,保障信息的准确高效。
在车端,设计之中的寒武纪车载智能芯片,单芯片拥有超过200TOPS的AI性能、采用7nm制程、车规级标准和独立安全岛,支持寒武纪成熟的AI软件工具链,能够满足高等级智能驾驶的性能需求。在这款芯片上,寒武纪也将持续更新迭代。
“寒武纪已有的云边端协同、训练推理融合、统一的软件开发平台,为应对自动驾驶的挑战提供了良好的基础条件。”陈天石说。
寒武纪的所有处理器,都使用统一的处理器架构和平台级基础软件,开发的应用可以在云边端互相兼容,减少了不同平台开发和应用迁移成本。
07.
Cadence陈立武:以数据为中心的
技术潮流带动半导体复兴
国际EDA巨头Cadence公司的CEO陈立武因疫情原因不能到场,以视频形式发表主题为《推动半导体产业的复兴》的演讲。
▲Cadence公司CEO陈立武
陈立武观察到,通用计算将无处不在,“我们今后会越来越多地看到异构的计算池,甚至在未来几年将出现量子计算的实际应用。”
以惊人速度增长的数据,需要传输、存储、处理和分析,这对于高性能计算、高带宽传输和高密度存储提出了迫切的需求。“以数据为中心的技术潮流,正在成为半导体产业再次复兴的强大推动力,推动着包括架构、设计、EDA、IP和制造生态系统等各个方面的创新。”陈立武说。
在计算之外,最新的云架构需要高性能的网络及存储,再进一步则是处于存储之上的高效的数据组织和整理,以及基于此的各种应用及服务。而这些所需的芯片和系统,都要通过芯片、封装、PCB 工具和IP进行最佳实现。
认识到这些趋势后,Cadence实行了智能系统设计(Intelligent System Design)战略,分为卓越设计、系统创新、普适智能三个层次。
卓越设计是Cadence战略的基础,即核心EDA和IP的广泛产品组合;系统创新是利用专业的经验以扩展到EDA之外的系统创新;普适智能作为战略的最后一层,将AI和算法知识应用于产品,并在特定垂直领域里构建一些有创意的解决方案。
在EDA创新方面,Cadence将AI技术融入EDA软件,从而帮助客户提高芯片性能、更高效地验证芯片设计。此外,Cadence也向客户提供了一系列高性能、低功耗IP,协助客户实现其AI应用。
08.
德州仪器姜寒:边缘AI需要
实时控制和安全可靠
德州仪器全球副总裁兼中国区总裁姜寒认为,包括AI在内的信息基础设施正为智能工厂、智能楼宇等应用持续赋能,新的应用场景在功能实现上需要实现精准感知和快速决策,以适应不断变化的态势和环境。同样,由于会有更多的人机交互,这就要求系统更加安全、可靠。这对半导体技术提出了更高的要求。
边缘AI是德州仪器专注的重点领域之一。边缘AI需要快速感知、响应、决策的能力,这在一定程度上意味着智能系统需要实时控制或能进行更快速处理的边缘AI应用。德州仪器在其新器件中集成实时控制、分析和片上功能安全等特性,能帮助客户更快速、更高效地设计智能系统。
▲德州仪器副总裁兼中国区总裁姜寒
如今工业领域中机械臂更为常见,机械臂在固定场景下完成固定任务。未来,机器人要实现在更加开放的环境中工作,比如城市的街道、矿山及农村,则需更安全可靠的机器人系统。
在姜寒看来,系统需要不断提升,以达成两个目标:一是精确和快速感知能力,能快速决策;二是完成复杂任务,以及实现人机交互、安全长期工作。所以系统的节能和高效成为必要能力。
机器人只是众多AI应用的一种。这些AI任务目标都需要芯片提供计算,进而提升系统效率。
09.
博世王宏宇:未来传感器将具备
定制化、保护隐私等优势
此次会议上,博世亚太区总裁王宏宇侧重解读了MEMS(微电子机械系统)传感器的变革。
最初,MEMS传感器用作汽车领域,主要做一些读取数据的工作。现在,MEMS传感器也可以在手机上做一些简单的数据分析和提取工作。未来,该传感器将在loT行业迎来新的应用场景。
▲博世亚太区总裁王宏宇
在万物互联的情况下,MEMS传感器将被赋予AI学习的功能,因为传感器将要根据物体的环境变化做出相应的改变。当前博世传感器及其传感器套件已具有学习的功能,例如可识别用户指纹。
传感器的未来发展将会有着自己的优势,如能够实现定制化服务,能够实现隐私保护
当个人终端的传感器可以在本地处理数据,就能更好保护个人隐私。同时,实时接收和传输数据以及低功耗的特点都将助推传感器的发展,其应用的场景也将会不断扩展,离线模式与在线模式也将混合使用。
最后,王宏宇提出了一项假设,如果将气体传感器、环境传感器、以及定位传感器都安装在森林里,便可以实时监测森林的情况,提前防火防灾,也能帮助相应的救援行动。
10.
圆桌对话:探讨通用vs专用,
呼吁公平的市场竞争
在圆桌论坛环节,几位来自AI芯片创企的嘉宾围绕AI芯片的热议话题和发展方向进行思想交锋。
在AI发展之路上,芯片究竟是通用性更重要,还是专用性更重要?
对于这一问题,爱芯科技董事长兼CEO仇肖莘将其分为端侧、边缘侧和云端来看,通用性对于云端训练芯片格外重要云端推理芯片、边缘侧和端侧芯片现在相对更倾向于专用芯片,因为它们有功耗、面积、成本等问题的限制,更注重提升能效比。
天数智芯董事长兼CEO刁石京认为,任何事物发展都有其规律和过程,没有绝对的定论。很多AI算法还在完善,新的应用也在探讨,通用芯片有其灵活的优势,能够应用到各种场景,而当市场越来越成熟时,专用型芯片的优势将逐步显现。
▲从右到左参与圆桌对话的四位嘉宾分别是爱芯科技仇肖莘、燧原科技赵立东、天数智芯刁石京、武岳峰资本武平
看向AI芯片市场的未来,仇肖莘提到这个行业只有规模化之后,才能获得利润;只有获得利润,才能做先进技术的研发。中国芯片市场正处于百花齐放的状态,再过几年,行业在经历市场验证后,或许会逐渐走向整合。当前AI应用还处于早期阶段,AI真正的能力还没有完全发挥出来,大家都还在探索。
在燧原科技创始人兼CEO赵立东看来,未来的一切都将由市场需求决定。市场只有通过竞争,才能产生优秀的产品,为客户产生价值,从而实现公司的利润增长。同时,为市场提供一个良好的环境也非常重要。
他判断互联网行业、传统行业以及新基建都将成为未来AI芯片产业的突破口。首先,互联网行业仍在AI芯片产业占据绝大的市场份额。其次,AI芯片将赋能传统行业实现数字化转型和升级。最后,随着各地政策的颁布,新基建或智慧城市也将成为AI芯片广泛应用的重要场景。
刁石京从产业角度谈到非市场化竞争一定会造成资源分散,人心浮动。半导体行业真正的领军人才都是实干派,最需要经验的积累,人才需要从大学开始培养,再经过企业的锻炼,才能真正沉淀为一个领域的技术领袖。
他呼吁市场千万不能走向恶性竞争,唯有公平的市场竞争,才能让各家企业良好的成长与发展;也期盼政府方面能够给予大家适合发展的环境,让企业可以实现追赶战略。
11.
结语:AI芯片创新牵绊全球AI发展速度
在此次论坛中,来自芯片巨头和国内AI芯片创企新秀的嘉宾们分享了关于基础器件、架构创新及软硬件协同等技术创新与实践应用的观察。
我们看到,随着AI应用逐渐深入更多行业,AI芯片的市场空间正在不断拓宽。作为AI领域发展的硬件基础,AI芯片的研发创新将牵绊全球AI领域的发展速度。国内外芯片公司均不断探索如何赋予其芯片产品更强的AI计算能力,生态格局尚未稳固,未来无论是技术创新还是应用方向,都还有很多可能性。
本文福利:随着人工智能理论和技术的日益成熟,应用范围不断扩大,国内外企业纷纷布局AI芯片。推荐精品研报《AI芯片技术选型目录》,可在公众号聊天栏回复关键词【芯东西125】获取。
资料推荐

继续阅读
阅读原文