1968 年成立的英特尔崛起于 PC 时代,创办人之一的 Gordon Moore 提出晶体管数量每 18 个月会增加一倍的摩尔定律,从此成为半导体产业奉为圭臬的一个经典定律。


接棒 PC 时代的是数据中心、人工智能时代的崛起,这个新时代带来了两个趋势,第一是异构计算的重要性浮现,包括 CPU、GPU、ASIC、FPGA 等异质架构的计算单元; 第二个趋势是人工智能时代对于算力的增加,以及智慧互连带来爆炸性增长的数据量。

身为全球 IT 产业最伟大的公司之一,英特尔在引领产业变革的同时,也紧抓时代变革的脉动,在 2018 年成立五十周年之际,将公司
定位从以晶体管为中心,转变成以数据为中心,并提出六大技术支柱:制程、架构、封装、互联、软件、存储。
(图源:来自 intel)

摩尔定律带动的“硬件为王”失效,未来是“软件优先”

英特尔首席架构师,同时也是高级副总裁兼架构、图形与软件部门总经理 Raja M. Koduri 接受问芯Voice 专访时指出,
在六大技术支柱中,“软件”扮演的角色和重要性会大幅增加,未来的世界是“软件优先”。

据了解,英特尔在全球已经有 15000 名软件工程师,同时也拥有超过 1200 万个开发者的生态系统。


“软硬结合”的趋势,是反映出时代的需求。

过去 PC 时代的 x86 架构和 Windows 系统,推动了互联网的普及,全球有超过 10 亿用户的 10 亿台设备成功接入互联网。


再来是移动通信时代,Arm 架构与 iOS 和 Android 系统的结合,带动移动设备和云设备的需求增长,让互连设备数量暴增到 100 亿台,而这只是个开始,
未来的智能互联时代是要启动 1000 亿台设备的连结。

不过,
这样的智能互联时代是无法单靠硬件的效能来实现,因为摩尔定律放缓后,晶体管的数量无法像过去每 18 个月增加一倍,因此,单是靠半导体工艺来提升硬件效能,将十分有限,这时,软件扮演的角色重要性急剧升温。

(图源:来自 intel)
过去,
英特尔在两大领域一直保持领先 :制程技术和 CPU 架构 ; 未来,英特尔要做到在六大领域(制程、架构、封装、互联、软件、存储)都达到领先的目标。


因此,对于英特尔这样的硬件著称的科技巨头,也越来越开放性地谈论自己的“软实力”,让各界清楚看见在摩尔定律效应放缓之后,英特尔还能继续保持和引领创新的秘诀。


由上述的趋势推演, Koduri 对问芯Voice 的读者提出 SVMS 架构和 oneAPI 软件两大概念。


oneAPI:让每个晶体管都能派上用场

先前,我们提到异构计算架构包含了 CPU、GPU、ASIC、FPGA 等,而这些分别对应着
标量(Scalar)、矢量(Vector)、矩阵(Matrix)和空间(Spatial)四大计算架构,英特尔统称为“SVMS 架构”。

oneAPI 则是一个统一的软件架构,能跨越不同的架构、跨不同的硬件规格,让开发者可以随意在底层的硬件之间切换和优化,目的是让软件层面简化,并且统一“ SVMS 架构”,包含标量、矢量、矩阵和空间。

Koduri 进一步解释,oneAPI 是一个非常底层的抽象框架,未来面对不同计算元素,希望可以从底层有更好的完成,也是因为绝大多数的 AI 算法演进和创新都是在偏上层完成的,但是英特尔希望能从底层就开始驱动。


oneAPI 包含两个部分,第一是跨架构的编程语言 Data Parallel C++(DPC++),第二部分是满足不同领域需求的跨架构库的集合。


Koduri 表示,未来任何编程人员无论是想将硬件性能提升 10%、20%,甚至 50%,都可以在 oneAPI 框架上轻松实现,而不需要再自己编写语言。


如果要阐述 oneAPI 软件对于硬件效能的提升,
“让每一个晶体管都能派上用场”,或许可以成为 oneAPI 的终极目标,让英特尔在数据中心和人工智能时代,能尽情发挥竞争实力。

对于“软件优先”,Koduri 再次强调,摩尔定律虽然持续带来很好的性能提升,但透过“软硬结合”,可以让摩尔定律有十倍的提升,因为摩尔定律会带来更多的晶体管,而软件可以将越来越多的晶体管的极致性能释放出来。

至于软件带给硬件的效能提升,他也举例通过软件优化,Java 性能提升 6 倍、持久性内存的性能提升 8 倍、AI 领域的性能提升 28 倍,而且这仅是在同一款硬件上,通过软件就可以做到的。


总之,“软硬结合”是未来的趋势,巨大的机会,更是战略重点。


Koduri 也强调开发者社区生态,在芯片厂商中,英特尔一直是多软件开源社区的最大贡献者,未来在开源社区上的耕耘将着力更深,且与高校展开配合协作,结合他们的技术来打造一个完整的社区。


再者,英特尔在中国和全球都拥有相当庞大的开发者社区,将持续与个人开发者,或是大型的企业机构例如腾讯、阿里等紧密地配合,来支持 oneAPI 的生态。


(图源:来自 intel)
计算架构“新黄金十年” 启动

日前,图灵奖得主 David Patterson 提出未来十年是计算架构“新黄金十年”, Koduri 非常赞同此看法。


他分享,
未来 10 年将看到比过去 50 年有更多的架构优化和提升,在英特尔提出的 SVMS 架构中,下一步发展的突破点将会是在内存和互连上,因为当今产生的数据量实在太庞大,远超出一台计算机上就可以完全处理的承载和能力,因此,我们必须清楚要如何应对这些无法放进一台计算机的大规模数据的处理方式,这是挑战但也是巨大机会。

他也大大鼓励一个架构工程师现在投入工作,将会拥有非常棒的机会,因为接下来面临的是如何将性能提升十倍、百倍的挑战,而并不是简单提升 10% 的问题。


再者,Koduri 也进一步对问芯Voice 分析 SVMS 架构,分别对应着 CPU、GPU、FPGA、加速器等。


Koduri 提到,通过这个架构的分类方式可以看,CPU 是最通用的一种架构,而 GPU 会比 CPU 更加高效和专用, FPGA 和加速器的优势则在于灵活度更高,英特尔的策略就是要囊括这些所有的架构。


从英特尔的战略来看,CPU 仍旧是目前最重要的架构,策略在于不断提高每个 CPU 的性能,继续保持它作为最强的计算架构的位置。


在 GPU 方面,其战略地位是提高能效,以发挥整体的生产力和效率。


在 FPGA 领域,英特尔已经有目共睹地推出很多的重要 FPGA 产品。另外加速器方面,这会是英特尔非常重要的一个发力点。


整个来看,无论客户的要求是高性能、低功耗,或是成本敏感者,英特尔都能提供对应不同需求的产品线,
最终目的是“简化流程”,通过一个统一的软件栈,一个统一的 API 就可以适应客户从性能、功耗到成本上的优化需求,一言以敝之,就是“更简单一点”。

(图源:来自 intel)
Xe GPU 架构独立显卡是一大亮点
英特尔 2019 年宣布筹备已久的 GPU 提出 Xe 架构,并预计于 2020 年推出 Xe 架构独立显卡产品,绝对是一个重量级产品线。
其 Xe GPU 架构包含两个微架构,分别针对两种不同的应用场景:应对高性能和应对低功耗,且采用光线追踪技术。

英特尔预计新一代 Xe GPU 架构独立显卡是数据中心等级,预计将会对图像效果相关应用加强优化,并透过 Intel Rendering Framework 功能的 API 来支持硬件等级的光线追踪技术。


Koduri 进一步解释,在设计 oneAPI 之初就考虑到要发挥整个 Xe 架构最强的全面性能,不管是在高性能或是低功耗面向上。


当然,oneAPI 的设计也确保要符合英特尔所有其他不同计算和应用的需求,不管是 CPU、FPGA、加速器,oneAPI 的设计都可以进行非常完整的配合。


英特尔从 2017 年进入开发高性能独立显卡领域, Koduri 认为英特尔的优势是在集成显卡领域,也陆续将集成显卡的软件和技术借鉴到独立显卡上,尤其是数据中心的图形卡,同时把 CPU 软件和经验等应用在 GPU 技术的开发上,整体来看,最大的挑战是要为 2020 年上市的独立显卡准备成熟的软件,有很多前期工作要做。
在光线追踪方面, Koduri 表示,英特尔在该技术领域并不是一个新的玩家了,在整个好莱坞电影制作链条上,英特尔一直已是光追技术的领导者,过去 10 到 15 年好莱坞一直都在使用英特尔的软件和 CPU。
他进一步指出,光线追踪在内容制作产业有着非常棒的应用前景,目前主要用于游戏领域,但未来机会不止于此,应该将整个内容产业都覆盖。
英特尔发展光追技术的方式,首先是弄清楚现在已经用于内容制作的光追技术到底是如何使用的,这些经验也可以借鉴在 GPU 上,且围绕内容制作不同的应用场景,未来再推出更多软件解决方案,来满足不同应用场景的需求。

继续阅读
阅读原文