知存科技的芯片已完成10多个产品原型,部分已经量产。
 | 杨逍
封面来源 | 视觉中国
近日,36氪获悉,存算一体芯片公司知存科技宣布完成1亿元B1+轮融资,本轮融资由深创投领投,国开科创跟投,指数资本继续担任独家财务顾问。今年1月,知存科技才获得领航新界领投,天堂硅谷、瑞芯投资跟投的2亿元B1轮融资。截至目前,知存科技B轮系列融资已累计达3亿元。
知存科技成立于2017年,专注于存算一体芯片研发。知存科技已发布和量产了存算一体加速器WTM1001、存算一体SoC芯片WTM2101两代产品,其中WTM2101芯片与主流数字NPU、DSP相比,在同等功耗水平下,算力可提高数十倍,主要运用于智能语音、智能健康和轻量级视觉市场。
知存科技
在传统的冯·诺依曼结构中,存储和运算是分离的,CPU/GPU访问存储器的速度决定了系统运行的速度。随着半导体技术快速发展,CPU/GPU运算速度已远远超过访存速度,出现存储墙问题,基于传统冯·诺依曼结构的电子计算机难以满足数据处理更快速度、更低功耗的需求。
于是,存内计算概念诞生了。存内计算芯片的计算可以直接在存储器上进行,以新的运算架构进行二维和三维矩阵乘法/加法运算,可极大幅度消除数据搬移带来的数据传输缓慢、功耗高、搬运能耗大等问题。此外,它还可以使用存储单元直接参与逻辑计算,提升芯片算力。
存算一体有着近存计算、存内计算、 存内逻辑等多种技术路线。其区别在于,存内计算的计算可直接利用存储单元完成计算和存储两个功能,近存计算则是通过2.5D/3D封装技术将存储器和计算单元的距离拉近。知存科技是多元化存算一体技术公司。
二代芯片产品量产时间减半
2022年1月,知存科技宣布了存算一体SoC芯片WTM2101正式量产,并于3月推向市场,近期已有包含WTM2101芯片的产品上市。算力可达到50Gops ,功耗仅5uA-3mA,可应用于智能语音、智能可穿戴设备等多种应用场景,满足上百条命令词连续识别、AI通话降噪、实时健康、人形和凝视检测等多种功能,具有低功耗、高算力、多应用的优势。该芯片采用1.8M非易失性存储计算单元,可同时运行2-3个高性能模型,该芯片采用WLCSP封装技术,仅2.6mm*3.2mm大小。
首颗量产存算一体SoC芯片WTM2101
知存科技创始人兼CEO王绍迪告诉36氪,相较于知存科技第一代产品WTM1001,WTM2101在性能上有着10倍以上的提升。此外,WTM2101的研发时间仅用了两年时间,远低于WTM1001的4年研发时间。知存在明年会推出新一代存内计算芯片,算力将比WTM2101提高600倍,研发周期进一步缩短。
知存科技创始人兼CEO 王绍迪
研发时间缩短背后,是知存科技在存内计算芯片上的积累,上一代产品让知存科技产品跑通了存内计算芯片的量产过程。
存内一体芯片的难关
存内计算有着极高的技术壁垒。一家存内计算公司想完成一款芯片设计,需克服多个难关。
首先,需要选择正确的材料。
可用于存算一体的成熟存储器有FLASH、SRAM、DRAM、ReRAM、MRAM等多种介质。但从生产层面,没有一种存储器或工艺有针对存内计算进行优化,行业从业者需对多个路线进行尝试,选择其中一条方案。
王绍迪告诉36氪:“真正了解存内计算芯片、且有研发经验的人非常少。如果从材料角度,企业可从密度、计算功耗、精度等角度选择材料,但在怎样用集成电路设计架构和量产这两个问题上,什么材料有缺陷,缺陷是否克服,必须亲自经历一遍才能有所了解,寻找做出成品可能性最大的材料。”
从2012年到2017年期间,知存科技CTO郭昕婕用了4、5年时间研究各类材料,尝试了从ReRAM到Flash的各种存储器材料,直到2016年终于研发出了第一颗存内计算芯片。王绍迪告诉36氪,这也是国际上第一颗可用于3层以上深度学习的存内计算芯片,仅郭昕婕的实验室取得成功。
知存科技CTO 郭昕婕
其次,整个芯片设计过程有多重难关。
在设计上,存内计算的设计方式与传统数字电路完全不同,它不采用逻辑门设计,且主要通过存储单元做计算,市场上没有成熟的设计方法。且整个设计过程,传统芯片可通过EDA等工具辅助数字芯片设计,而存内一体芯片没有可购买的EDA工具。需要工程师通过一次次调试积累经验,转化成设计方法,开发自有工具,再不断迭代升级。
在工艺层面,晶圆制造厂没有针对存内计算的专门工艺,企业需持续与晶圆厂合作优化工艺。王绍迪分享到,存内计算的工艺并不复杂,只是关注点与传统存储器不同,传统存储器非常注重的工艺点对于存内计算并不那么重要,但与此同时传统存储器不在意的一些工艺偏差,就可能会让存内计算出现良率下降。并且整个工艺调整过程难度高、时间漫长。如果做一个新的技术节点工艺,需至少提前3年开始研发,且一次技术迭代就需要至少一年时间。
知存科技用了多年时间把芯片材料选择、芯片设计、量产过程中的坑都趟了一遍,针对新工艺和新产品的研发做了多年pipeline的规划,这也是其二代芯片产品的研发时间仅一代产品一半的原因之一。
打造通用芯片
在产品定位上,知存科技希望将其产品打造成通用性芯片,构建生态,将产品用于更多领域,如移动终端、IPC、AR、 VR、 显示 、车载、AloT等场景。
据王绍迪介绍,知存科技正打造第三款存算一体产品,第三代相较于第二代产品算力会提高600多倍,单核能效提供10倍。第三代产品的架构将持续使用至少5年时间,为终端客户、开发者提供稳定的产品架构和开发生态。
在王绍迪看来,知存科技正处于打磨产品、稳定架构、着重打造应用场景、初步建立生态的关键时期。基于知存科技已有的开发方案,公司可以在1-2个月时间内为客户完成开发,客户自行开发也需2-4个月时间。之后,知存科技将继续打造更好的开发工具链,打造标准化存内计算产品,推出不限场景、易开发、成本优惠的产品。
知存科技的芯片已完成10多个产品原型,部分已经量产。
在创始团队上,创始人兼CEO王绍迪毕业于北京大学微电子系,在UCLA电子和计算工程学院取得硕士和博士学位;联合创始人、首席科学家郭昕婕博士2011年在美国加州大学圣塔芭芭拉分校(UCSB)攻读博士,成为制备国际首个ReRAM器件和存算阵列的Dmitri B. Strukov教授的第一位博士生。自2012年起开展Flash存算一体研发,曾于2016年完成国际首个Flash存算一体计算芯片验证。2017年,郭昕婕博士又进一步攻下7层神经网络的浮栅存内计算深度学习芯片,并作为第一作者将这一成果发布在IEEE电子器件大会(IEDM 2017)上。也是在这一年,国际上开始大力资助存内计算技术的研发,十多家初创公司成立,众多国际顶级半导体公司,类似Intel、IBM、美光等在该领域投资布局。
目前,知存科技超过80%人员为研发人员,有着专业学术背景或知名半导体企业工作背景,平均10年以上行业经验。知存的研发团队稳定且合作紧密,过去几年中,他们已经逐渐成长为了一支独有的存算一体芯片产业化团队,兼具工艺、设计、量产、软件能力,同时拥有顶级行业合作伙伴。
继续阅读
阅读原文