在经典的计算机系统架构中,海量数据在存储和计算单元间高频移动,计算与内存的分离像极了每天上下班往返于五道口和南五环的你,长距离的交通不仅消耗着体能,增加了出行成本,碰上早晚高峰的公共交通,除了车厢里十分拥挤的个人体验,遇到“交通堵塞”还会严重影响到出行效率和生活质量。
而数据“算、存、传”一体的单元环境,就好比不仅搬到了公司对面,还规划了「专用廊桥,没有长距离的能量损耗,减少了传输的延迟,任凭室外风里雨里,也丝毫不会打乱你的发型。
从诞生之日起,计算机系统就是在冯 · 诺依曼现有的计算机系统架构下运行,依据冯·诺依曼理论,分为运算单元控制单元存储单元输入系统输出系统五个部分,计算与内存是分离的,计算单元从内存中读取数据,计算完成后再存回内存。而随着人工智能应用场景的爆发,数据海量增长,模型也愈加复杂和庞大,现有的计算机系统架构的短板逐渐显露,例如存储墙功耗墙等问题。
存储墙  

存储墙
冯·诺依曼架构的存算分离会导致外部存储器运行速度远远小于处理器的运算速度,系统整体会受到传输带宽瓶颈的限制,导致算力会远低于处理器标定的理论算力。
功耗墙
冯·诺依曼架构中,数据在处理器和外部存储器中频繁高速传递,这样的“搬运”带来了巨大的能量消耗,在传统架构下,数据从内存单元传输到计算单元需要的功耗是计算本身的上百倍,因此真正用于计算的能耗和时间占比很低。
总体来看,在目前的信息计算处理技术中,数据存储和计算需要由存储单元和中央处理器分别来完成。数据在二者之间“搬运”处理,耗时长、功耗大,还随时有可能“交通堵塞”。
而这种情况在隐私计算中“超级加倍”,在隐私计算多样性技术路线中(比如多方安全计算、联邦学习等),更大规模的数据量消耗了更大算力,计算的总耗时延长、加密后数据体量增大、通信成本增加....因此,隐私计算场景中更要尽可能地提高性能、降低资源消耗。
在计算机系统架构领域,为越过这“两堵墙”,除了材料的突破,还有一种方案跳出冯·诺依曼架构的思路,采用低电压亚阈值数字逻辑ASIC、神经模态(Neuromorphics)计算和模拟计算等新兴技术,而“存算一体”被认为是最直接高效的一种,也是目前能够最接近落地的技术
在隐私计算领域,数牍科技经过深入研究,借鉴计算机系统架构的“存算一体”的思想,将隐私计算核心算法、算子等进行功能抽取,通过采用如FPGA、ASIC、国产安全芯片等硬件方式进行模块化设计实现,将数据的处理尽可能多的集中在硬件内部完成,通过调用硬件的加速能力,使得现有计算平台的整体性能达到数量级的提升
相比于传统的加速卡和TEE,除借助硬件的可信环境和高速处理,数牍的解决方案中单独引入了物理隔离的通信通道,能够实现算法或算子的单独运行、数据的单独传输,从逻辑上封装了算法/算子的安全加速单元,完成数据的“算、存、传”的安全隔离处理,形成功能完备和使用独立的算法或算子单元进一步帮助解决计算不可信的问题
经过结合硬件的可插拔的特性,数牍的解决方案能够非常灵活的对一台通用的服务器进行能力改造,将之变为隐私计算专用服务器,从而也提高了服务器资源和算力的利用效率。国产化的设计支持也将进一步推动国产隐私计算系统在政务、金融、医疗等重点行业特殊关键场景的应用
据IDC相关研究报告显示,计算力指数平均每提高1个百分点,数字经济和GDP将分别增长3.3‰和1.8‰,作为承载数据安全流动的基础设施,隐私计算也将在在国产化、性能、安全等方面与数字经济时代同步行进。
*感谢数牍硬件团队对本文的大力支持
推荐阅读
继续阅读
阅读原文