3月14日至4月28日
C600早鸟预售
限时优惠
还有最后一周!
面向在校学生及教师的
C600开学季限时优惠
也将于届时结束申请
扫描识别图中二维码或点击阅读原文
申请预购
Graphcore为云和数据中心打造的高端推训一体加速卡C600主打推理,兼做训练,可以支持各种主流的AI应用,在搜索和推荐等业务上别具优势。每张C600使用单颗IPU处理器。在Graphcore经典的Wafer-on-Wafer MK2 IPU的基础上,C600增加了用于低精度和混合精度AI的FP8。C600可搭配市场上主流的AI服务器使用,比如浪潮NF5468M6等。
在生成式模型上,C600不仅能够保证较低的延迟和较低的能耗,同时具有能够快速迁移模型和软件栈易用性好的特点,这些优势不仅可以在实时应用场景下提供更高效的服务,还可以降低模型部署和运行成本,为人工智能的发展提供更多可能性。如今,GPT家族模型中,十亿级参数的GPT-2已经在C600上成功部署。在C600上GPT2-XL的推理延时已经达到1 ms/token的水平。
欲了解各类模型在C600的优异性能,请联系[email protected]
获取更多Graphcore资讯,阅读深度技术文章,并与其他创新者们一起交流,请至中国官网graphcore.cn,以及关注Graphcore微信、微博和知乎创新社区。
Graphcore中国官网
Graphcore官方微信
Graphcore微博创新社区
Graphcore知乎创新社区

继续阅读
阅读原文