作者
薛良Neil

邮箱
黄仁勋在 SIGGRAPH 2023 的主题演讲上透露了英伟达为降低生成式AI使用门槛所做的最新努力。
生成式AI是这次大会毋庸置疑的绝对主角,黄仁勋会上透露的在软件和硬件以及生态方面的更新,归结起来就是尽力降低生成式AI的使用门槛——促进大模型的真正落地。

“买的越多,省的越多”2.0 

硬件方面,英伟达推出了GH200超级芯片的更新版,或者可以叫它HBM3E增强版。它是世界第一款HBM3e 处理器。
通过英伟达NVLink技术,彼此互联的Grace Hopper超级芯片平台能够提供1.2TB的快速内存,由于HBM3e 内存比当前 HBM3 快 50%,平台总共能提供 10TB/秒的组合带宽。也就是说,其内存容量增加3.5倍,带宽增加了3倍,平台包括了一台具有144 个 Arm Neoverse 核心、8 petaflops 的 AI 性能和 282GB 最新 HBM3e 内存技术的服务器。它同时与早先在台北电脑展上公布的英伟达MGX服务器规范完全兼容。
数据中心的硬件正在快速向加速计算转变,这是黄仁勋一直在强调的一个趋势。相比CPU,GPU在能效上有很大的优势,黄仁勋演讲中举的例子是同样1亿美元成本,相比x86架构CPU,GH200将能提供超过20倍能效提升。
于是我们又听到了黄仁勋那句名言:the more you buy, the more you save. 买的越多,省的越多。
可以说也是不忘初心了。
黄仁勋现场展示的PPT显示,2500张GH200组成的数据中心相比CPU有20倍能效优势。
除了数据中心外,黄仁勋还发布了两套硬件,它们同样针对大模型而来。
一款是桌面级的RTX工作站,包括最多四个RTX 6000 Ada GPU,单个桌面工作站可提供高达5,828 tflops的AI性能和192GB GPU内存。
另一款是 OVX服务器,其中包括了8个英伟达L40S GPU,每个 GPU 配备 48GB 内存,可提供超过 1.45 petaflops 的张量处理能力。
作为对比,新的RTX工作站运行8.6亿个token的GPT3-40B需要15个小时,OVX服务器则只需要7小时。实际上,OVX服务器相比A100,推理性能提高了1.2倍,训练性能上提高1.7倍。其单精度浮点 (FP32) 性能是 A100 的近 5 倍。
英伟达L40S GPU
这些硬件的更新是有梯度的,黄仁勋演讲中也点的很明白:for everyone,英伟达在每个价格阶段上都为潜在客户准备了对应产品。
因此除了服务器和工作站之外,英伟达还同时发布了三款专业显卡——RTX 5000, RTX 4500 and RTX 4000,它们采用了Ada Lovelace 架构,在显存方面都有提升(RTX 4000有 20GB GDDR6显存;RTX 4500 为24GB;RTX 5000 最高为32GB ),这是英伟达显卡过去曾一度削弱的部分,而现在显存对于大模型来说无比重要。另外它们还使用了第四代Tensor Core,AI 训练性能比上一代快了两倍,并扩展了对 FP8 数据格式的支持。
这些硬件最终组成了一个矩阵,囊括了从企业级客户到个人用户。但在黄仁勋看来,想要触达每一个人,英伟达还需要一些“软工具”。

软硬兼施

距离黄仁勋推出 DGX Cloud 才短短几个月,英伟达在降低用户和开发者使用大模型门槛方面又有新的动作。
其中一项是非常好猜的,那就是和 Hugging Face 的合作。在此之前,Hugging Face 已经和包括 AMD 亚马逊云等在内的诸多巨头紧密合作,大家都看中了它集成开放模型的优势,英伟达也不例外。
“点击一下鼠标即可实现英伟达AI计算。”黄仁勋说,几个月前发布的DGX Cloud 和Hugging Face 平台集成到了一起。用户可以先在自己的电脑上启动项目,然后扩展到工作站和数据中心。
另一项名叫英伟达AI Workbench,开发人员可以直接在PC和工作站上创建、测试和定制预训大模型。这非常像国内的大模型预训练平台,把模型、框架和软件开发套件与库集合到了一个统一的开发人员工具包中,要说区别那就是AI Workbench能直接调用英伟达的算力资源,并且更好的支持英伟达的硬件——前面发布的那些工作站和服务器不用说都支持AI Workbench的本地测试和微调。
开发者原本需要分散在各处的大模型开发工具与流程,现在由英伟达AI Workbench整合了起来。
它的界面就是一个网站。截图可以看到,本地计算机使用的是消费级 4090 移动版显卡。
这极大简化了大模型的操作流程,实际上你只需要一台电脑就够了。
“每个人都可以做到这一点。”黄仁勋说道,某种意义上讲,这像是大模型的民主化。
另外一个旨在降低生成式AI部署门槛的服务是名为AI Enterprise 4.0的企业软件平台,主要针对企业客户。AI Enterprise 4.0包括了名为NeMo的大模型云原生框架和集群管理软件,帮助企业客户管理从云到数据中心再到边缘设备的所有AI解决方案,它会被集成到谷歌云和微软的Azure。

场景在哪里

大模型最近一个颇为引人争论的话题是,它的场景到底在哪里?
这对善于从第一性原理出发的老黄来说恐怕完全不是问题,一方面有硬件技术,一方面有软实力。英伟达的层次显然更高一点——不是找寻场景,而是打造生态。因为在英伟达看来,恐怕没有什么所谓“垂直场景”,一切都可以被生成式AI介入,承载它的是Omniverse。
元宇宙在黄仁勋这里不是一个过气的名词,而是连接虚拟与物理世界,并且极大开发生成式AI潜力的工具。在虚拟与现实的转换中,英伟达看中了名为Universal Scene Description,通用场景描述(简称OpenUSD)的潜力。
黄仁勋把OpenUSD对虚拟世界的重要性与HTML之于2D互联网的重要性相提并论。简单来说,你可以把OpenUSD理解成一套通用的描述3D场景的语言——这在过去往往需要非常复杂的流程和不同的工具才能实现。
有了这种通用语言,不同的人能基于同样的背景建构3D世界——也就是元宇宙的世界。
通过OpenUSD构建共同的3D场景——尽管来自不同的工具和平台。
显而易见,OpenUSD在英伟达的元宇宙愿景中占有重要地位,为此,Omniverse进行了多重升级。
一方面,黄仁勋推出了四个Omniverse Cloud API,方便开发人员无缝地实施和部署 OpenUSD 应用。
最吸引人的是一个名为ChatUSD的功能,顾名思义,它能通过问答形式帮助开发者生成3D模型,现场演示的例子中,你提出要求,ChatUSD可以直接给你提供Python-USD 代码脚本——直接使用它们就可以了!
另外使用了生成式AI技术的API名为DeepSearch,它是一个大语言代理(LLM agent),可以快速搜索无标记数据库的内容。
另一方面,Omniverse本身进行了大升级以更好支持OpenUSD,比如用少量的编码就能快速开发本机 OpenUSD 应用以及允许用户组建基于OpenUSD的大规模场景。
在英伟达看来,Omniverse 将因为OpenUSD而增强,它可以跨3D工具和应用进行对世界的虚拟,这意味着一种生态的搭建:既然大家都是用OpenUSD进行3D世界的建构,那么显然,数字孪生所需要的互联、互相操作可以以此为基础实现。
由此,英伟达的元宇宙生态——它被生成式AI和OpenUSD所加持——变得初具规模,Adobe Firefly可以作为 Omniverse 中的 API 提供给开发者,而许多业界知名的元宇宙和虚拟人开发者,Convai、Inworld AI和Wonder Dynamics都能够借助OpenUSD的通用标准与Omniverse实现连接。
英伟达对元宇宙的未来充满自信。波士顿动力正在使用Omniverse来模拟机器人交互,更多的工业自动化案例,包括沃尔沃、奔驰和宝马都是Omniverse的客户——在实际投入巨资建设一个昂贵的工厂之前,它们在Omniverse的虚拟世界里检查和测试物理世界的方方面面。

步入融合

生成式AI热度不退,英伟达当然更有理由为其添一把柴,老黄是个尽职尽责的商人,发布会上他说的最后一句话还是 the more you buy, the more you save.  足见其不忘初心的商人本色。
而想要让自己的硬件卖的更好,股价再创新高,英伟达一面需要不断迭代产品,提升性能,打造更丰富的生成式AI产品矩阵,另外一方面还要进一步降低大模型的使用门槛——后者甚至只有英伟达才能做到,它踩中了一个绝佳的点位,图形。
为了让机器生成图像,人类花了几十年时间,最终英伟达开发出了显示卡,而现在的事实证明,适用于图形显示的并行计算恰好也适用于生成式AI,而虚拟世界也需要更强大的图形技术和人工智能的帮助。
黄仁勋在演讲刚开始的时候就举了个例子:来自全球最大广告公司WPP的艺术家通过Omniverse运用多种支持OpenUSD的工具创建了比亚迪汽车的数字孪生版本——全球100多个地区的营销活动基于这些生成内容。
五年前的SIGGRAPH大会,英伟达发布了支持光线追踪的GPU,那时恐怕没有人会想到,人工智能,虚拟世界,加速计算,云,它们会以如此迅猛的速度逐渐融合为一体。
一场聚集人工智能产业头部公司与顶级资本的对话
点击下方图片即可报名参加活动
品玩招聘作者,资深作者及编辑,并长期开放实习生招聘。

世界不平静,我们希望在变动的技术周期和商业周期里继续我们的探索,不熄灭眼里的光。
为了和更多个优秀的你一起记录和改变这个激动人心的时代,做更多有价值的报道,品玩现开放招聘。
岗位信息:全职:4人。实习生长期招聘。工作地点:北京。
一句话总结我们在招聘的岗位的工作内容,就是:
报道最重要的商业和技术新闻,并抽丝剥茧地解释给读者它们为什么重要。
一些共同的岗位要求:
1. 尊重常识。
2.对好内容有感知,有选题发明能力。
3.掌握快速搜索梳理信息的方法,有较强的文献阅读能力,能独立拓展相关资源。
4 英文流利。有阅读英文内容的习惯,可以用英文完成沟通。
5.对真实世界有感知,心智成熟,有职业精神,沟通界面良好稳定。
在招岗位:
-新经济作者、新技术作者
新经济作者负责报道互联网商业领域最新动态;新技术作者负责报道新技术领域(AI,芯片,机器人等)最新动态;
追踪钱的流动,人的变化,商业世界的竞争与合作以及科技的变革,并把它们讲述给我们的读者;
不限工作经验,不限专业背景,我们欢迎不同背景的候选人。
-资深作者/编辑
对互联网商业领域或新技术领域有自己的研究和积累;
有自己获取信息的方法体系,有持续学习的能力;
能发明选题,撰写深度文章,同时也可以辅导初级作者。
长期招募实习生
我们为实习生提供与全职同样的指导与工作支持,并提供留用机会。
或者,以上的描述都不能定义你,但你认为你是我们需要的那个人,也可以发邮件给我们,介绍你自己。
以上岗位应聘者,请将简历及作品发送至:[email protected] 。(请标明应聘岗位)
同时,我们也在招聘其他岗位:
运营部门
岗位信息:全职:3人。实习生长期招聘。工作地点:北京。
内容运营
能够敏锐的捕捉互联网热点,并将其转化为出色的内容;
富有创新意识和强烈的主观能动性,重视流量在工作中的重要性;
有自己独特的数据分析方法论,能发现庞杂数据中的关键点,并反哺内容创作。
视频运营
具备视频的全流程的创作能力;
对各个内容平台均有深刻理解,能抓住平台规则红利;
有自己独特的数据分析方法论,能发现庞杂数据中的关键点,并反哺内容创作。
社区运营
有过国内外成熟知名社区的运营经验;
能够独立承担运营策略、节奏设计,结合运营目标、节点资源等因素制定精细化的社区运营规划;
对UGC的热点、流行趋势、话语体系有充分理解,能够通过创意、热点玩法、活动策划激发UGC参与。
长期招募实习生
我们为实习生提供与全职同样的指导与工作支持,并提供留用机会。
运营岗位应聘者,请将简历及作品发送至:[email protected] 。(请标明应聘岗位)
商务部门
销售总监/高级销售经理
岗位职责:
1. 负责品玩线上广告、线下活动类、品牌营销、市场公关、以及定制方案的商务拓展与销售工作,通过对目标行业客户的销售完成指定收入目标;
2. 对目标行业客户进行研究、识别、接洽、需求、分析、产品演示、方案规划、谈判与签约;
3. 管理与维护指定客户(包括新客户与现有客户),提供优秀的售前与售后服务,建立长期、稳定的合作关系,对客户产品和需求进行持续性的研究与开发;
4. 与各部门保持紧密合作,回馈客户需求与最新行业动向,协助优化产品与服务;
5. 积极参加行业商务与社交活动,拓展人脉资源,持续了解与提升行业知识和洞察力
任职要求:
1. 互联网销售经验2年以上,销售经验5年以上优先;
2. 做事严谨、细心,较强的沟通协调能力;
3. 有市场营销、品牌方或者市场公关乙方工作经历优先;
4. 自我驱动,有很强的学习行业知识及专业知识的能力;
5. 具备应变能力,团队协作能力,能适应多任务处理及工作压力;
6. 拥有intel、华为、华为云、阿里、阿里云、高通等互联网行业直客资源者优先。
更多招聘信息,可以进入官网招聘页面获取。
期待品玩有你的加入。

· 文章版权归品玩所有,未经授权不得转载。
· 发送关键词 转载合作招聘 到品玩微信公众号,获得相应信息。
· 您亦可在微博、知乎、今日头条、百家号上关注我们。
继续阅读
阅读原文