如果说要给科技圈这段时间传播最多的小道消息排个名次,其中 iPhone 14 系列排第一,么第二名肯定就是 RTX 40 系显卡了。
而就在北京时间 9 月 20 号晚上的英伟达 GTC 大会上,老黄终于带着他的 40 系显卡登场了!
但最让我没想到的是,显卡仅仅是这次 GTC 大会的小配角,只用了 20 分钟就讲完了。。。
剩下的一个多小时,只能用 “ 格局打开 ” 四个字来形容。。。
/ 第一部分 
4090、Ada 架构以及 DLSS 3 
先来聊聊大家最关注的新显卡,这次共发布了三款显卡,分别是 RTX 4080 12GB 、RTX 4080 16GB 和 RTX 4090 ,售价分别为 7199 元、9499 元和 12999 元。
一个字:贵。
尤其是 12GB 版本的 4080 ,上一代 3080 的售价可是 5499 元,你这涨得是不是有点过分了啊。。。
至于为啥这么贵,我们问了一下英伟达,他们的回答是:4080 12GB 的性能是 3080 12GB 的 3 倍,再结合价格四舍五入算下来其实还便宜100美元。
反正我是不太理解哪有这么比价格的,这么比的话苹果 M2 芯片岂不是可以卖个十几万。。。
不过性能也确实是提升了,其中 4080 16GB 的游戏性能提升可以达到 3080 Ti 的 2 倍,4090 和 3090Ti 相比同样有 2 倍的提升。
而如果拿开了 DLSS 3 的 4090 和开了 DLSS 2 的 3090Ti 对比,性能可以直接提升 4 倍。。。
DLSS 大家都很熟悉了,我们之前也讲过很多次,简单来讲就是可以提高你的游戏帧数,这一点在 DLSS 2 上面尤为明显。
而 DLSS 3 更是强到变态,它可以让开启了极致光线追踪的 《 赛博朋克 2077 》 帧数从 24 帧飙到将近 100 帧!
听说你是显卡杀手?那我老黄今天就非要治治你不可。
这也和 DLSS 3 的工作原理密不可分,如果说 DLSS 2 是降低渲染分辨率来提升性能提高帧数的话,那么 DLSS 3 则是直接在每一帧之间插帧。。。
但 DLSS 2 也不会被抛弃,它仍然是 DLSS 3 的一部分,会继续迭代。

而且有一件事需要注意,DLSS 3 可以独立于游戏内容生成全新的帧,甚至可以借此来帮助提升 CPU 的性能。。。
再说的直白一点,如果游戏因为 CPU 性能受限,那么 4090 可以帮 CPU 计算超过它上限的帧率。
不过已经买得起 4090 的人,还会买不起好的 CPU 吗。。。
当然,这么强的算力不止有 DLSS 3 帮忙,这次的 40 系用上了新一代 Ada Lovelace 架构以及台积电 4N 定制工艺。
这代架构以编写了世界上第一份程序的程序员命名,同时她也是英国诗人拜伦的女儿。
也许这就是理工男的浪漫吧,老黄他真的我哭死。。。
在新工艺的加持下,RTX 4090 塞进了足足 760 亿个晶体管,同时采用了全新的 SM 多单元流处理器。
这个处理器包含一个叫做着色器执行重排序 ( Shader Execution Reordering ) 的新技术,能够更好地利用 GPU 各项资源,将光追性能提高三倍。
除此之外,英伟达还搞了一款叫做 RTX Remix 的 MOD 软件。
它可以通过 AI 来帮助老游戏提升亿点点贴图清晰度。。。
然后一键打包成 MOD 上传,让玩家们手里的老游戏焕然一新。
这特么以后游戏厂家还高清重制个锤子了?这波简直要让每个人都能重制游戏啊。。。
恐怕,卡普空将成为本次 GTC 大会最大输家。
这次的新显卡看下来,简单来讲就是很强,但也很贵。
/ 第二部分 
元宇宙、自动驾驶和 AI 
是不是看到这个标题就已经开始困了?
实不相瞒,托尼看到后半段的时候也开始懵了,甚至已经有点超纲了。。。
不过咱们还是从相对来讲比较熟悉的 Omniverse 讲起,你可以把它看做是打造元宇宙的平台。
它既是一个数据库,也是一个计算平台,我们之前有提到过几次,你可以 点击这里 回顾一下。
不过说是元宇宙,其实 Omniverse 相比之下要实用得多,因为它已经可以帮助人们在工作和生产方面提高效率了。
无论是开发游戏、生产汽车还是进行仓库管理,你都可以用 Omniverse 平台以及衍生出来的各种应用进行设计和模拟。
举个例子,比如一个项目有多个不同岗位、不同团队甚至是不同时区的人共同完成,他们所采用的的软件自然也不一样。
而 Omniverse 则可以完整保存并共享这些不同软件的数据,直接来一波交互式协作。
这种协作适用于任何领域,比如视觉特效要用到的 Autodesk Maya 和 Adobe Substance 3D 、建筑行业的 SketchUp 和 CAD ,或者汽车行业要用到西门子和 Ansys 等公司的软件等等。
无论是渲染、物理模拟还是多人协作,Omniverse 都可以搞定。
你甚至可以用 Omniverse 提前模拟 5G 信号基站的覆盖情况,来优化信号基站的布局。。。
我看不懂,但我大受震撼。
而 Omniverse 也只是这次大会的一部分,英伟达干脆直接把自动驾驶都搬上来了。。。
自动驾驶基于一个新的计算平台 NVIDIA DRIVE Thor 打造,而从大会上面公布的视频来看,车辆不仅可以实现自动驾驶,也可以做到避让行人和并道等动作,整体看下来没啥毛病。
并且 Thor 不仅能负责计算自动驾驶系统的计算需求,还能同时负责中控台和辅助驾驶等工作,功能强大功耗又低。。。
而首个搭载 Thor 的汽车品牌将会是吉利汽车旗下的极氪。
英伟达还专门为医疗影像和机器人开发了一个低延迟成像处理平台 Clara Holoscan ,并表示像西门子和奥林巴斯等品牌都将在这个平台上进行开发。
对你没看错,英伟达和医疗看上去八竿子打不着关系的两个词,如今关联得更紧密了。
不过这部分托尼就不多讲了,医学领域超纲了属于是。。。
除了上面提到的,还有各种各样的技术和硬件,比如开源 SDK RAPIDS、学习框架 NemoLLM、数字生物学框架 BioNeMo 和大型开源推理服务 Triton 等等,看得我头都大了。。。
BioNeMo 
差友们没听说过这些东西很正常,因为它们基本都是面向企业的,发布会上有不少国内企业都露脸了。
比如微信就在使用 Merlin 端到端推荐系统,蔚来会使用 Triton 来测试自动驾驶模型,而美团也在用英伟达的图形神经网络框架等。
大家熟悉的企业,其实都在用英伟达的技术。
整个大会看完之后,托尼算是知道为啥显卡只用了 20 分钟就急忙发完了,合着卖显卡也就图一乐,真要赚大钱还得看汽车。。。
不只是汽车,还有元宇宙、医疗、仓库管理等多个领域,英伟达都有不同程度的技术涉猎。
这次的 GTC 也让大家认识到了一个不同的英伟达,它不仅仅是臭打游戏的人眼里那个卖显卡的,人家的技术力可比显卡要深厚得多。
这也是为什么我在文章的开头说英伟达格局打开,这次大会提到的各种技术,至少目前来看都能够让人们的生活和工作更加便利。
虽然最终大家的注意力还是会回到显卡上面,但在秀技术这块儿,英伟达这次的信息量属实是有点大,足够技术行业和友商消化一阵子了。。。
撰文:
百威   
编辑:
小鑫鑫   
封面:
焕妍

图片、资料来源:
NVIDIA 、Google

YouTube - @ElAnalistaDeBits
继续阅读
阅读原文