本文来自“AI算力研究:英伟达B200再创算力奇迹,液冷、光模块持续革新”。318日,NVIDIA GTC 2024 召开,英伟达CEO 黄仁勋发布了 B200 GPU:集成 2080 亿个晶体管,采用台积电 N4P 制程,为双芯片架构,两块小芯片间互联速度高达10TBps;配备192GB HBM3E,存储 带 宽8TB/s AI 算 力 达 到 20peta FLOPS (FP4 精 度 ) , 而Hopper4peta FLOPS
1、全球AI芯片:英伟达 B200 FP4性能约为Hopper5倍,AMD/Intel加速产品升级
1)英伟达:B200 GTC2024 推出,FP4 性能约为 Hopper 5
B200 预计 2024 年晚些推出、售价 3-4 万美元,H200 预期 Q2 上市。据财联社,B200 GPU 售价或为 3-4 万美元,英伟达称,包括亚马逊云科技、戴尔科技、谷歌、Meta、微软、OpenAI、甲骨文、特斯拉和 xAI 将计划采用 Blackwell 产品。
1)机器人:推出了 GR00T 项目,为人形机器人提供了通用基础模型,也对 Isaac 机器人平台进行重大更新;2)自动驾驶:集中式车载计算平台 DRIVE Thor 将搭载专为 Transformer、大语言模型(LLM)和生成式AI 工作负载而打造的全新 Blackwell 架构;3)推理微服务 NIM英伟达提供预训练好的 AI 模型并开放 API(应用程序接口),再由行业客户开发应用,以简化企业自己开发生成式 AI 应用的成本,每个 GPU 每年收取费用 4500 美元。
2AMDMI 系列产品加速迭代,完成全产品系列 AI 效能组合
AMD 将推出换用HBM3e AI 加速器 MI300 改版,以低价与竞品英伟达 B100 竞争,其内存在速度上进一步提升;而下一代 Instinct MI400 加速器将于 2025 年发布,包含Mercury / Venus / Earth 三个代号、X / A / C 三种变体类别,可实现从云端到边缘、PC 和智能终端设备的新体验和突破性 AI 功能。
MI300 中国特供版芯片 MI309 或推出,但仍需关注出口禁令限制情况。3 5 日钛媒体,AMD 即将向中国客户销售 MI300 系列“中国特供版”AI 芯片,被称为 MI309,但是,美国政府目前不同意这款特供芯片出口到中国。截至 3 5日,AMD、商务部拒绝发表评论,尚不清楚 AMD 是否依然在申请许可。
3IntelGaudi 3 预期于 2024Q3 上市,Falcon Shores 预期 2025 年发布
英特尔将 Gaudi 3 Falcon Shores 定位为后续产品,两者都属于同一条产品线。据超能网,Gaudi 3 将改用 5nm 工艺制造,已进入实验室进行验证,Gaudi3 计划在 2024 年第三季度全面上市。硬件方面,Gaudi 3 加速器将采用与 Gaudi2 相同的高性能架构,不过计算能力是其 4 倍,网络带宽是其 2 倍,HBM 内存带宽是其 1.5 倍。Falcon Shores 是数据中心 GPU,采用多芯片模块化设计,同时会加入“可扩展的 I/O 设计”,Falcon Shores 计划 2025 年发布。
英特尔设立独立 FPGA 业务部门,新工厂极大提振 AI 芯片产能。3 1 IT之家,英特尔公司宣布以独立发展模式,正式成立 FPGA90(现场可编程门阵列)公司 Altera,并推出了包括 Agilex 9Agilex 7 F 系列和 I 系列、Agilex 5Agilex 3 等产品。其中,Agilex 5 现已广泛上市,是唯一注入人工智能的FPGA 结构,每瓦性能是同类产品的 1.6 倍,面向嵌入式和边缘应用。
2、国产GPU:英伟达将华为定义为公司竞争对手,景嘉微推出景宏系列AI芯片
海思 5nm 麒麟处理器在东莞、北京等地的验证情况良好,预计 8 月开始大规模交付;根据快科技,在英伟达近日向美国证券交易委员提交的正式文件中,首次将华为认定为人工智能芯片等多个领域的主要竞争对手。314 日,景嘉微推出景宏系列,是面向 AI 训练、AI 推理、科学计算等应用领域的高性能智算模块及整机产品。
3、GPU产业链:台积电3nm/4nm产能满载,Meta新建集群含超4.9万块 H100
AI 芯片带动先进封装,英伟达下一代芯片将采用台积电 3/4nm 制程,强劲订单推动先进制程产能满载、营收淡季不淡。
313日财联社,台积电 3 月对 CoWoS 设备厂再次启动新一波追单,交机时间预计为今年四季度。原本预计 2024 年底台积电 CoWoS 月产能将达到 3.2~3.5 万片,如今预期或超过 4 万片。
根据 TrendForce 集邦咨询最新预估,以 2024年全球主要云端服务业者(CSP)对高端 AI 服务器需求量观察,预估美系四大CSP 业者包括 MicrosoftGoogleAWSMeta 各家占全球需求比重分别达20.2%16.6%16%10.8%,合计将超 6 成。其中,又以搭载 NVIDIA GPUAI 服务器机种占大宗。
下载链接:
走进芯时代(76):HBM迭代,3D混合键合成设备材料发力点
走进芯时代(75):“半导核心材料”:万丈高楼材料起,夯实中国“芯”地基”
走进芯时代(74):以芯助先进算法,以算驱万物智能
走进芯时代(60):AI算力GPU,AI产业化再加速,智能大时代已开启
走进芯时代(58):高性能模拟替代渐入深水区,工业汽车重点突破
走进芯时代(57):算力大时代,处理器SOC厂商综合对比
走进芯时代(49):“AI芯片”,AI领强算力时代,GPU启新场景落地
走进芯时代(46):“新能源芯”,乘碳中和之风,基础元件腾飞
走进芯时代(43):显示驱动芯—面板国产化最后一公里
走进芯时代(40):半导体设备,再迎黄金时代
转载申明:转载本号文章请注明作者来源,本号发布文章若存在版权等问题,请留言联系处理,谢谢。
推荐阅读
更多架构相关技术知识总结请参考“架构师全店铺技术资料打包(全)”相关电子书(41本技术资料打包汇总详情可通过“阅读原文”获取)。
全店内容持续更新,现下单“架构师技术全店资料打包汇总(全)”一起发送“服务器基础知识全解(终极版)和“存储系统基础知识全解(终极版)pdf及ppt版本,后续可享全店内容更新“免费”赠阅,价格仅收249元(原总价399元)。
温馨提示:
扫描二维码关注公众号,点击阅读原文链接获取架构师技术全店资料打包汇总(全)电子书资料详情

继续阅读
阅读原文