点击蓝字 关注我们
SUBSCRIBE to US
Image: Nvidia
Nvidia英伟达近日发布了全新的AI GPU,名为B200 GPU,这款GPU拥有2080亿个晶体管,性能高达20 petaflops的FP4马力。
Image: Nvidia
此外,它还表示,将其中两个GPU与一个Grace CPU相结合的GB200可以为LLM推理工作负载提供30倍的性能,同时也可能大大提高效率。英伟达表示,与H100相比,GB200可以将成本和能耗降低多达25倍。这意味着用户在保持高性能的同时,能够显著节省成本和能源消耗。尽管成本还有一个问号——英伟达首席执行官表示,每个GPU的成本可能在3万至4万美元之间。
英伟达声称,训练一个1.8万亿参数的模型之前需要8000个Hopper GPU和15兆瓦的电力。如今,其首席执行官表示,2000个Blackwell GPU可以在仅消耗4兆瓦的情况下实现这一目标。
在具有1750亿个参数的GPT-3 LLM基准上,英伟达表示GB200的性能是H100的7倍,提供了4倍的训练速度。
关键区别之一是第二代Transformer引擎,通过将每个神经元的位数从每个神经元的位数8位减少至4位(故称FP4的20petaflops),使计算、带宽和模型尺寸加倍这种拉高性能和效率的组合为用户提供了更好的灵活性和竞争优势。同时,由于能耗的大幅降低,用户还可以为环境做出积极的贡献,降低整体的碳排放量。
Image: Nvidia
总的来说,Nvidia的GB200提供了一种创新的解决方案,不仅可以显著提升性能,而且可以在减少成本和能耗的同时实现更高的工作效率。同时,由于能耗的大幅降低,用户还可以为环境做出积极的贡献,降低整体的碳排放量。
随着人工智能的广泛应用,对于高性能、高效率的GPU的需求也在日益增长。而英伟达凭借其强大的研发实力,不断推出满足市场需求的新品。B200 GPU和GB200的发布,无疑将进一步推动AI技术的发展,并满足更多复杂的计算需求。总的来说,英伟达的新品发布不仅展示了其在AI技术领域的领先地位,也反映了其对于可持续发展和环保的深刻思考。
微信号|IEEE电气电子工程师学会
新浪微博|IEEE中国
 · IEEE电气电子工程师学会 · 
继续阅读
阅读原文