英伟达下一个产品GB300,有什么启示?

走过不惑 社区 14

  来源:华尔街见闻

  GB300相比GB200,综合性能、可维护性、定制灵活性等方面都有明显改善。GB300的成功量产,是真正的里程碑时刻,意味着NVL机柜这种跨时代产品,真的被英伟达“完全工程化实现”了。

  针对上周五所谓“微软砍单GB200”传闻,今天卖方纷纷出来解释:

  MS:“供应链调查显示铜缆连接器的问题已经通过机柜重新设计解决了,首批GB200已经在最终测试阶段,12月正常发货。GB300的切换会在25H1设计完成后进行。” (大摩说的这个批次应该是改版前的批次)

英伟达下一个产品GB300,有什么启示?-第1张图片-特色小吃

  JPM:“过去几个月漏液问题一直是关键瓶颈,我们觉得到今天已经大部分得到解决。”

英伟达下一个产品GB300,有什么启示?-第2张图片-特色小吃

  大概可以判断,这些组装环节的“小问题”,不会让量产时间推迟太多。但有个问题值得注意,就是GB200和GB300的量产时间相差也就6个月。星球更新过GB300的时间表、详细指标。部分指标如下:

英伟达下一个产品GB300,有什么启示?-第2张图片-特色小吃

  主要区别:

HBM从8Hi到12Hi,因此每GPU的HBM容量从192GB提升到288GB

单卡功耗自然从1.2kW提升到1.4kW(Rubin会到1.8kW)。最神奇的是,通过所谓“power steering”,整个机柜的能耗依然保持在132kW不变!(单位算力能耗又又又又降低了)

通过新的ultra架构,带来单卡1.5倍的FP4性能提升

网卡从CX7升级CX8。CX8直接优点就是支持更大端口量的交换机,2层网络组网规模更大,意味着单卡网络能耗成本降低

GB200是每个compute tray2张GB200板卡,每GB200是1Grace CPU+2 GPU,而GB300是统一一张board,2Grace+4GPU,看似没区别,但主要变化是增加了内存模组和GPU socket,让组装替换更为灵活

超级电容和BBU(之前星球已经多条帖子详细介绍过)

  看完你会发现,GB300相比GB200,看似成本项目变化不大, 但综合性能、可维护性、定制灵活性等方面,都有明显改善。又回到了老黄的“分段迭代法”,多个微小的进步一相乘,系统提升显著。那么问题就来了:

  1. GB200和GB300的量产时间相差也就6个月,乍看起来,GB200显得有点短命....

  2. 但这不是问题,因为GB300说白了,就是GB200 ultra,或者叫GB200升级版。过去我们算GB200机柜数量,现在可以将GB200+GB300合二为一看待,整体去算机柜数量

  3. 着急的客户比如Elon Musk,价钱也要立即马上就要GB200,没问题。不着急的客户,或者说本来订单就很多、本来产能交付就排到了25H2的客户,完全可以等25H2的GB300。这可以叫“切换”,但其实总需求没变。

  4. GB200的ramp up过程,相当于给GB300趟路了,诸多“小问题”解决后,GB300将是一个更为成熟的完整版本。而GB300的成功量产, 才是真正的里程碑时刻,意味着NVL机柜这种跨时代产品,真的被英伟达“完全工程化实现”了。

  向上,继续去冲击288卡的1MW“怪兽”;向下,可以随意模块化组装GB300A、某地区阉割版GB30,游刃有余。大家可能会问了,会有GB30吗?看目前的形势,也不是没可能。

  本文来源:信息平权,原文标题:《英伟达下一个产品GB300,有什么启示?》

  风险提示及免责条款

  市场有风险,投资需谨慎。本文不构成个人投资建议,也未考虑到个别用户特殊的投资目标、财务状况或需要。用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

抱歉,评论功能暂时关闭!