因此,NVIDIA的新AI怪物已经淘汰,所有它的全部2080亿晶体管。立刻,这引发了一些棘手的问题,即Nvidia即将到来的Blackwell RTX 50系列图形芯片将看起来像什么。
从游戏图形的角度来看,NVIDIA新的AI GPU的许多技术性与无关紧要。但是,NVIDIA Blackwell AI发布会有两个关键信息。首先,它使用现有的TSMC N4节点—尽管不是新的TSMC N3节点之一。其次,它使用多-DIE工程,其中两个芯片组成了一个Blackwell AI GPU。
同时,这在大约八个不同的层面上都很有趣。因此,让我们尝试分解一些问题。这全都与晶体管密度,生产节点,收益率和成本有关。
RTX 4090中的当前AD102 GPU是使用自定义TSMC 4N节点上的单个模具创建的。TSMC N5和N4本质上是同一节点的变体,其规格大致相似,例如晶体管密度,标线限制等等,并且此自定义过程基于这些。
现在,AD102是760亿晶体管GPU。它的前身RTX 3090中的AD102芯片包含450亿晶体管,RTX 2080 Ti中的Tu102仅是190亿晶体管。因此,您可以看到晶体管计数如何与每一代相提并论。同时,新的Blackwell AI GPU中的每个人都死亡是10040亿晶体管,据说是在TSMC N4节点上可能的限制。
围绕即将到来的RTX 5090图形卡的当前谣言声称它将摇滚175 SMS或流式传输多处理器。对于上下文,RTX 4090或AD102具有128 SMS。完整的AD102芯片实际上有144个SMS,有些削弱了可提高生产率并降低成本。仅启用128个SMS,这意味着在RTX 4090板中仍然可以使用一些AD102死亡。
无论如何,如果您与Blackwell采用了类似的方法,则GB202芯片将需要超过175 SMS,因此需要超过1000亿个晶体管。问题在于,新的Blackwell GPU中的10040亿晶体管死亡是TSMC 4N工艺可能的限制。
这与称为标线限制的东西有关,这决定了最大的模具大小。Nvidia说,新的Blackwell死亡是有140亿晶体管的限制。一些基本数学表明,启用了175个SMS的RTX 5090将需要更大的晶体管计数。
此外,即使可以将175个启用的SMS挤入10040亿晶体管中,对于AI GPU以数万美元而出售的AI GPU也不适用于游戏GPU,这是有意义的。问题在于,按照定义,GPU将其向右推向标线限,这意味着低收益率和高生产成本。对于具有巨大利润的AI GPU,可以忍受,但对于游戏芯片来说根本不可忍受。
如果这都是准确的,则有两种可能的解决方案。一个,Nvidia使用Blackwell GPU与Blackwell AI GPU一起使用相同的双DIE安排。或选项二,NVIDIA使用更高级的TSMC N3节点进行游戏GPU,从而使单盘芯片远超过1000亿晶体管。
目前看来不合理的是Blackwell Gaming GPU,例如,在TSMC 4NP硅上的单个芯片中,有1,200亿晶体管。实际上会发生什么,Nvidia以外的人肯定会知道。
可以说,NVIDIA信息中最可靠的泄漏者是Twitter帐户Kopite7Kimi。该帐户昨天声称,RTX 5090中的GB202 GAMING GPU将与新的Blackwell AI芯片处于同一硅过程。鉴于TSMC N3是如此的新事物,这是有道理的,这将是一个很大的要求,与N3上的巨大的GPU一起使用超过1000亿晶体管的GPU。毕竟,如果N3准备好了1000亿以上的晶体管GPU,那么Nvidia肯定会将其用于新的AI芯片?
如果这是真的,那么关于RTX 5090的传闻信息似乎正处于某种冲突中。175启用SMS似乎没有使用TSMC N4硅进行计算。除非,也就是说,RTX 5090和GB202 GPU是双重死亡的,就像Blackwell AI芯片一样。
但是,多野事并不直截了当。仅仅因为NVIDIA可以为AI GPU做出多-DIE工作,这并不是因为它破坏了游戏图形的问题,在这种图形上,死与die延迟绝对至关重要。
在任何人建议使用Radeon RX 7900 GPU对AMD进行管理之前,为什么不为NVIDIA,AMD的多-DIE解决方案完全不同。在NVIDIA将其Blackwell AI GPU的计算心脏分为一半的地方,AMD将所有实际的图形处理都保存在一个GCD芯片中。只有内存控制器和缓存被分成模具。
更重要的是,谣言使整个多野事事实证明对AMD如此困难,它跳过了高端的下一代GPU,而是赞成坚持中端卡片,而最终使多-DIE的方法换成了一代人的多-DIE方法。多-DIE游戏GPU似乎很难正确。
当然,您可能会说,对于大多数不会购买RTX 5090的游戏玩家来说,这都是很明显的。在Blackwell Gaming堆栈中,对于诸如假定RTX 5060,RTX 5070和RTX 5080的GPU,这些问题实际上消失了。
RTX 4060、4070和4080系列图形卡中的现有GPU并不那么庞大,以至于使用TSMC 4NP Silicon上的Blackwell Architecture创建更大,更强大的更新是令人难以置信的。
确实,Nvidia甚至可以去三星进行一些更主流的RTX 50系列,尽管三星没有节点可以应对RTX 5090的1,200亿晶体管芯片。
无论如何,关键是实际上只是潜在的RTX 5090大BOI,似乎有一个涉及过程节点,模具大小和多型技术的紧缩点。TSMC的4NP流程能否在单个模具上实际交付175 SM启用RTX 5090?TSMC N3也可能没有准备好这么大的芯片。但是,多野也不容易。无论结果如何,RTX 5090都会非常有趣。而且很可能很昂贵。但是,NVIDIA平方这个技术圈子,似乎解决方案将是昂贵的。
至于对实际发生的事情的预测,这是一场危险的游戏。我要说的是,RTX 5090很可能已经启用了175个SMS,并且很可能在TSMC 4NP硅上。但是,如果是这两种事情,那么很难看到Nvidia如何使用一片硅将其拉开。观看这个空间!
本文来自作者[怜雪]投稿,不代表信基号立场,如若转载,请注明出处:https://njxjfs.cn/zlan/202504-1826.html
评论列表(3条)
我是信基号的签约作者“怜雪”
本文概览:因此,NVIDIA的新AI怪物已经淘汰,所有它的全部2080亿晶体管。立刻,这引发了一些棘手的问题,即Nvidia即将到来的Blackwell RTX 50系列图形芯片将看...
文章不错《NVIDIA的New Blackwell AI GPU提出了有关其下一代RTX 50系图形卡的一些棘手问题》内容很有帮助