来源:内容半导体行业观察(ID:icbank)编译自wccftech,谢谢。
最近,博主Kopite7kimi英伟达旗舰芯片报道 NVIDIA Ada Lovelace GPU SKU 详情,这使得它看起来像是有史以来最强大的终极图形芯片。指出谣言,NVIDIA Ada Lovelace 旗舰 GPU 采用 AD102-450 GPU,具有 18176 个内核、48 GB“24 Gbps”GDDR6X 显存和 800W TBP.
这不是第一次说这么高端了 Ada Lovelace GPU SKU。之前的传闻也来自同一个泄密者,它报道说 Ada Lovelace GPU 在队列中 Titan-Class 显卡,这个显卡有一些疯狂的规格。再一次,这没有完全启用 AD102 GPU,虽然前面提到的变型具有完整的 18432 CUDA 内核的 900W TBP SKU。
根据传闻的规格,这种图形卡将采用 Ada Lovelace 该架构的配置略有减少“AD102-450-A1”,在 18,432 个 CUDA 内核(18432 个 CUDA 中)上摇摆 142 个 SM(144 个 SM)核心)。基于大约 3 GHz 时钟速度,这个显卡很容易突破 100 TFLOPs 计算障碍。据说显卡配备了 48 GB GDDR6X 内存,运行在 384 在位总线接口上。
有趣的是,NVIDIA 不会坚持 VRAM 规格,相反,使用最新的 24 Gbps 存储器模数,为 GPU 提供高达 1.152 TB/s 的 VRAM 带宽。与具有 21 Gbps 芯片的现有存储器 RTX 3090 Ti 与旗舰产品相比,内存带宽增加 14%。即将推出 RTX 4090 预计也将使用相同的 21 Gbps 存储器片,唯一旗舰“Ti”模型获取 24 Gbps 芯片。
功率消耗,新的NVIDIA旗舰AD102 GPU开车的显卡会疯掉,其TDP几乎是RTX 3090 Ti的两倍,额定功率高达800W。考虑到单身 16 只能提供针头连接器 600 瓦特功率,如果它成为现实,这个卡牌怪物你得用double 16 引脚连接器配置。显卡都可以 PG137-SKU0。
基于 Ampere 阵容,我们明白了 NVIDIA 它不仅没有释放 Titan 显卡,并充分利用它 BFGPU 级 GeForce RTX 阵容更换了 Titan 系列。更高容量的卡仍然可以用作工作站 RTX Axxx系列发布,也已经完成 GA102 处理,但除了RTX 3090 Ti和RTX A6000之外,没有 Titan 级。那么 Titan 级 GPU 对 Ada Lovelace 有意义吗,或者这个特别的 SKU 最终会成为下一代游戏 BFGPU 还有工作站?好吧,我们不能确定,但有一点绝对是真的,这样的 GPU 配置规范、而且功耗和价格真的很疯狂。如果卡涉及零售,肯定会的RTX 4090之后,预计将于今年秋季晚些时候亮相。
Nvidia Ada Lovelace 和 GeForce RTX 40 系列:我们知道的一切
Nvidia 的 Ada 架构和 GeForce RTX 40 系列显卡预计今年年底上市,并且可能在 9 月至 10 在几个月的时间范围内——发生在Nvidia Ampere 未来两年的建筑,考虑到摩尔“定律”的放缓(或者如果你愿意,死亡),Nvidia的发布步骤基本按计划进行。与今年早些时候的Nvidia 被黑客攻击,我们得到了很多关于预期结果的信息。我们已经收集了这里所有的内容,详细介绍了我们对 Nvidia 的 Ada 架构和 RTX 40 家庭知识和期望。
现在流传的谣言很多,但是英伟达几乎没有公开它的权利 Ada 的计划,有人称之为 Lovelace。我们知道的是,Nvidia 详细介绍了其数据中心Hopper H100 GPU,我们怀疑,就像Volta V100和Ampere A100一样,产品将于近期跟进。
最后一个可能是预期的最好样本。A100 于 2020 年 5 6月正式发布,消费级 Ampere GPU 以RTX 3080和RTX 3090在表单发布后大约四个月。如果 Nvidia Ada Lovelace GPU 遵循类似的发布时间表,我们可以期待 RTX 40 系列将在 8 月或 9 这个月的某个时候到达。让我们从 Ada 系列 GPU 传闻中的规范的高级版本的预览开始了。
首先,根据天气预报,GPU 提供的范围介于 1.6 到 2.0 GHz 暂定时钟速度估计值,这与 Nvidia 之前的 Ampere、Turing 甚至 Pascal 一致的架构。Nvidia 完全有可能超越这些时钟,因此,我们认为这是保守的估计。
我们假设 Nvidia 将在所有 Ada GPU 上使用 TSMC 的 4N 工艺——“4nm Nvidia”,这在技术上可能又是不正确的。我们知道 Hopper H100 用TSMC的 4N 节点,这似乎主要是为了TSMC N5 节点的调整变量,这种节点已经广泛应用于苹果的智能手机和笔记本芯片,有传言说,Nvidia 将此节点用于 Ada。值得一提的是, AMD也可以将它用于Zen 4 和RDNA 3。
坦率地说,节点的名称不像实际的名称 GPU 规格和性能如此重要。换句话说,“任何其他名字的玫瑰都会很香”。工艺节点的名称与芯片上的物理特性有任何实际联系的时代早已过去。在 250nm(或 0.25 微米)芯片实际上有一个功能,可以指向并显示在 0.25um 当测量一个元素的宽度时,在过去的几个工艺节点中,芯片的物理尺寸已经降低,他们现在只是营销名称。
晶体管的数量是目前最好的猜测。我们确实知道 Hopper H100 将拥有 800 十亿个晶体管(这实际上只是一个近似值,但是我们会继续使用它)。A100 GPU 有 560 十亿个晶体管,是 GA102 消费级 halo筹码数量的两倍,但是有迹象表明 Nvidia 将在 AD102 GPU 上“做大”,并且它的大小可能更接近 H100,而不是 GA102 . 如果有可靠的信息,我们将更新这些表格,但目前,任何关于晶体管数量的说法都只是与我们不同的猜测。
理论上,根据我们目前所看到的“泄露”信息,Ada看起来像个怪物。随着水流 Ampere GPU 相比,它将包含更多 SM 和相关内核,这将大大提高性能。即使 Ada 少于声称的最终泄漏量,诚然,我们会看到顶部 GPU 的性能——也许是 RTX 4090,尽管 Nvidia 可能会再次改变命名——但是无疑地,新产品将会是领导者RTX 3090 Ti 向前迈进了一大步.
例如,RTX 3080 在出版的时候 RTX 2080 Ti 差不多了 30%,而 RTX 3090 又增加了 15%,至少如果你服用 4K 超分辨率将 GPU 推到极限。这也是需要牢记的一点。如果您当前运行的是更适中的处理器,不是绝对最好的游戏 CPU 之一(Core i9-12900K或Ryzen 7 5800X3D),这意味着即使在 1440p 在超分辨率下,你也可能会限制 CPU。为了充分利用最快的 Ada GPU,可能需要更大的系统升级。
在推出高级版本后,让我们进入细节。
一 ADA 将大大提高计算性能
与当前 Ampere 代相比,Ada GPU 最显著的变化将是 SM 的数量。据猜测,AD102 包含的 SM 可能比 GA102 多 71%。即使架构没有其他重大变化,我们也期待性能有很大的提升。
这不仅适用于图形,它也适用于其他元素。我们在 Tensor 安培计算用于核心性能(Ampere calculations),工作频率接近 2GHz 完全支持 AD102 芯片会在 FP16 带中型高达 590 TFLOPS 深度学习/AI 计算。相比之下,RTX 3090 Ti 中的 GA102 高达约 321 TFLOPS FP16(使用 Nvidia 的稀疏特性)。根据内核数量和时钟速度,理论上新产品增加了 84%。理论上 84% 的性能改进也适用于光线跟踪硬件。
除非 Nvidia 分别针对第三代和第四代进行重新设计 RT 内核和 Tensor 内核。我们认为没有必要 Tensor 进行大规模内核更改——Hopper H100 深度学习硬件的重大改进将比 Ada AD102 更多。同时,RT 内核可以很容易地看到每个内核 RT 性能比 Ampere 再提高 25-50% 的改进,就像 Ampere 每个 RT 内核比 Turing 快 75% 差不多。
最坏的情况,只是将 Ampere 三星架构 Foundry 的 8N 流程移植到 TSMC 的 4N(或 5N 或其他),没有其他真正改变架构的东西,添加更多内核并保持相似的时钟应该能够提供足够的性能提升. Nvidia 性能可能远远超过最低要求,但即使在底层AD107 芯片也比现在的好 RTX 3050快30% 或者更多的改进。
请记住,列出的 SM 这是一个完整的芯片数,而且很可能 Nvidia 使用部分失效的芯片来提高产量。以 Hopper H100 为例,它有 144 潜力 SM,但在 SXM5 仅在变体上启用 132 个 SM,而 PCIe 5.0 卡将被启用 114 个 SM。我们可能会看到 Nvidia 推出高端 AD102 解决办法(即 RTX 4090),其中启用了 132 到 140 个 SM,较低级别的模型使用较少 SM。产量提高后,当然,这是为未来完全启用的 AD102 的卡(即 RTX 4090 Ti)打开了门。
二 猜测 ADA 的 ROP
我们都是 Ada GPU 上的 ROP 计数(渲染输出)之后加了一个问号,因为我们还不知道它们是如何配置的。通过 Ampere,Nvidia 将 ROP 与 GPC(图形处理集群)连接。每个 GPC 包含一定数量的 SM(流式处理器),可以成对禁用。然而,即使我们知道 SM 的数量,我们不知道他们是怎么分的 GPC 的。
以带有 144 个 SM 的 AD102 为例。这可能是 12 个 GPC,每个 12 个 SM,8 个 GPC,每个 18 个 SM,或 9 个 GPC,每个 16 个 SM。还存在其他可能性,但这是我们认为最有可能的三种。Nvidia 对 GPU 游戏并不陌生,因此,无论如何安排,最终,我们都应该期待它的到来 GPU 的需求。
我们已经看到一些猜测 GA102 将有 12 个 GPC,每个 GPC 有 12 个 SM,这将产生 192 个 ROP 作为最大值。这不是不可能的,但是请注意,Hopper H100 有 8 个 GPC 集群,每个集群都有 18 个 SM,因此,这是非常重要的 AD102 看起来是比较合理的配置——只是没有 HBM3 而对深度学习硬件关注较少。
三 可疑的泄漏和谣言
此外,AD102 的 144 个 SM 令人怀疑。巧合地,Hopper H100 芯片共享 144 个 SM,其中 132 在当前顶级产品中启用。对于 Ada 和 Hopper 有一样的 144 个 SM 来说,这将是非常令人惊讶的。GA100 最多有 120 个 SM,因此,对于 H100,Nvidia 仅将 SM 数量增加了 20%。相比之下,假设泄露的信息是真的,这意味着AD102 的 SM 比 GA102 多 71%。
我们现在没有更好的事可做,所以我们报道了谣言 144 SM 数字,但是如果这是完全错误的,请不要惊讶。仅仅因为 Nvidia 被黑,数据泄露,不代表泄露的都是准确的。Nvidia 可能更好地调整架构,以获得更高的时钟和使用更少 SM,类似于 AMD 对 RDNA 2 所做的,但这可能需要对基础架构进行更重大的改革。
另一方面,AD102 至少有一个很好的理由成为一个巨大的芯片——专业 GPU。Nvidia 完全独立的芯片不是为消费者和专业市场制造的,RTX A6000 等 A 系列芯片就是证明。它使用和 RTX 3080 到 3090 Ti 相同的 GA102 芯片,只有一些额外的功能在驱动程序中打开。光线追踪并没有真正让游戏世界火起来,但对于专业市场来说,这是一件大事,多打包 RT 核心将是 3D 渲染用户的福音。还请注意,Hopper H100 不包含任何光线跟踪硬件,就像它被替换了一样 GA100 一样。
各种 Ada GPU 也将用于操作 AI 和 ML 算法推理平台,同样,这意味着可以使用更多 Tensor 和内核计算。因此,最重要的是,假定最大值 144 个 SM 也不是完全不可能,但肯定值得怀疑。也许Nvidia黑客发现了过时的信息,或者人们曲解了它。在接下来的几个月里,我们会知道更多。
四 存储子系统:GDDR6X 上一个新台阶
早前,Light宣布其运行速度高达 24Gbps 的 GDDR6X 内存路线图。最新的 RTX 3090 Ti 仅使用 21Gbps 内存,而 Nvidia 这是目前唯一一个使用 GDDR6X 的公司。这立即引发了对 24Gbps GDDR6X 的问题,唯一合理的答案似乎是 Nvidia Ada。下水平 GPU 更有可能坚持标准 GDDR6 而不是 GDDR6X,它的最大速度是 18Gbps。
这就代表了一个问题,因为 GPU 通常需要计算和带宽来实现承诺的性能量。例如,RTX 3090 Ti 的计算比率 3090 多 12%,更高的时钟内存提供 8% 的带宽。如果我们的上述计算估计证明甚至接近准确,那么就会出现巨大的脱节。假设的 RTX 4090 计算量可能超过 RTX 3090 Ti 多 80%,但是带宽只有大 14%。
假设可以控制的话 GDDR6X 功耗,然后在较低的级别GPU 带宽增长空间更大。当前的 RTX 3050 到 RTX 3070 使用标准 GDDR6 内存,主频为 14-15Gbps。我们已经知道 18Gbps 的 GDDR6 会很及时 Ada 提供,因此有 18Gbps GDDR6 的假设 RTX 4050 应该很容易跟上 GPU 计算能力的增长。如果 Nvidia 仍然需要更多的带宽,它还可以 GDDR6X 用于下水平 GPU。
更高水平 Ada GPU 最终与 GDDR7 还是三星的“GDDR6+”配对的可能性也很小,据报道,这将达到 27Gbps 的速度。然而,我们还没有听到任何关于他们的具体细节,眼下,Nvidia 将需要它的合作伙伴来增加内存产量。更多的生产必然导致更多的泄漏,因为我们还没看过 GDDR7 或 GDDR6+ 生产泄漏,我们假设它不会及时出现。
更有可能的是,Nvidia不需要大幅增加纯内存带宽,因为它会重新设计架构,类似于我们明白了 AMD 对 RDNA 2 你做的是原创 RDNA 与建筑相比。
五 ADA 希望利用 L2 缓存利润
减少对更原始的存储器带宽的需求的一个好方法是已经被知道并使用了几十年的方法——在芯片上添加更多缓存,你会得到更多cache hits,每次cache hits意味着 GPU 不需要从开始 GDDR6/GDDR6X 从内存中提取数据。AMD 的 Infinity Cache 让 RDNA 2 基本上,芯片可以用更少的原始带宽做更多的事情,泄露的Nvidia Ada L2 缓存信息表明 Nvidia 将采取类似的方法。
AMD 在 Navi 21 GPU 使用高达 128MB 的大型 L3 缓存,Navi 22 为 96MB,Navi 23 为 32MB,Navi 24 仅为 16MB。惊人地,即使很小 16MB 缓存也能为存储子系统带来奇迹。我们没想到Radeon RX 6500 XT总的来说,这是一张很棒的牌,但是基本上能跟上差不多两倍内存带宽的卡。
Ada 这个建筑似乎把一个 8MB L2 每个缓存 32 位存储控制器配对。这意味着拥有 128 带位存储接口的卡将获得 32MB L2缓存总量,在堆栈的顶部 384 位接口卡将具有 96MB 的二级缓存。尽管在某些情况下这比 AMD 的 Infinity Cache 要小,但我们不知道延迟或设计的其他方面。L2 缓存延迟通常低于 L3 缓存,因此,略小 L2 我确信我能跟上那些更大但更慢的 L3 缓存。
如果我们使用 AMD 的 RX 6700 XT 为例,其计算能力高于上一代产品 RX 5700 XT 高出约 35%。我们的GPU 同时测试基准层级中的性能 1440p 在在超分辨率下,大概更高 32%,所以整体表现和计算几乎一致。此外,6700 XT 拥有 192 位接口,仅限带宽 384 GB/s,比 RX 5700 XT 的 448 GB/s 低 14%。这意味着大 Infinity Cache 使 AMD 的有效带宽得到了提高 50%。
假设 Nvidia 是的 Ada 得到类似的结果,那就通过 24Gbps 增加内存带宽 14%,然后用有效带宽增加它 50% 配对。这将使 AD102 的有效带宽增加了大约 71%,这与 GPU 计算的增幅非常接近,所以一切应该运转良好。
然而,更多关于缓存的传言都是猜测。Nvidia 已经发布了相关的 Hopper H100 很多细节。真的比上一代好 GA100 有更大的 L2 缓存大小,但并不是每个内存控制器都是如此 8MB。事实上,H100 上L2缓存总量为 50MB,而 A100 的二级缓存是 40MB。但 Hopper 也使用 HBM3 显存,将用于海量数据集,这就是它所拥有的 80GB 记忆的原因。任何不能放进去的东西 40MB 东西不太可能放进去 50MB 甚至 150MB。消费者工作量,尤其是游戏,更有可能受益于更大的缓存。Nvidia 可能会跟到这里 AMD 的脚步,也可能谣言最后完全是错的。
六 ADA的功耗
Ada 建筑的一个元素肯定会吸引一两个人的注意,那就是耗电。Igor's Lab 的 Igor 是第一个把 Ada 的 600W TBP(典型电路板电源)记录在案的道听途说的人,第一次听的时候我们都笑了。“不可能,”我们想。多年来,Nvidia 显卡的最大功率接近 250W,而 Ampere 在 RTX 3090(后来 RTX 3080 Ti)跳起来 350W 已经感觉有点过了。然后英伟达宣布 Hopper H100 并且发布了规范 RTX 3090 Ti,突然觉得 600W 不太可能。
这一切都要追溯到 Dennard scaling的终结,摩尔定律的死亡。总之,Dennard scaling(也称为 MOSFET scaling)观察到,每一代,尺寸可以减小大约 30%。这减少了总面积 50%(长度和宽度按比例缩放),电压下降了,就像这样 30%,电路延迟也将减少 30%。此外,频率会增加大约 40%,总功耗将会降低 50%。
如果这一切听起来好得难以置信,那是因为... Dennard scaling实际上,在 2007 不要再发生了。就像摩尔定律一样,并没有完全失败,但是好处已经变得不那么明显了。集成电路中时钟速度仅从 2004 年 Pentium 4 Extreme Edition 最高合同 3.7GHz 迄今 Core i9-12900KS 的最高 5.5GHz。这个还是差不多增加的 50% 的频率,但是已经超过六代了(或更多,取决于你想怎么计算)基于的流程节点改进。换句话说,如果 Dennard scaling没有死,现代 CPU 的时钟频率将高达 28GHz。
杀人的不仅仅是频率缩放,还有功率和电压缩放。如今,新的工艺节点还可以增加晶体管密度,但是,电压和频率需要平衡。如果你想要一个快两倍的芯片,你可能需要使用几乎两倍的电力。或者,你可以制造更高效的芯片,但不是更快。Nvidia 似乎在寻求 Ada 的第一个选项。
使用像 GA102 这样的 350W Ampere GPU,提高性能 70-80%。因此,这样做意味着使用更多 70-80% 的功率。350W 然后变成 595–630W。Nvidia 可能比线性膨胀稍微好一点,并且 600W 可能是参考卡上的最大功耗,但我们听说一些下一代第三方超频卡可能包含dual 16 针式电源连接器。
七 ADA最终会变成RTX 40-SERIES吗?
下一代Nvidia GPU将被称为什么仍然是一个问题。我们建议 RTX 40 系列,坚持过去几代人建立的模式,但 Nvidia 总会有所改变。这种变化的一个潜在原因是:中国人不喜欢“四”,这在粤语和普通话中也是死亡的意思。
这是一个足够好的改变事情的理由吗?也许不是。当然,多年来,我们已经看到了许多显卡和其他型号,如下所示“4”的 PC 产品。英伟达在其 RTX 品牌投入了大量资金,虽然如果大家都猜对了下一个系列 GPU 的名字可能并不那么令人兴奋,但是销量才是最重要的。
不管最后的呼叫 Ada 显卡,不会改变它们的性能或功能。我们大多数人都有理由相信 Nvidia 将使用 RTX 40 系列名称,但如果 Nvidia 更改,这不是世界末日。
简短的回答,真正的答案是,它们的成本将与 Nvidia 你可以摆脱尽可能多的指控。Nvidia 推出 Ampere 当使用一套财务模型时,但是事实证明,这些型号很流行 Covid-19 疫情时代是完全错误的。现实世界中的价格飙升,养牛从中获取巨额利润,这还是在加密货币矿商开始支付官方推荐价格的两到三倍之前。即使是现在,我们仍然看到 30% 或者更多的标记。好消息是GPU 价格正在下降。
Ada 和 RTX 40 系列的 GPU 价格可能会上涨。然而,假设很大 L2 并且高速缓存和存储器带宽的相对有限的增加应该导致 Ada 仅在 Ampere 适度提高采矿绩效,就像 AMD 的 RDNA 2 卡仅比 RDNA 模型就像它一样快。这意味着,即使在 Ada 到达前挖掘盈利能力“恢复”,几乎可以肯定的是,光靠采矿无法维持我们的生存 2020 年底到 2022 年初出现的价格大幅上涨。
正如我们将在下一节讨论的那样,Nvidia 没有理由马上拥有它 GPU 生产从 Ampere 转移到 Ada。我们可能会看到 RTX 30 系列 GPU 还在生产了很久,尤其是因为没有别的 GPU 或 CPU 三星竞赛 Foundry 的 8N 制造。Nvidia 首先,推出高端 Ada 卡,从TSMC获得所有可用的能力,如有必要,减少现有的 RTX 30 卡价格填补任何漏洞,从而获得更多的利益。
我们提过很多次了 9 月推出 Ada 和 RTX 40 系列 GPU 的时间表,但重要的是要记住,第一批 Ada 卡只是冰山一角。英伟达宇 2020 年 9 这个月开始了 RTX 3080 和 RTX 3090,一个月后 RTX 3070 到货,又过了一个月 RTX 3060 Ti 到货。RTX 3060 直到 2021 年 2 直到九月下旬才出来,然后 Nvidia 在 2021 年 6 月用 RTX 3080 Ti 和 RTX 3070 Ti 更新了系列。预算友好 RTX 3050 直到 2022 年 1 当月才到货,最后是 RTX 3090 Ti 刚刚于 2022 年 3 6月下旬推出。
我们期待 Ada 卡片也将分阶段推出,从最快的型号开始,逐步进入高端和主流产品,面向预算 AD106 和 AD107 尽可能早的到达 2023 将于年推出。正如我们刚刚提到的,RTX 3050 仅在 1 6月下旬推出,所以至少再过一年甚至更长时间都不会更换。再说一遍,我们仍然需要真正的预算产品来接管 GTX 1660 和 GTX 1650 系列。我们能不能低于 200 美元的价格开始上涨 GTX 还是剧集的真实预算 RTX 卡?这是可能的,但是不要指望它,因为 Nvidia 似乎满足于出租 AMD 英特尔在 200 以下区间的美元与之竞争。
大约在第一版发行一年后,必然会更新 Ada 产品。眼下,任何人都能猜到这些最终是“Ti”还是模特“Super”模特什么的,但是你几乎可以在你的日历上标记它。
八 GPU世界上更多的竞争
几十年来,英伟达一直是显卡领域的领头羊。它控制着整个 GPU 关于市场 80% 到 90%,并且在很大程度上可以确定射线追踪 DLSS 新技术的创造和采用。然而,随着人工智能和计算对科学研究和其他计算工作负载的重要性日益增加,它们类似于 GPU 处理器的依赖性,许多其他公司正在寻求进入这个行业,最重要的是英特尔。
自 90 自20世纪90年代末以来,英特尔还没有在专用显卡上做任何适当的尝试,除非算上流产 Larrabee。这一次,Intel Arc 好像是真的——或者至少穿过门。似乎英特尔更注重媒体功能,而在 Arc 游戏或一般计算性能,陪审团仍无定论。据我们所知,顶级消费模型最多只能在中使用 18 TFLOPS 范围内。看看我们在顶部的桌子,好像只会和 AD106 竞争。
但 Arc Alchemist 这只是英特尔计划的一个例行程序 GPU 架构中的第一个。Battlemage 你可以轻松地 Alchemist 翻倍的能力,如果英特尔能尽快实现这一目标,它可能会开始侵蚀 Nvidia 的市场份额,尤其是在游戏笔记本电脑领域。
AMD 不会停滞不前,它已经表达过很多次了“有望”在今年年底前推出 RDNA 3 架构。我们期待 AMD 会转向TSMC的 N5 节点,这意味着它可能与 Nvidia 竞争性晶圆,两者必须做出相似的设计决策。迄今为止,AMD 一直避免将任何形式深度学习硬件放入其消费级 GPU(与其 MI200 不同系列),但由于 Arc 还包括 Xe Matrix 内核,它可能需要重新考虑这种方法。
无疑地,Nvidia 当前的光线跟踪性能远远优于 AMD 的 RX 6000 系列卡,但 AMD 是啊,光线追踪硬件或在游戏中 RT 对效果的要求很难直言不讳。就英特尔而言,它的 RT 似乎性能比 AMD 还要低。但是只要大多数游戏不可用 RT 在效果好看的情况下继续跑得更快,那么说服人们升级显卡就是一场硬仗。
最多两年 GPU 干旱和价格过高的显卡已经过去。2022 这一年将成为 2020 年以来 GPU 这个领域第一个真正激动人心的时刻。我希望这一轮会看到更好的可用性和价格。我们很难忘记这一点 18 上个月,情况更糟。
参考链接:
https://wccftech.com/nvidia-flagship-ada-lovelace-gpu-18176-cores-48-gb-memory-24-gbps-speeds-800w-tbp-rumor/
https://www.tomshardware.com/features/nvidia-ada-lovelace-and-geforce-rtx-40-series-everything-we-know
*放弃:本文为作者原创。文章内容为作者个人观点,《半导体行业观察》的转载只是为了传达一个不同的观点,这并不意味着半导体行业赞同或支持这一观点,如果有人反对,欢迎联系半导体行业观察。
今天是《半导体行业观察》给你分享第一个3112内容,欢迎关注。
晶圆|集成电路|设备|汽车芯片|存储|台积电|AI|封装
评论列表(0条)