英伟达的Ampere A100成为有记录以来最快的GPU,速度比Turing快43%

最近英伟达的Ampere A100成为有记录以来最快的GPU,速度比Turing快43%这个话题,相信很多小伙伴都是非常有兴趣了解的吧,一段好的故事可以给读者带来很多值得深思的新东西,甚至还可以在一定程度上让读者的视野在瞬间扩大,那么既然现在大家都想要知道此类的信息,今日小编将给带来关于英伟达的Ampere A100成为有记录以来最快的GPU,速度比Turing快43%的资讯!

在我们等待基于Ampere GPU架构的消费类显卡公布时,NVIDIA的旗舰级Ampere芯片A100继续刷新世界纪录。全球最大的基于7nm工艺节点的图形芯片于5月公布,在规格和性能方面有大量支持。现在,Ampere A100张量核心加速器已成为OctaBench上记录的最快的GPU。

NVIDIA Ampere A100 HPC Tensor Core GPU成为Octa Bench记录以来最快的GPU,在关闭RTX的情况下,性能比Turing高43%

OTOY的首席执行官Jules Urbach分享了这一壮举。OTOY是Octa Bench的开辟人员,Octa Bench是一个基准工具,使用户可以使用Octane Renderer评估GPU性能。OctaneRenderer本身是一个GPU渲染引擎,支持NVIDIA的RTX光线跟踪硬件加速,以提供清楚的渲染场景。

根据Jules的说法,NVIDIA A100 Tensor Core GPU在OctaBench中的得分为446。他还指出,即使关闭了RTX,该分数也比OctaneRender中的Turing GPU平均快43%。此处比较的Turing结果利用了RTX,不像游戏会导致帧速率大幅下降,在OctaRenderer中启用RTX可以带来更好的性能,因为可以使用可用的光线跟踪硬件更快地渲染和完成场景。

并未说明使用了哪个确切的Turing GPU与NVIDIA Ampere A100 GPU进行比较,但查看所有测试卡的完整平均工作台,我们看到了一系列有趣的结果。平均而言,A100的前身Tesla V100慢20%左右,但出于某种奇怪的原因,Titan V只慢11%,考虑到Titan RTX比A100 GPU慢38%,这令人惊讶。

对此的主要答案可能是,Titan V利用与Tesla V100相同的GV100 GPU,可以针对该数据中心和云规模基准进行更优化,而Turing GPU针对游戏和GP-GPU使用进行更优化。但是,该公司首席执行官再次指出,这是有史以来在特定工作负载上记录的最快的GPU,这对于NVIDIA A100 GPU加速器是一项巨大的壮举。

NVIDIA A100是迄今为止生产的最大的7nm芯片,其特征是在单个晶粒中封装了540亿个巨大的晶体管。由于收益率过高,A100的配置大大降低,但是像Tesla V100一样,一旦收益率提高,我们可能会看到具有更多内核的更高bin版本,这将进一步提高该特定基准测试的性能。

NVIDIA Ampere GA100 GPU的完整实现包括以下单元:

每个完整GPU 8个GPC,8个TPC / GPC,2个SM / TPC,16个SM / GPC,128个SM

每个完整GPU 64个FP32 CUDA内核/ SM,8192个FP32 CUDA内核

每个完整GPU 4个第三代Tensor内核/ SM,512个第三代Tensor内核

6个HBM2堆栈,12个512位内存操纵器

NVIDIA Ampere GA100 GPU的A100 Tensor Core GPU实现包括以下单元:

7个GPC,7个或8个TPC / GPC,2个SM / TPC,最多16个SM / GPC,108个SM

每个GPU 64个FP32 CUDA内核/ SM,6912​​个FP32 CUDA内核

每个GPU 4个第三代Tensor内核/ SM,432个第三代Tensor内核

5个HBM2堆栈,10个512位内存操纵器

只能想象启用RTX的Ampere卡投放市场后的性能指标。如果要达到这个特定的基准,那么我们可以看到Ampere GeForce RTX 30系列卡很容易接近其HPC同类产品。

(0)
上一篇 2022年7月10日
下一篇 2022年7月10日

相关推荐