英伟达最强消费级显卡RTX 3090出炉:半价买泰坦 | 您所在的位置:网站首页 › 3090核心数 › 英伟达最强消费级显卡RTX 3090出炉:半价买泰坦 |
原创 Synced 机器之心 机器之心报道 编辑:泽南、蛋酱 英伟达说,这是 PC 游戏领域自 1999 年以来取得的最大突破。 对于全球游戏玩家和 AI 从业者来说,一个重要时刻到来了。 刚刚,同样是在自家厨房,英伟达创始人黄仁勋向世人发布了最新一代消费级显卡 GeForce RTX 30 系列的最初三个型号 GeForce RTX 3070、RTX 3080、RTX 3090。 「无论性能还是能效,安培架构 GPU 都是图灵的两倍,」黄仁勋说道。「从架构、定制流程设计、电路、逻辑、封装、series IO、显存、供电、散热、软件和算法…… 我们在所有层面压榨 GPU 的性能,最终实现了世界水平。」 ![]() 关于这次发布,网上早已有各类信息提前曝光。但大家最为关心的就是 GeForce RTX 30 系列的性能与报价。用老黄的话说就是,与 2080 价位相同,但速度提升了一倍。而 3090 更是 GPU 中的猛兽,黄仁勋称之为 BFGPU(big ferocious)。 ![]() ![]() 在深度学习、光线追踪的一系列热场后,黄仁勋突然从放置抹刀的瓶子后,拿出了了一块 RTX 3080,开始正式介绍 RTX30 系列。 ![]() ![]() RTX 3090 是世界上第一个 8K 游戏 GPU。为什么一定要 8K?在英伟达看来,分辨率的提高会让视觉效果更加清晰锐利,让玩家更好地辨认出远方的游戏元素,以及让细节更加真实,比如头发、衣服缝线和皮肤皱纹。 ![]() ![]() 另外,RTX 3080 是 320bit 位宽,内建 8704 个 CUDA,显存 10G,功耗 320W。RTX 3070 则有 5888 个 CUDA。 ![]() 单从核心数量上来看,这巨大的提升让最近买了 RTX 20 系列的人有了四九年入国军的感觉。不过需要注意的是,英伟达官方标记的数据是等效核心,与之前的物理核心不同。 ![]() 这些显卡均支持 PCIe 4.0,还有 HDMI 2.1 和 DP 1.4a 等接口,并内含第二代光追核心 RTX Core、第三代张量核心 Tensor Core。 ![]() 另外需要注意的是 GPU 代工厂,今天发布的 GeForce RTX 30 系列均采用了三星的 8 纳米制程「英伟达定制工艺」,选择三星而不是台积电,不知是出于什么样的考虑。 安培架构,AI 算力再上台阶 这些强大的 GPU,采用的都是今年 5 月刚刚推出的最新 7 纳米制程架构安培(Ampere),其首先被 Tesla A100 所采用。 ![]() 除了制程提高,安培架构还有一些针对 AI 计算特有的机制,其中的三代 Tensor Core 会对稀疏张量运算进行特别加速:执行速度提高一倍,也支持 TF32、FP16、BFLOAT16、INT8 和 INT4 等精度的加速——系统会自动将数据转为 TF32 格式加速运算,现在你无需修改任何代码量化了,直接自动训练即可。 ![]() 最终在跑 AI 模型时,如果用 PyTorch 框架,相比上一代 V100 芯片,A100 在 BERT 模型的训练上性能提升 6 倍,BERT 推断时性能提升 7 倍。 不过由于消费级和专业级芯片的结构不尽相同,我们不能把 Ampere A100 芯片的 AI 训练性能简单地直接拿来作为参考,还需要等待官方公布,以及最终实测的数据。 黄仁勋表示,GeForce RTX 30 系列显卡具备三项基础处理技术:30TFLOPS 算力的可编程着色器(Turing 架构是 11),双倍吞吐量,用于光追的 RT Core(58 RT TFLOPS,Turing 架构是 34),以及可自动忽略次要 DNN 权重的 Tensor Core(238Tensor TFLOPS,旧版为 89)。 三个方面,性能相比前一代都是翻倍。 ![]() 英伟达通过自己的超级计算机训练了多种不同场景的图像,并将训练好的模型以显卡驱动的程序安置在你的电脑中。在游戏运行时,AI 会通过上一帧高清图对现有低分辨图进行渲染,最终达到超过原画的效果。据介绍,在最新版的 DLSS 2.0 上,Tensor Core 可以把 RTX 的性能提升一倍——这也意味着游戏的有效帧数可以变成两倍,现在光线追踪、高分辨率和高帧率可以同时拥有了。 用它来打游戏会是什么样? 除了新的图像增强工具 DLSS 2.0,随着安培架构的 GeForce 显卡,英伟达推出了 Nvidia Reflex、Nvidia Broadcast、Machinima 等工具,基于 RTX 的强大算力,现在人们不仅可以获得更好的游戏画面,也可以在游戏时获得更低的延迟、直播时屏蔽环境噪音,替换背景,实现绿幕效果、甚至直接用游戏里的元素创作出你想要的电影。 ![]() 自 Turner Whitted 等人首次发表光线追踪的论文以来,已过去了 40 年,如今这项技术从计算及图形的圣杯变成了人人都可以体验的实时游戏画面。黄仁勋还宣布《堡垒之夜》已经支持英伟达的光线追踪技术。「现在,全球排名前二的最受欢迎游戏,《我的世界》和《堡垒之夜》,都已支持光追。」黄仁勋说道。 为了让新一代 GeForce 显卡能够充分发挥作用,英伟达还发布了一款夸张的 360Hz 刷新率 G-Sync 屏幕,预计今年秋天就会出现在宏基、华硕、微星、外星人等品牌的电脑配置单上。 ![]() 还想要更好的效果?你也可以通过 NVLink 把两张 GeForce RTX 3090 进行 SLI,以达到性能的大幅度扩展。不过看看一张卡的价格,这种事估计只有玩微软模拟飞行的时候才会有人干吧。 最后,对于 RTX 3090 在常规任务中的性能,目前已有了一些传闻,据称基于 GA102 的未定型显卡在未优化完整的游戏中以 4K 分辨率跑起来比 RTX 2080 Ti 的帧数高 40%,而优化过的游戏中性能更是要高出 50%,在针对安培架构进行优化最佳情况下,性能提升可高达 70%。想要在 4K 分辨率下看高刷新率画面,现在不是问题了。 ![]() 在星际迷航中,剧中人会使用 Holodeck 创造虚拟现实环境进行任务,现在这种科幻的梦想很大程度上成为了现实。「未来,GeForce 就是你的 Holodeck,你的光速飞船,你的时间机器。」黄仁勋说道。 正如人们所预料,RTX 3090 的性能绝对强劲。现在,问题来到了我们这边,1 万元一块的泰坦级显卡,你会不会买? 不久之前, KDD 2020 公布了最佳论文、最佳学生论文等多个奖项。其中,最佳学生论文奖由杜克大学的李昂、杨幻睿、陈怡然和北航段逸骁、杨建磊摘得。 为了帮助读者们更细致的了解这篇论文,9月3日最新一期的机器之心线上论文分享邀请到最佳学生论文一作李昂,为我们介绍该研究。 © THE END 转载请联系本公众号获得授权 投稿或寻求报道:[email protected] 原标题:《性能翻倍,英伟达最强消费级显卡RTX 3090出炉:半价买泰坦》 阅读原文 |
CopyRight 2018-2019 实验室设备网 版权所有 |