从GDDR1到GDDR6的详细资料都在这里 您所在的位置:网站首页 内存gddr5 从GDDR1到GDDR6的详细资料都在这里

从GDDR1到GDDR6的详细资料都在这里

2023-08-23 12:30| 来源: 网络整理| 查看: 265

 

NVIDIA 新一代显卡即将出炉,尽管对于个中细节并不了解细节,但业界普遍认为无论是 NVIDIA 还是 AMD,新一代显卡搭载 GDDR6 显存可能性极高。什么?我的电脑才用上 DDR4,怎么显卡就用 GDDR6 了?而且频率还跑得那么高?是不是理不清它们之间的关系?下面就让我们重新回顾一下显存的发展历史,展望下一代 GDDR6 显存的一些新特性。

其实 DDR 内存和 GDDR 显存本来就是同宗同源,初期时 DDR/GDDR、DDR2/GDDR2 其实规范差异很小,频率等参数基本上都是一致,两者不分家,因此当时显卡即可以用 DDR2 颗粒,也可以用 GDDR2 显存颗粒。

这个图表是不是很熟悉?

DDR 的种类:

1、DDR SDRAM:Double Data Rate Synchronous Dynamic Random Access Memory,双倍数据率同步动态随机存取存储器;

2、DDR2 SDRAM:Double-Data-Rate Two Synchronous Dynamic Random Access Memory,第二代双倍数据率同步动态随机存取存储器;

3、DDR3 SDRAM:Double-Data-Rate Three Synchronous Dynamic Random Access Memory,第三代双倍数据率同步动态随机存取存储器;

4、DDR4 SDRAM:Double-Data-Rate Fourth  Synchronous Dynamic Random Access Memory,第四代双倍数据率同步动态随机存取存储器。

DDR 的发展:

SDRAM

 

DDR

DDR2

DDR3

DDR4

 

可以很清楚地发现,DDR、DDR2、DDR3 和 DDR4 之间的接口并不兼容,当然,其工作电压也是不一样的。(除了 DDR4 是台式机的接口,前三个为笔记本上的接口)

DDR SDRAM 可在一个时钟周期内传送两次数据

DDR 数据传输速度为系统钟频率的两倍,能在选通脉冲的上升沿和下降沿传输数据

 

DDR2 的数据传输速度为系统时钟频率的四倍

DDR3 的数据传输速度为系统时钟频率的 8 倍

DDR 的发展图

Samsung-DDR 的带宽与数据传输率上升轨迹

 

QDR 是什么?

SDR(Single Data Rate):单倍数据倍率,只利用时钟信号的上沿传输数据,例如 SDRAM 等。

DDR(Double Data Rate):双倍数据倍率,利用时钟信号的上沿&下沿传输数据,例如 DDR-SDRAM 等。

QDR(Quad Data Rate):四倍数据倍率,在 DDR 的基础上,拥有独立的写接口和读接口,以此达到 4 倍速率,例如 QDR-SRAM 等 。DDR2-SDRAM,DDR3-SDRAM 基本原理和 DDR-SDRAM 是一样的,通过提高时钟频率来提升性能,因为时钟频率提高了,必须做相应的预处理(DDR 支持 2、4、8busrt, DDR2 支持 4 和 8,而 DDR3 只支持 8)。

QDR 是 Quad Data RateStatic Random Access Memory(QDR SRAM)的缩写,也就是四倍数据速率静态随机存取存储器的意思。QDR 的四倍数据速率是相对普通 SRAM 而言的。

普通 SRAM 使用半双工总线,即在同一时刻只能进行读或者写操作(读 / 写共用一条数据通道),所以普通 SRAM 又称作 SDR(Single Data Rate)SRAM,即“单倍数据速率静态随机存取存储器”。

DDR(Double Data Rate) SRAM 在 SDR SRAM 的基础上做了改进,与 SDR SRAM 只在参考时钟的上升沿采样数据不同,DDR SRAM 在参考时钟的上升沿和下降沿都采样数据,这样,DDR SRAM 在一个时钟周期内可以传输双倍数据,DDR SRAM(双倍数据速率 SRAM)也是由此得名的。

QDR 在保留 DDR 特征的基础上,对其数据总线进行了升级,DDR 只有一条数据通道,数据读 / 写操作共用,属于半双工工作方式,而 QDR 拥有两独立条数据通道,数据读 / 写操作可以同时进行,属于全双工工作方式,因此,QDR 的数据存取速率又是 DDR 的两倍。

这样计算下来,QDR 的数据存取速率是 SDR 的四倍,四倍数据速率的雅称也因此而来。QDR1/2/3 的最高工作频率分别为 200/333/500MHz。在高速通信系统中(40G/100G)基本上都使用 QDR。

QDR 器件规范是由 Cypress、IDT、NEC、Samsung 和 Renesas 等公司组成的 QDR 联盟共同定义和开发的。QDR 联盟的官方网站是:https://www.qdrsram.com。

同 DDR 一样,QDR 也分为 QDR1、QDR2 和 QDR3。与 QDR1 相比,QDR2 增加了一对源同步时钟,可以帮组 SRAM 控制器捕获数据,此时钟被称为反馈时钟(CQ 和 CQ#),这个反馈时钟与 QDR2 的输入参考时钟保持同步,同时又与 QDR2 输出路径的数据总线保持沿对齐。这样,QDR2 产生的整体数据有效视窗便会比同频率的 QDR1 增大约 35%,而延迟却比 QDR1 少了二分之一个周期,这额外的半周期可容许在最低的延迟下进行更高频率和更大带宽操作。QDR3 目前还处在概念中,QDR 联盟于 2004 年 5 月制定的 QDR3 规范中,器件的最高时钟频率可达 500MHz。QDR 器件结构示意图如下所示:

4K@,H9]lz0                           

1).K/K#:QDR 系统时钟信号;

2).C/C#:读端口输入时钟;

3).CQ/CQ#:输出环回时钟;

这里说明下,K/K#、C/C#和 CQ/CQ#不是真正的差分信号,而是相位相差 180 度的伪差分时钟,在测试时不能使用差分探头,一般使用两个单端探头。

4).A[20:0]:地址输入信号,读写通道复用,分别在时钟 K/K#的上升沿采样;

5).WPS#:写端口选择输入信号,在时钟信号 K 的上升沿有效,当 WPS#无效时,写端口信号被忽略;

6).BWS[3:0]#:比特写入选择信号,用于选择将拿个 Byte 写入到 QDR 钟,对于 9 位数据位宽的 QDR,用 BWS0#控制,对于 18 位数据位宽的 QDR,由 BWS0#控制低 9 位,BWS1#控制高 9 位,其他以此类推;

7).NWS[0:1]#:4 字节写入选择信号(此管脚只在 8 位 QDR 器件上才有),用来控制当前写端口的哪 4 位字节被写入,NWS0#控制 D[3:0],NWS1#控制 D[7:4]。

8).RPS#:写端口地址选择输入信号,时钟 K 上升沿有效,当 RPS#信号无效时,读端口信号被忽略;

9).D[18:0]:写操作数据输入通道,在时钟 K 和 K#的上升沿有效;

10).Q[18:0]:读操作数据输出通道,单时钟模式下,在在时钟 K 和 K#的上升沿有效,多时钟模式下,在时钟 C 和 C#的上升沿有效;

11).ZQ:输出阻抗控制信号。用于控制 QDR 的输出端口的 CQ/CQ#以及 Q[18:0]等信号的输出阻抗。当 ZQ 和 GND 间的电阻为 RQ 时,则 CQ/CQ#和 Q[18:0]的输出阻抗被设置为 0.2RQ。当 ZQ 直接连接到 VDD 时,输出信号有最小的输出阻抗,ZQ 不能悬空或直接接地;

12).DOFF#:DLL 使能输入信号,当该管脚接地时,将会关掉 QDR 内置的 DLL;

13).144M/288M:144M/288M 地址扩展引脚,在 72M 器件上,这些管脚必须拉低。

 

QDR SRAM 的 I/O 端口采用的是 HSTL 电平。HSTL 即 High SpeedTransceiver Logic,是一种基于 EIA/JESD8-6 标准的数字接口电路逻辑,其输出为一差分放大器(如果只使用一端的话,另一端需要与内部参考电压相连),QDR 具有单独的输出端口电源 Vddq,QDR1 为 2.5V、QDR2 为 1.8V、QDR3 为 1.2V。

QDR 有三对参考时钟,其中,只有 K/K#时钟是必须的,它是写数据和地址信号的采样时钟。C/C#和 CQ/CQ#这两对时钟可选,QDR 有四种时钟设计方案,分别如下:

1). 仅使用 K/K#时钟。K/K#既是写参考时钟,也是读参考时钟;

2). 用 K/K#时钟和 C/C#时钟,不使用 CQ/CQ#时钟;

3). 用 K/K#时钟和 C/C#时钟的换回环,不用 CQ/CQ#时钟;

4). 用 K/K#时钟和 CQ/CQ#时钟。

由于 K/K#时钟和 CQ/CQ#时钟分别是由 QDR 控制器和 QDR 本身提供的,这样,在读写时都有源同步时钟做参考,所以,在高速设计中,基本上都是使用第四种时钟方案。

使用单时钟模式时,C/C#时钟必须从外部上拉到高电平(CQ/CQ#是输出时钟,无需处理),在使用第二种时钟模式时,C/C#的时钟的 PCB 走线必需要比 K/K#时钟长,QDR2 SRAM 有一个参数 tKHCH(即 K/K#时钟和 C/C#时钟的 skew),规范中要求此参数必须大于 0,因为 QDR 的同时读写特点,假设在同一时钟周期内,要对同一个地址的数据进行读操作和写操作,规范要求是,要先进行写操作,后进行读操作,也就是写参考时钟 K/K#需要比读参考时钟 C/C#先到达。但是,规范中同时规定,C/C#时钟与 K/K#时钟之间的 skew 必须小于三分之一时钟周期。

如果将多片 QDR2 SRAM 器件并联使用的话,需要注意 C/C#时钟的 PCB 走线方式,即 C/C#时钟须先到达最远端的 QDR 器件(即第三种时钟方案),最后到达最近处的 QDR 器件,这样,参考时钟信号的延迟正好可以抵消数据信号的延迟,确保几个器件上的数据保持同步,如下图所示。

使用 QDR 器件时,须注意一下几点:

1).QDR2 有最低频率要求,最低工作频率不能低于 120MHz;

2).QDR 上电期间,要保证 DOFF#管脚一直处于低电平,因为 DOFF#的作用是使能器件内部的 DLL,在刚上电的这段时间,时钟信号本身是不稳定的,为了让内部 DLL 正确的锁住时钟,需要停止时钟信号至少 30ns 来复位内部 DLL,然后等外部时钟稳定后在使能 DLL 去锁定稳定的时钟;

3).VDD 要先于 VDDQ 上电,VDDQ 要先于 VREF 或与之同时上电。

 

GDDR 是什么

GDDR 是 Graphics Double Data Rate 的缩写,为显存的一种,GDDR 是为了设计高端显卡而特别设计的高性能 DDR 存储器规格,其有专属的工作频率、时钟频率、电压,因此与市面上标准的 DDR 存储器有所差异,与普通 DDR 内存不同且不能共用。一般它比主内存中使用的普通 DDR 存储器时钟频率更高,发热量更小,所以更适合搭配高端显示芯片。

当应用程序越来越多要进行 3D 显示及演算时,频繁地读取在显卡中的 SDRAM 或 SGRAM 保存的连续画面图像数据的速度开始不能满足需求,人们研发了 GDDR,它是为了代替旧式显存的不足而出现。开始时第一代 GDDR 只是普通 DDR 的稍微改进版,但也比旧式显存要快的多。

 

GDDR 是什么

进入 GDDR 时代的显存家族一共有五兄弟,分别是 GDDR、GDDR2、GDDR3、GDDR4 和 GDDR5。GDDR 显存已在市场被淘汰,目前市场上常见的显存主要有 GDDR2、GDDR3、GDDR4、GDDR5 几种类型的产品。

GDDR2 显存,目前多被低端显卡产品采用,采用 BGA(Ball Grid ArrayPackage)封装,显存的速度从 3.7ns 到 2ns 不等,最高默认频率从 500MHz~1000MHz,但明显不如 GDDR3 显存。其单颗颗粒位宽为 16bit,组成 128bit 的规格需要 8 颗。

GDDR3 显存是专门为图形处理开发的一种新型内存,同样采用 BGA 封装技术,其单颗颗粒位宽为 32bit,8 颗颗粒即可组成 256bit/512MB 的显存位宽及容量。显存速度在 2.5ns(800MHz)~0.8ns(2500MHz)间。相比 GDDR2,GDDR3 具备低功耗、高频率和单颗容量大三大优点,使得 GDDR3 目前为主流显卡产品广泛采用。

  

GDDR4 和 GDDR3 基本技术一样,GDDR4 单颗显存颗粒可实现 64bit 位宽 64MB 容量,也就是说只需 4 颗显存芯片就能够实现 256bit 位宽和 256MB 容量,8 颗更可轻松实现 512bit 位宽 512MB 容量。目前 GDDR4 显存颗粒的速度集中在 0.7ns~0.9ns 之间,但 GDDR4 显存时序过长,同频率的 GDDR3 显存在性能上要领先于采用 GDDR4 显存的产品,并且 GDDR4 显存并没有因为电压更低而解决高功耗、高发热的问题,这导致 GDDR4 对 GDDR3 缺乏竞争力,逐渐被淘汰了。

  

 

相对于 GDDR3、GDDR4 而言,GDDR5 显存拥有诸多技术优势,还具备更高的带宽、更低的功耗、更高的性能。如果搭配同数量、同显存位宽的显存颗粒,GDDR5 显存颗粒提供的总带宽是 GDDR3 的 3 倍以上。由于 GDDR5 显存可实现比目前主流的 128bit 或 256bit 显存更高的位宽,也就意味着采用 GDDR5 显存的显卡会有更大的灵活性,性能亦会有较大幅度的提升。所以目前主流的高端显卡都无一例外地采用了 GDDR5 显存。

▲DDR 的带宽发展远远跟不上 GDDR

 

因此显存与内存分道扬镳是基于技术需求上的考虑,毕竟术业有专攻,GDDR 显存的推出就是更好地满足 GPU 胃口,达到更好的性能。

但是后期由于超大规模集成电路技术飞速进步,加上人们对于显卡性能日益增长的需求,普通的 GDDR/GDDR2 显存已经不能满足显卡 GPU 高速交互数据需求,毕竟 GPU 没有像 CPU 那样设计有大容量 L1、L2、L3 缓存,而且 GPU 与显存之间的数据交换非常频繁,还是那种大容量的纹理贴图数据,需要更高的显存带宽;其二是显存可以直接集成于显卡 PCB 上,不必像内存那样做成独立部件,又要考虑走线、信号传输延迟,可以专门做定向优化,同时提高显存位宽有利于减少显存颗粒,在显卡上实现更高容量的显存集成。

GDDR(Graphics Double Date Rate SDRAM,双倍速率同步动态随机存储器)

和 DDR 一样都是采用 2bit 预取,同时可以在一个时钟周期的上升沿和下降沿分别传输一次数据,这样就实现单时间周期两倍的传输速率。但此时 GDDR 频率并不比 DDR 要高出多少,但是 GDDR 为了追求更高的频率,在延迟要求上有所放宽。

GDDR 颗粒为了追求大位宽,因此容量会特别小,那时候都是 8×16Bit 的规格,也就是一颗 GDDR 显存才 16MB 大小,而同期的 DDR 内存颗粒可以做到 32 甚至 64MB 大小。

如果你浸淫在 PC DIY 界多年,你可能会记得以前 DDR、GDDR 显存颗粒都是这种多脚的 TSOP 封装,而且 GDDR 显存颗粒体积也很大。

▲DDR 内存

后期由于光刻工艺升级以及追求更加的封装面积,存储厂商在 GDDR 上实现了 BGA 封装技术,也就是针脚不外露,全部藏在底部。同时实现了 32bit 的显存位宽,并且一直延续至今。

 

GDDR2

技术细节同样来自于 DDR2,和 DDR2 一样 GDDR 2bit 的预取升级到 4bit,相比 DDR1 代可以将频率翻倍。不过由于 GDDR2 跑得比 DDR2 还快,诞生时间早,工艺上可能稍微欠缺了一点,工作电压高达 2.5V,尽管等效工作频率高达 1GHz,但巨大的发热量甚至媲美 GPU 核心,需要专门的散热片辅助散热。

▲DDR2 内存

因此采用 GDDR2 显存的显卡都是昙花一现,只有 NVIDIA 的 FX5800 /5600 Ultra、ATI 9800Pro 用过,很快就消息了,可以说 GDDR2 是个失败的产品。

▲ATI 9800Pro

GDDR3

被 GDDR2 坑过后,大家都认为存储标准制定方 JEDEC 跑得实在是太慢了,GDDR、GDDR2 标准严重不符合显卡 GPU 发展需求,NVIDIA、AMD 开始联手对 GDDR3 标准实施深入的指导,因此 GDDR3 可以说真正地与 DDR3 分道扬镳,技术标准得到大幅度提升。

▲DDR3 内存

深刻地认识到 GDDR、DDR 应用场景完全不同,因此设计之初就应该考虑到这个问题,考虑到高速读写需求,GDDR3 设计有两条独立的数据选择脉冲 DQS,一条用于读取,另一条用于写入,这样互不干扰,因此 GDDR3 读写数据速度要比 GDDR2 快多了,毕竟 GPU 存取数据频繁程度高,GDDR3 的新设计可以让显存效率大幅度提升。

尽管 GDDR3 保留 GDDR2 的 4bit 预取,但对 GDDR3 也修改 I/O 控制电路,新的电路设计可以最大程度降低电流,工作电压也随之下降到 1.8V,间接地控制住功耗和发热量,一举解决 GDDR2 存在的弊端。

都说工艺是提升性能、频率的良方,GDDR3 凭借制程工艺红利,从 1GHz 不断攀升,一直走到了 2.5GHz,因此其生命线长达五年才落幕。

▲奇梦达的 GDDR3

▲三星的 GDDR3

 

GDDR4

可能是 GDDR3 跑得太快,标准对于往后几代 GPU 来说还算是够用,加上 NVIDIA 与 ATI 之间竞争日益剧烈,就 GDDR4 标准制定分歧严重,最后 NVIDIA 明确表示不支持 GDDR4,显卡产品也并没有采用,最终标准 GDDR4 由 ATI 一手操办,但缺乏 NVIDIA 的支持,存储厂商只有小规模试产,AMD 也只有三款非主流产品采用了 GDDR4 显存,因此 GDDR4 起不了什么浪花。

▲DDR4 内存,已经和 GDDR4 显存没有瓜葛了

事实上,GDDR4 技术是有巨大进步,使用 DDR3 的 8bit 预取技术,这个也是 NVIDA 与 ATI 矛盾发展的开端。然后采用了 Data Bus Inversion 技术,提高数据精度、降低工作电压至 1.5V,继续降低功耗。

而 GDDR4 频率起步就是 2GHz 水平,其后虽然有更高频率颗粒出现,但是由于 NVIDIA 的不支持,市场太小导致生产成本高涨,加上 AMD 显卡性能不如同期 N 卡,GDDR4 很快就被历史所遗忘。

▲AMD Radeon HD 2600 XT 用的就是 GDDR4

GDDR5

GDDR 显存的命运总是那么跌宕起伏,奇数代的显存总是存活得更久,2012 年 GDDR5 显存终于登上舞台,在继承 GDDR4 的 8bit 预取,加上 QDR 双数据总线、4 路 bank 设计让 GDDR5 显存频率突飞猛进,一路高歌,一并冲上 8Gbps。

尽管 GDDR5 只有 32bit 的颗粒,但是它拥有两条并行的数据总线,那么他的工作模式就相当灵活,可以自由在 32bit、16bit 一下工作,同时一个 32bit 显存控制器也能控制两个 GDDR5 显存,实现了显存容量翻倍。

根据当时 NVIDIA 200 系列显卡上市情况来看,即便是采用相同 GPU 核心,使用 GDDR5 显存会比 GDDR3 显存,综合性能提升 20%以上,这个提升幅度相当惊人。也因此 GDDR5 能够经久不衰,一直到 1000 系列还在用,而且频率不断在进步,达到 8Gbps 的巅峰。

▲三星 GDDR5

 

GDDR5X

嗯?怎么突然冒出个 GDDR5X,GDDR6 哪里去了?这可不得怪 JEDEC 标准定制得太慢,NVIDIA 已经忍不住了,联合美光推出了这样一个半代产品 GDDR5X,还是高端 NVIDIA 显卡独占。

GDDR5X 可以视为 GDDR6 的先行版,它继续将预取从 8bit 提升至 16bit,使用了改进版的 QDR 4 倍数据倍率技术,也就是说每个时钟可以传输 4bit 数据!GDDR5X 的电压下降到 1.35V。最终我们见到首批使用 GDDR5X 显存频率可以高达 10Gbps,据说后续还会有 14Gbps 的版本面世。

▲美光 GDDR5X

GDDR6

GDDR6 标准终于姗姗来迟,即将到来的 NVIDIA 11 系列显卡肯定是要用上它的。和 GDDR5X 一样采用了 16bit 预取,这已经是被证实提高数据传输速度最为有效的方法。其次就是 GDDR6 终于一改以往 GDDR1/2/3/4/5/5X 只有一个读写通道问题,使用双通道,虽然位宽变小了,但是实际上效率更高以后,会带来明显的性能提升。

其次就是显存容量的进步,原本 GDDR5 最常见的都是 8Gb 单颗粒,而 GDDR6 标准下最高可以达到 32Gb,换算过来单颗粒就是 4GB,好处显而易见,那就是低端显卡单颗粒就搞定了,还要什么 HBM2?高端 3 颗也就满足 12GB,推算顶级显卡 384bit 显存位宽计算,搭载 12 颗就能达到 48GB,难怪 NVIDIA 丝毫没有在消费级游戏卡上用 HBM2 显存的意思。

▲GDDR6 带宽可以达到 896GB/s,这是美光提供的数据

此外 GDDR6 修改了封装方式,减少了底部接口数目,从 190 ball 减少至 180ball,尺寸更小,这样应用场景更为宽阔。

▲GDDR6 优势——针脚少、尺寸更小、效能更高

目前全球三大存储芯片厂商三星、海力士和美光都推出了自己的 GDDR6 计划,不过由于技术实力差异和产品研发路线不同等因素,这三家的产品还存在一定的区别。

 

三星

期初三星在 GDDR6 上也是雷声大雨点小,推出 GDDR6 的时机也要晚于其余两家,但三星厚积薄发,一推出的 GDDR6 显存规格就是最高的,1Y nm 工艺(10-16nm),单颗粒 2GB,速度最高可达 18Gbps,超过了 JEDEC 规范。

海力士

首批采用 21nm 工艺,单颗粒 1GB 容量,速度有 10/12/14Gbps,也超过 GDDR5X 现时的极限,比较有趣的是,GDDR6 电压应该是 1.35V,海力士研发出 1.25V 低电压版的 GDDR6 显存,估计是为笔记本设备研发的。

美光

美光是最早、也是最积极推进 GDDR6 显存的存储厂商,将会采用 16nm 工艺制造,也是单颗粒 8Gb,速度 10-14Gbps 不等,而且也有对应多款 1.25V 低电压版 GDDR6 显存。

如今 GDDR6 显存依靠高频率、高容量和低功耗特性,将会在未来新一代游戏显卡上大方异彩,为新架构显卡带来更强大的综合性能,而且对比成本居高不下、封装难度高的 HBM 2 显存来讲,GDDR6 显然更加实惠,更易于往中低端显卡推广。



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有