电脑小百科

查看: 78

AMD在E3游戏展上发布Radeon RX5700系列显卡

[复制链接]

发表于 2019-6-12 08:29

从5月底台北电脑展公告之后,AMD终于在E3游戏展上正式发布新一代Radeon RX 5700 XT和Radeon RX 5700两款新显卡。新一代RX 5700系列显卡采用台积电7nm工艺制造,全新RDNA架构的Navi核心,将告别修修补补用了7年的GCN架构。



AFD2FR2H44HA.jpg

RQT6973KKBMT.jpg

  2000年的ATI时代,第一代A卡核心R100核心架构采用的是固定单元设计,3D几何转换和光照效果在如今看来极为原始;2001-2007年(2006年被AMD收购)的R200-R500是第二代架构,简单的VS纹理着色器、PS像素着色器分离式设计,不同的比例,整个渲染流水线依然像单通道里的单行道;2008-2011年的第三代TeraScale架构(代表核心R600)实现飞跃,VS、PS融合为统一着色器(SP、流处理器),支持VLIW(超长指令字);2011推出至今的GCN架构(代表核心Southern Islands),统一着色器加独立的标量、矢量单元,二者比例为1:4。

  RDNA架构是AMD第五代重大架构更新,花费AMD研发团队四年时间进行设计。全新的RDNA(Radeon DNA)架构依然使用统一着色器,但AMD融合了标量和矢量单元,支持SIMT(单指令多线程)、 ILP(指令集并行),类似CPU处理器的SIMD(单指令多数据流),令架构的单线程性能和指令集执行效率得到极大的提升。

  RDNA是全方位重新设计的架构,既不是GCN的升级版、也不是与GCN的混合体,AMD只是集成GCN架构的指令使其向下兼容,让现有的技术依然可以获得RDNA架构支持。RDNA架构将是AMD未来几年的显卡基石,虽然第一代的RDNA架构不支持物理光线追踪技术,但下一代7nm+工艺的RDNA 2将会加入与英伟达RT Core相似的专用核心,按照AMD的路线图来看,最快明年初就可以正式出现在大众视野当中。

Y3021U6JH0G2.jpg

  回归Radeon RX 5700系列显卡本身,显卡采用全新设计的RDNA架构。台积电7nm工艺制造的Navi 10核心,251平方毫米的核心面,集成103亿个晶体管,晶体管密度提升0.6倍、单位面积性能提升1.3倍;显卡搭配8GB容量的GDDR6(14Gbps)显存,256bit位宽下、拥有448GB/s带宽;支持PCIe 4.0总线、Radeon媒体引擎、Radeon显示引擎等诸多全新特性。

  AMD表示,RDNA架构的性能要满足在现代游戏负载需求、充分优化功耗和带宽利用率、壮大生态功能和拥有出色的扩展性。所以AMD对RDNA架构进行三大变革,包括CU计算单元、缓存、流水线,同时还公布AMD关于光线追踪的规划。

7K49E0DKH66E.jpg

  AMD Radeon RX 5700 XT显卡将2560个流处理器、80个标量处理器、160个64位双线性过滤单元分为40组,每组64个流处理器、2个标量处理器、4个64位双线性过滤单元,带来更低的执行延迟、更强的单线程性能,同时提高缓存效率,让显卡的计算能效比GCN架构更高,能适应从游戏到计算各种负载。

  CU计算单元虽然还是每组64个流处理器,但64个每组是AMD反复设计后与处理资源最为平衡的组合,加上AMD彻底重组了计算单元的结构,让每个CU计算单元的标量解码和发射单元、矢量解码和发射单元、调度器的数量增加至两个,指令处理率提升一倍。

  AMD调整图形引擎使其更顺畅高效,几何引擎、64个纹理单元、4个异步计算引擎(ACE),负载分配更加均衡,可以在更低的功耗下达成更高的频率和能效。图形引擎流水线也进行重组,四个增强的ACE异步计算引擎,更加中心化的结合处理器(包含四个原语单元),64个像素单元。

P51302SWFWG5.jpg

  为了强化资源调度和利用的效率,RDNA架构还将每两个CU计算单元紧密地捆绑在了一起,组成一个工作组处理器(Work Group Processor),使得可用ALU单元、寄存器数量翻番,缓存带宽更是之前的四倍。架构中四个SIM16矢量单元、四个SIMD4特殊功能单元可变为两个SIMD32、两个SIMD8,如64个线程可组合为两个Wave32,然后由两个SIMD32执行两个Wave32,实现单时钟周期指令发射(之前需要四个),SIMD ALU单元的利用率也从25%来到了100%,同时支持Wave32、Wave64两种执行模式,轻松应对不同负载需求。

LS5B1QY5D935.jpg

  RDNA架构中的多级缓存一致性带来更低的延迟、更高的带宽、更低的功耗。RDNA架构设计了一套多级一致性结构,每个双CU组合内都有自己的零级缓存,与ALU单元的载入带宽翻番,增加四组新的一级缓存(都是16-way 128KB),降低了二级缓存(16-way 4MB)的拥堵,整体延迟和功耗大大减低。在一致性多级缓存下,支持Delta数据压缩提高传输率,同时改进色彩压缩算法,可供显示引擎读取,着色器也能同时读写压缩的色彩数据。AMD官方表示零级缓存延迟降低21%,一二级缓存降低24%,内存延迟也降低了7%。

  Radeon显示引擎得到大幅度升级,支持FreeSync 2 HDR、HDMI 2.0/DisplayPort 1.4 HDR,并针对高分辨率HR显示器优化,可输出4K/240Hz、8K/60Hz,很多只需一根数据线即可完成。Radeon多媒体引擎则大大改进了视频编解码,增加了新的H.265 HDR/WCG编码器,全面支持H.264 1080p600、4K150、8K30解码和1080p360、4K90编码,H.265 1080p360、4K90、8K24解码和1080p360、4K60编码,VP9 4K90、8K24解码,整体编码速度加快40%。

  光线追踪支持方面,虽然AMD的GCN、RDNA架构都没有专门的硬件单元加速,但AMD已经提供ProRender、Radeon Rays支持,分别面向内容创作渲染和游戏开发。下一代RDNA架构将会有专用硬件单元,支持特定的光线追踪效果在游戏中实时渲染。AMD未来也不会将光线追踪全部交予GPU进行本地处理,因为这样会使显卡的效率变低,AMD计划借助云计算,实现全场景的光线追踪,保证画面效果的同时降低本地硬件压力。

93Z7UR6FL3WL.jpg

RG0O9BXQ9NEI.jpg

来源:天极网


返回顶部 返回列表