半个月前,如果你问我现在最强大的显卡是什么,我会毫不犹豫地告诉你是AMD Radeon R9 295x2。(托马斯a爱迪生)。
这块卡于14年4月诞生,统治显卡界2年,其塑造的最强神话一直未曾被打破,其代表了AMD对GPU性能的极致追求,无论你说它电老虎也好,还是说它大火炉也好,最强就是最强。不过今年4月,这个最强神话终于被打破,AMD新一代双芯卡皇正式问世,它的名字未如大家猜测的那样,叫做Radeon R9 Fury X2,AMD为它取了一个从未用过的名字,名为Radeon Pro Duo。
说起这块显卡,其实去年夏天我们就已经见过它的身影,AMD CEO Dr.Lisa Su亲自展示了该卡的PCB,并称该卡代号Gemini。该卡本来是在去年Q4上正式推出的,但由于VR生态系统的总体准备推迟,消费级VR头戴式显示器的上市时间被推迟到了2016年Q2,因此AMD决定将Radeon Pro Duo的时间也推迟到了Q2,就这样,该卡迟来了半年,于3月的GDC大会上正式公布,在上月27号来到大家面前。
AMD Radeon Pro Duo
Radeon Pro Duo这块卡可谓是既出乎意料,又在情理之内:出乎意料的是Pro Duo采用了两颗R9 Nano的核心而不是两颗R9 Fury X核心,因此TDP只有375w,照比R9 295x2的500w可谓是一个不小的进步;情理之内是该卡依旧采用R9 Fury X采用的纯一体式水冷散热,外观也同R9 Fury X如出一辙,仅仅是改变了水管的伸出方向;出乎意料的是该卡没有采用R9 295x2的特制双8pin供电接口,而是采用了标准的3*8pin接口;情理之内是该卡毋庸置疑的实力——单精度浮点运算性能高达16TFLOPS,是R9 295x2的1.4倍,GTX Titan X的2.7倍。
AMD Radeon Pro Duo
该卡是是目前最强的游戏卡么?是,又不是。首先需要清楚的是,该卡并不是一张为游戏而生的卡,AMD之所以没有以“x2”来命名该卡正是如此。Pro Duo定位介于游戏卡和专业卡之间,由于主要面向VR开发者,考虑到功耗和性能之间的平衡关系,AMD选择了TDP较小的R9 Nano核心来设计该卡。不过其双精度仅为1/16单精度,双精度性能照比专业卡还有些孱弱,因此称其为专业卡似乎还有点勉强。至于游戏方面,16TFLOPS的性能可以说是空前,有什么游戏在2K分辨率下不能特效全开流畅运行么?貌似还真没有,该卡就是这样一张“游戏之上,专业未满”的双芯卡皇。
AMD Radeon Pro Duo
卡皇自然有着卡皇的身价,该卡售价1499美元,国内售价13999元,比R9 295x2的上市价高了足足3000元。不过大家都知道,Fiji系列核心使用了HBM显存,不仅制造成本较高,良品率也较低,再加上该卡奢华的用料做工,定在这个价位也算是意料之中,想当年GTX Titan Z还定价2999美元呢。相信各位读者已经迫不及待地想要知道这个新卡皇的实力究竟几何,接下来就随我们的测试一起看一下这块秒天秒地秒宇宙的新型核弹会在业界引起怎样的轩然大波。
DIY技术交流QQ群:436842456 为了让各位DIY玩家们更好的交流经验心得,同时为我们的内容提出更多宝贵的意见,我们将在群内与大家积极互动,并不定期送上福利~
新卡皇规格揭晓
AMD Radeon Pro Duo采用2颗完整版Fiji核心,可以完美支持DX12。两颗核心均为28nm的GCN 1.2架构芯片,拥有89亿的晶体管规模,核心面积为596平方毫米。
显 卡 规 格 比 较 表 | ||||
显卡型号 | Radeon Pro Duo | Radeon R9 Fury X | Radeon R9 390X | Radeon R9 295x2 |
首发限价 | ¥13999 | ¥5099 | ¥3199 | ¥10999 |
GPU代号 | Fiji XT*2 | Fiji XT | Grenada XT | Hawaii XT |
GPU工艺 | 28nm | 28nm | 28nm | 28nm |
GPU晶体管 | 89 亿*2 | 89 亿 | 62 亿 | 62 亿*2 |
着色器数量 | 4096*2 | 4096 | 2816 | 2816*2 |
单精度浮点 | 16.4T | 8.6T | 5.9T | 11.5T |
ROPs数量 | 64*2 | 64 | 64 | 64*2 |
纹理单元数量 | 256*2 | 256 | 176 | 176*2 |
核心频率 | 1000MHz | 1050MHz | 1050MHz | 1018MHz |
着色器频率 | 1000MHz | 1050MHz | 1050MHz | 1018MHz |
架构 | GCN 1.2 | GCN 1.2 | GCN 1.2 | GCN 1.1 |
显存频率 | 500 MHz | 500 MHz | 1500 MHz | 1250 MHz |
内存位宽 | 4096 bit*2 | 4096 bit | 512 bit | 512 bit*2 |
内存带宽 | 512 GB/s*2 | 512 GB/s | 384 GB/s | 320 GB/s*2 |
内存类型 | HBM | HBM | GDDR5 | GDDR5 |
内存容量 | 4096 MB*2 | 4096 MB | 8192 MB | 4096 MB*2 |
与老卡皇Radeon R9 295x2的Hawaii架构相比,Fiji架构的运算资源总量从2816个ALU大幅上升到了4096个,Texture Filter Unit由176个上升到了256个,构成后端的ROP则出人意料的维持在64个。Fiji拥有全新设计的MC结构,新MC直接对接4枚Logic Die所管理的HBM堆叠显存体系,总显存位宽4096bit,的显存容量为4096MB。
AMD Fiji核心架构图
Radeon Pro Duo的默认核心及显存运行频率为1000/500MHz,同Radeon R9 Nano一样。其实说起来,与Radeon R9 Nano相比,Radeon Pro Duo无论从图形架构还是从制造层面来讲均没有任何区别,仅仅是多了一颗相同的核心而已。
显卡拆解剖析
我们先后收到了两块Radeon Pro Duo,分别由蓝宝石和讯景生产。在拆解部分我们使用的是讯景的Radeon Pro Duo,而在测试部分我们使用的是蓝宝石的Radeon Pro Duo,两块卡除冷排风扇处logo不同外,其余部分并无任何分别。
散热器外壳设计
Radeon Pro Duo在外观上与R9 Fury X很接近,外观设计和材料使用上,AMD可谓是毫不吝啬,多件式铝铸结构、黑镍铝镜面光泽处理外骨骼、黑色柔软触觉纹理侧板等听起来就高大上的材料统统用到了这块卡上,整块卡看上去也确实十分稳重大气,气场十足。另外,该卡的前面板同样是可以轻松拆卸的,AMD也希望能有玩家使用3D打印或者CNC加工,制作出个性的前面板。
信仰灯设计
Radeon Pro Duo顶部有一个红色“Radeon”LOGO信仰灯,这也是自R9 295x2开始AMD公版顶级旗舰卡的标配了。不过遗憾的是,在R9 Fury X上搭载的基于GPU Tach技术的负载灯被取消了,不知AMD是出于何种考虑。
散热器内部设计
将前面板和PCB板拆开,我们看到了Radeon Pro Duo的内部构造:该卡依旧采用酷冷至尊为其定制的一体式水冷散热器,可以看到内部水路较为复杂,水管和散热器几乎占据了整块卡的空间,水路方向呈“8字形”,这样的设计照比在R9 295x2上的双冷头串联设计可以带来更好的散热效果。冷头自然是采用纯铜材质,并且在接触GPU的部位有微微凸起,可以压紧GPU和HBM显存。此外,在供电处有导热垫,可以将电容电感的热量快速通过金属中框导出。
冷排和风扇设计
Radeon Pro Duo的冷排及风扇同R9 Fury X上使用的一模一样,冷排为120mm排,厚度约为40mm,散热效能高达500w,运行噪音小于32分贝。说起这个散热风扇,其与R9 295x2上的风扇还是有些改进的,首先扇叶加厚了,其次在扇叶上有一个塑料环贯穿整个扇叶,这样设计的好处是可以加大风压,更有效地吹透冷排。顺便一提,这个风扇叫做“温柔台风”出自大名鼎鼎的Nidec株式会社。
显卡背板设计
Radeon Pro Duo的背板照比R9 Fury X有一定的区别,背板虽然依旧是一体式压铸外涂类肤涂层,但不再是全覆盖式,而是在两处GPU核心所在区进行了镂空。背板的作用除了美观,更多的是增强PCB强度,防止PCB损伤弯折。
显卡PCB正面设计
显卡PCB背面设计
Radeon Pro Duo的PCB采用双芯常见的对称式设计,两枚搭载HBM显存的Fiji GPU周围均采用了5+2相供电设计,这比Radeon R9 Fury X的4+2相供电设计更为豪华。在PCB中部下方是桥接芯片,芯片型号为PLX8747,这个芯片是目前双芯卡中最常见的桥接芯片。在PCB背面我们可以看到密密麻麻的元器件,虽然少了GDDR5显存,但PCB依旧未见留白,钽电容多的令人发指,这说明Radeon Pro Duo在用料上还是很下功夫的。
外接供电设计
Radeon Pro Duo采用3*8pin的外接供电设计,最大可以提供525w的电力供应。大家可能会比较疑惑,为什么TDP 375w的Radeon Pro Duo要采用525w的供电设计?在之前的会议上,AMD解释说由于一开始本打算采用功耗较高的R9 Fury X芯片,但考虑到该卡为VR开发者用卡,因此选用了TDP较低的R9 Nano核心,但PCB在设计上还是保留了3*8pin的设计。
视频接口设计
Radeon Pro Duo的视频接口延续了Fiji家族的一贯设计,3*DP+HDMI,取消了DVI接口,玩家可以最多组建4联屏平台。
显卡多角度图赏
正面的“RADEON”logo
信仰灯
供电接口
显卡尾部
视频接口
120mm冷排
显卡风扇
显卡背部
显卡金手指
测试平台硬件环境一览
为保证测试能够发挥显卡的最佳性能,本次测试平台采用最强酷睿芯——Intel酷睿i7-5960X处理器、技嘉X99芯片组主板、海盗船 VENGEANCE LPX 4*8GB DDR4-2666MHz 四通道内存、安钛克1200w金牌电源组建而成。详细硬件规格如下表所示:
测 试 平 台 软 硬 件 配 置 | ||
核心配件 | ||
CPU | Intel | 酷睿i7-5960X |
主板 | 技嘉 | GA-X99-Gaming G1 WIFI |
核芯显卡 | 无 | 无 |
内存 | 海盗船 | 8GB DDR4-2666 x4 |
硬盘 | 影驰 | 战将系列240G |
电源 | 安钛克 | HPC-1200 |
系统及驱动程序 | ||
操作系统 | Microsoft Windows 10 | |
主板驱动 | Intel芯片组驱动 | |
显卡驱动 | AMD Crimson(16.4.2 WHQL) | |
DirectX环境 | DirectX 11 | |
帧数监控 | Fraps 3.5.1 or Benchmark |
测试用主板:技嘉GA-X99-Gaming G1 WIFI
测试用内存:海盗船 VENGEANCE LPX(示意效果)
测试平台软件环境一览
为保证系统平台具有最佳稳定性,本次产品测试所使用的操作系统为Microsoft Windows 10正版授权产品,除关闭自动休眠外,其余设置均保持默认,详细软件环境如下表所示。
测 试 平 台 软 件 环 境 | ||||
操作系统 | Microsoft Windows 10 专业版 | |||
(64bit / 版本号:10240) | ||||
主板芯片组驱动 | Intel Chipset Device Software | |||
(WHQL / 版本号:9.2.3.1022) | ||||
显卡驱动 | AMD Crimson | |||
(版本号:AMD Crimson 16.4.2 WHQL) | ||||
桌面环境 | Microsoft Windows 10 专业版 | |||
(2560×1600 / 32bit / 60Hz) |
在测试成绩方面,理论性能测试用得分来衡量性能,数值越高越好;游戏性能测试用游戏自带Benchmark及游戏中平均帧数来衡量性能,数值同样越高越好。
理论性能测试:3DMark FireStrike
于北京时间2013年2月5日推出的新3DMark,采用全新界面设计,除了测试分数,还会展现每个场景测试期间的实时曲线,全程记录帧率、CPU温度、GPU温度、CPU功耗。新3DMark取消了传统的E、P、X模式,取而代之的是根据负载不同所推出的三个场景,其中FireStrike专为基于DirectX 11显卡搭建的高端游戏平台,而CloudGate则支持基于DirectX 10环境的主流硬件,IceStorm则支持入门级DirectX 9设备、手机、平板电脑等等。
3DMark FireStrike
3DMark FireStrike测试结果
在新3DMark测试环节,Radeon Pro Duo在FireStrike Extreme中得分高达11332分,GPU部分得分更是高达13060分,可谓是一览众山小。通过数据我们可以得出,Radeon Pro Duo照比R9 295x2有着20%的提升,并且超过NVIDIA目前最强显卡GTX Titan X近50%。
我们此前做过R9 Fury X与R9 Nano的交火测试,其成绩与Pro Duo的成绩十分接近。在上表中未列出的R9 Nano在此项测试中的得分为6379,也就是说双R9 Nano交火理论性能应为12758分,Pro Duo的得分达到了其89%,说明在全新Crimson驱动下,交火效率还是很高的。
游戏性能测试:《古墓丽影9》
《古墓丽影9》是由Crystal Dynamics开发,Square Enix负责发行的跨平台系列动作游戏,2013年3月开始发售。本作聚焦于劳拉年轻的时期,摒弃了前几作女超人的设定,玩家可以在游戏中看到更真实的劳拉年轻时代形象。由于引擎的升级,本作相比之前的作品会有更优秀的画面,是《古墓丽影》系列最具变革性的一作。
《古墓丽影9》
常规分辨率下游戏帧数测试结果
2K分辨率下游戏帧数测试结果
Radeon Pro Duo在2560*1600分辨率下得到的成绩相当优秀,在毛发特效全开情况下得到了100帧的超高成绩,领先R9 295x2 10余帧。而在1920*1200的分辨率下,平均帧数更是达到了了144帧,整体成绩傲视群雄,是当之无愧的性能之王。
游戏性能测试:《全境封锁》
《全境封锁》是一款开放世界第三人称射击角色扮演大型多人在线网络游戏。游戏设定在瘟疫爆发后的美国,玩家作为“全境封锁”计划的部队,在“黑色星期五”后的美国寻找一线生机。该作的大背景同《辐射》系列很类似,都是描绘大灾难后的世界,玩家需要在这个混乱的世界中寻找一线生机,可以说生存是玩家唯一的选择。
《汤姆克兰西:全境封锁》
常规分辨率下游戏帧数测试结果
2K分辨率下游戏帧数测试结果
测试过《古墓丽影9》之后,我们选择了一个对显卡有着较高要求的《全境封锁》进行这轮测试。《全境封锁》的官方推荐显卡是GTX 970/R9 390,而在2K分辨率下的推荐显卡为GTX 980Ti。可以看到,无论是常规分辨率还是2K分辨率,Radeon Pro Duo都可以很好地应对,其成绩领先R9 295x2约10帧左右。
游戏性能测试:《巫师3:狂猎》
《巫师3:狂猎》采用Redengine3引擎,作为一款次世代的RPG游戏作品,本作栩栩如生的真实环境还原以及全新角色面部动作和人物面部表情都成为了一大亮点。Redengine3引擎在支持各种全新图形技术的同时也加快了地图载入速度,经由无缝地图打造的宏大世界让玩家可以自由无限制的漫游在游戏世界当中。
《巫师3:狂猎》
常规分辨率下游戏帧数测试结果
2K分辨率下游戏帧数测试结果
《巫师3:狂猎》堪称显卡杀手级游戏,在常规分辨率下,只有顶级旗舰才能达到堪称完美的60帧,而在2K分辨率下,只有顶级旗舰的双卡互联平台才有可能实现特效全开完美流畅运行。通过实测我们可以看出,即使是在2K分辨率下,Radeon Pro Duo也能达到65帧,除此卡外的其余显卡全军覆没,连R9 295x2也不过50余帧。
DX12性能测试:《奇点灰烬》
《奇点灰烬》是一款Stardock制作的即时战略游戏。该作采用Oxide Games的Nitrous引擎打造,背景设定在遥远的未来,那时人类完全以意识形态存在,人们已经掌握了上帝一样的力量。但是人类发现自己已经处于战争之中,敌人就是一个叫做“Haalee”的具有意识形态的AI,企图推翻人类在宇宙之中的统治地位。
《奇点灰烬》
常规分辨率下游戏帧数测试结果
2K分辨率下游戏帧数测试结果
《奇点灰烬》是全球首款DX12游戏,其包含的Benchmark对显卡的DX12性能有着很好的测试。我们可以看到,在DX12模式,High画质下,Radeon Pro Duo在2K分辨率下跑出了87.9帧的高分数,在1920*1200分辨率下的平均帧数则为89.2帧,遥遥领先其余对照组显卡,平均帧数是GTX Titan X的1.5倍以上。
4K性能测试:3DMark FireStrike
Radeon Pro Duo可以说是为4K而生的VR旗舰,刚才的那些测试仅仅代表了它在一般用户手中所能展现的性能,而其真正的实力需要4K环境才能更好地展现。接下来我们就进行4K测试,对比用显卡选择目前NVIDIA的旗舰GeForce GTX Titan X以及AMD的单芯游戏旗舰Radeon R9 Fury X。首先是展现显卡理论性能的3DMark FireStrike测试,这次将画质设定为Ultra,测试结果如下:
3DMark FireStrike Ultra测试结果
从测试结果可以看出,Radeon Pro Duo大幅度领先两块单芯旗舰,领先幅度分别为57%和63%,呈现出碾压级性能。在4K测试中,Radeon Pro Duo的得分基本等同于R9 Nano在2K环境中的得分,由此可见该卡的确是为4K而生的显卡。
4K游戏大作性能测试
测试完基准性能,我们再来看看Radeon Pro Duo在4K分辨率下各项游戏中的表现。测试选用的游戏是《全境封锁》、《巫师3:狂猎》以及《奇点灰烬》,这些游戏目前还没有任何显卡可以在特效全开下完美运行,那么Radeon Pro Duo又会有何种表现呢?我们拭目以待。
《全境封锁》平均帧数
《巫师3:狂猎》平均帧数
《奇点灰烬》平均帧数
通过上面测试可以看出,4K分辨率的确是对显卡要求太高,就连巅峰性能的Radeon Pro Duo在《巫师3》这样的杀手级大作中败下阵来,平均帧数只有还算及格的45.3帧。而在《全境封锁》和《奇点灰烬》中则表现较好,不过《奇点灰烬》的测试中,画质只是High,如果设置为Crazy,Radeon Pro Duo同样无法跑出让人满意的帧数。
显卡温度及功耗测试
对于游戏显卡来说,功耗和温度仍旧是我们参考的必要数据,因为这些数据听起来好像是和性价比没什么关心,但它作为辅助属性密切影响玩家的实际游戏体验,更高的功耗会带来更多噪音和温度,因此我们应该全角度评价产品,而不是仅仅通过性能和价格。
温度方面我们将继续采用Furmark来进行测试,考虑到不同游戏之中,显卡的负载率不同,尤其是低分辨率和高分辨率的负载率差异会让显卡的功耗完全无法测算平均数值。因此我们需要采用Furmark这样的权威性烤机软件,让GPU芯片之中每一个运算单元完全满载,充分发挥供电最大化的状态才能得出准确的成绩。
显卡烤机温度为56℃
功耗方面我们则是采用Furamrk拷机,让显卡达到满载状态,然后拍摄功耗仪实时功耗。我们将参数设定为1280*1024分辨率,开启8*MSAA,最终Radeon Pro Duo以最高满载温度56度的情况下完成测试。由此可见,水冷散热的效果还是很不错的,温度始终稳定在60℃以下,而且使用噪音很小,几乎听不到风扇的旋转声。
平台空载功耗为101W(不包括显示器)
显卡满载功耗为305W(不包括显示器)
待机时Radeon Pro Duo显卡温度为34℃,此时的空载功耗为101w,比一般的单芯卡稍高;随着负载的升高,功耗逐渐升高,最终升至305w左右,此时GPU达到满载状态。该卡的TDP为375w,但实际满载功耗远小于这个数值,这是因为该卡采用了R9 Nano的核心,温度墙设定较低,在温度触及温度墙时,该卡有了一定程度的降频,因此功耗自然也就随之降低。另外,在Furmark这样的极限拷机应用中,厂商做了严格的功耗保护,并且很难做到让两颗GPU同时满载,所以显卡的功耗并不夸张。
评测总结:再一次铸就神话
今年夏天,28nm GPU即将退出历史舞台,全新的14nm/16nm GPU已经蓄势待发。作为28nm制程的最后一块卡,AMD Radeon Pro Duo必将被载入史册,毫无疑问,它是当之无愧的28nm显卡性能之王,而且其很有可能像之前的R9 295x2一样统治GPU界一段时间,直到新的双芯旗舰卡诞生。除此之外,该卡还是史上单精度浮点运算性能最强的显卡,高达16.4 TFLOPS的运算性能前无古人,在专业显卡领域也是名副其实的一哥。
AMD Radeon Pro Duo
该卡的外接供电设计很是唬人,是公版显卡首次采用3*8pin的外接供电设计,然而8+8+6pin甚至双8pin其实就可以满足该卡的供电需求。设计成3*8pin的原因之前已经说了,是为了平衡能耗关系,以AMD驾驭双芯卡的实力,即使采用两颗R9 Fury X的核心也不是没可能,这一次AMD终于在极致性能和功耗之间做了个妥协,不过即使是妥协,Radeon Pro Duo也是轻轻松松超过“大火炉”R9 295x2近3成的性能。
3*8pin就问你怕不怕
显存方面,受制于技术瓶颈,第一代的HBM显存最大只能做到4GB,因此该卡的显存容量为8GB。作为一款以VR和4K下游戏体验为卖点的顶级双芯卡,HBM显存容量确实偏小,而且现在还没有显存叠加技术,标称8GB,实际上也就是4GB的性能。在一定程度上,4GB显存会制约高分辨率下GPU性能的发挥,这也可以说是Radeon Pro Duo这块堪称完美的卡的唯一一点遗憾。
小身材大实力
不得不提的一点,得益于HBM显存设计,显卡PCB大幅度缩短,Radeon Pro Duo是史上长度最短的双芯卡皇,整张卡长度只有27cm,仅仅是一块标准高端显卡的长度,对机箱的适应性十分好,可以轻松装入MATX机箱中。价格方面,13999元的售价的确让人望而却步,其价格相当于2.5块R9 Fury X或3块GTX 980Ti。有的人可能觉得,AMD的显卡一向跳水较快,过一段时间再买不就好了么?在这里需要提醒大家,该卡面向客户主要是VR开发者,实际针对玩家售卖的该卡在中国地区可能只有百余块的存货,说不定还没等价格跳水,该卡就已经绝版了,因此有信仰的A饭一定不要错过这个给信仰充值的机会。
For Faith Of AMD
最后需要强调的是,该卡为VR而生,其最好的搭档自然是HTC Vive或者Oculus Rift这样的VR设备,今年是VR元年,该卡可以为接下来的VR内容大爆发提供最强有力的性能保证。其实说起来,想玩VR可得下点血本,光HTC Vive就卖6888,一台可以流畅运行VR内容的PC至少需要5000元,这还只是入门级的价格。所以一句话送给想要尝鲜VR的朋友们——预算三千玩VR,Vive花了六千八,想要VR玩的爽,快把Pro Duo搬回家。