技嘉魔鹰RTX4070Ti评测:AI时代典型中端甜点级显卡!

前言
学期之初,我攒了一台MATX核显生产力主机,我掏空钱包上了目前消费级桌面端最强的R9-7950x处理器平台,它的性能确实是很棒,验证算法、代码编译和重度多任务都很顺手,但是没有一款支持CUDA的独立显卡,总还是差些意思。
于是,用(zan qian)了一段时间后,痛下决心,入手了一块技嘉的RTX4070Ti魔鹰显卡,补全了我的配置短板。
技嘉魔鹰RTX4070Ti是一款高端游戏显卡,基于NVIDIA的Ada架构,规格与公版RTX4070Ti相同,都有7680个CUDA核心、12GB GDDR6X显存、192bit显存位宽、60个第三代RT核心、240个第四代Tensor核心,支持DLSS 3和光线追踪。它的频率为2.3~2.6GHz,功耗为285W。技嘉魔鹰RTX4070Ti的特色在于三风扇多热管散热器、RGB灯效和双BIOS功能,提高了散热、个性化和安全性。

参数规格
RTX4070Ti相比RTX3070Ti在硬件规格几乎有着全方位的提升:更先进的制程、更多的RT核心、更多的Tensor核心和流处理器核心、更大的显存容量和更高的频率,同时有着更低的功耗,美中不足的是显存位宽砍了一刀。
RTX4070Ti也相比前代产品有着更为先进的编解码器和DLSS技术,因此可以带来更好的视频编辑性能和游戏体验。

外观
技嘉魔鹰RTX4070Ti Gaming OC显卡的包装盒非常漂亮,典型NVIDIA显卡的黑绿配色风格,正面是品牌LOGO、产品型号、产品特性。

盒子为抽拉式设计,去掉外层包装后可见磨砂黑色包装纸盒,正中印有GIGABYTE 品牌logo

掀开盖子,首先看到的是嵌入海绵保护层的说明书,显卡在泡沫下一层

继续开箱,可见显卡外套静电保护袋,与原厂附件一起,牢固的嵌入在厚厚的海绵包装内

包装内除显卡主体外,还包括一根双8pin转16pin的供电转接线,显卡支架和螺丝等

技嘉魔鹰RTX4070Ti Gaming OC显卡的外观采用了磨砂黑灰相间配色,质感十足、观感高级。显卡正面采用了三颗10cm尺寸的风扇,支持正逆转和3D智能启停技术,可以有效降低噪音和提高散热效率。

风扇采用了石墨烯纳米润滑剂,运行安静而且寿命更久,风扇中间有RGB幻彩光轮,亮起来时很是好看

显卡背面有背板保护,背板上有一个技嘉的LOGO和Geforece RTX标志。背板为大面积的镂空设计,增加强度的同时也减少对散热的影响。

显卡顶部正中是内凹设计的PCIe5.0的16pin电源接口,结合官方原厂附送的转接线可以有效避免电源线弯折导致的意外损失。官方建议使用双8pin供电,推荐使用750W以上的电源。
接口一侧有BIOS切换开关,默认左侧是OC,右侧是Silent模式。旁边有一LED灯,亲测供电不足时亮白灯(笑)。

顶部下部是GEFORCE RTX字样,标志着这是一款NVIDIA Geforce产品线RTX系列的显卡产品。右下角是GIGABYTE品牌LOGO,具有RGB呼吸灯效。

在低负载时风扇停转、风扇上幻彩光轮的灯光默认关闭,高负载时风扇开动、灯光开启,不过技嘉logo的灯光常亮,流光溢彩很是漂亮

侧方几个螺丝用于固定显卡支架

技嘉魔鹰RTX4070Ti Gaming OC这款显卡尺寸控制还不错,厚度仅58mm、宽度140mm,接口面板占用双PCIE槽,整张显卡占用空间约2.5槽位,装进我的MATX主机后不遮挡第二个PCIE x16插槽。
接口为3个DP 1.4和一个HDMI 2.1,出厂配有防尘塞,日常使用DP线缆连接我的4K显示器使用。

显卡长度为336mm,装入机械大师C+ Max这款MATX机箱后还有一些空隙,理线很是方便,显卡与其他配件的色调也很搭

温度、功耗和噪音
Ada Lovelace架构的RTX 4070Ti显卡采用5nm制程,能效表现优异,由此也带来了出色的散热和噪音表现,在约20L的M-atx机箱内:
● 待机时功耗仅11W,此时风扇不转,温度仅44摄氏度,环境噪音约34分贝
● 满负载时功耗285W,此时风扇约2000转,温度仅65摄氏度左右,噪音为44分贝
● 与CPU一起双烤时噪音为53分贝,与单烤CPU(52分贝)相近

理论性能测试
测试平台配置如下:
CPU:AMD R9-7950x
主板:B650M
内存:雷克沙 ARES DDR5 6000Mhz CL34 16GB x2
散热:利民PS120 SE ARGB
SSD:雷克沙 NM800Pro 1TB
显卡:技嘉魔鹰RTX4070Ti Gaming OC 12GB
电源:安钛克HCG850
机箱:机械大师 C+ Max
使用GPU-Z查询可见,技嘉 魔鹰 RTX4070Ti Gaming OC显卡的功耗默认为285W,最大可解锁至340W

我们首先使用 3DMark Firestrike对显卡进行理论性能测试,它可以测试显卡在DX11下的游戏表现。在基础(1080p)、Extreme(2k)、Ultra(4k)模式下的成绩中图形分别为54446、27166、13489

在测试DX12游戏性能的3DMark Timespy、Timespy Extreme模式中,技嘉魔鹰RTX4070Ti Gaming OC的图形得分分别为22642、10919

在3DMark Port Loyal测试中得分为13334

在新出的Geekbench6 的OpenCL benchmark中得分为210751

针对RTX40系显卡的一大卖点——DLSS,我也使用3DMark进行了测试,在关闭DLSS时帧数只29.58,在开启时则达到了104.81帧,这提升堪称震撼。

与前代产品进行对比时,RTX 4070Ti基本上与前代旗舰 RTX 3090Ti差不多水平,在3DMark的几个测试中二者打的有来有回。

游戏测试:
考虑到RTX4070Ti是一款中高端显卡,购入它用于游戏娱乐的朋友对于游戏品质和画质有一定追求,我使用几款内置benchmark工具而且画质出色的著名3A大作以及热门网游CSGO对技嘉魔鹰 RTX4070Ti Gaming OC进行了测试。
赛博朋克2077
首先登台的是赛博朋克2077,测试内容为技嘉魔鹰RTX4070Ti Gaming OC这款显卡在4k分辨率下,超级、光追超级、光追过载这最高的三个画质挡位下,显卡的光栅性能以及DLSS加持下的游戏性能。
我们首先看到的是画质调整为【超级】、不开光追、不开DLSS时的测试结果,平均帧数为47.26帧,最低帧为38.54,最高为63.75。此时的画质已经非常震撼,在个别场景变换时有所卡顿,整体比较流畅,可以说是能玩了。

在【超级】画质、不开光追、DLSS打开但不开启帧生成时,游戏帧数几乎翻倍,达到了平均帧84.14帧,最低帧68.45,最高真118.14,已经可以彻底喂饱我的4k 60Hz显示器,画面非常流畅而画质比之不开DLSS时几乎没有差别。

打开帧生成时,游戏流畅度进一步提升,平均帧达到了109.24帧,最低帧为94.79,最高为142.42

在【光追超级】画质挡位,不开启DLSS时画质相比不开启光追时明显下降,平均帧仅为18.40帧,最低帧仅10.95,最高帧也只有22.52

在【光追超级】画质挡位,开启DLSS不开帧生成时,游戏流畅度明显提升,平均帧达到了61.75,最高位76.69,最低帧也有50.05,帧数几乎是不开启时的三倍!

在【光追超级】画质挡位,开启DLSS和帧生成时,平均帧数进一步提升88.05,最低帧提升至75.23,最高帧提升至101.26,帧数是不开启DLSS时的将近5倍!DLSS3技术着实强劲!

在【光追过载】画质挡位且DLSS关闭时,平均帧数仅10.32帧,这意味着纯光栅性能,哪怕是4090也无法使赛博朋克2077在这一档位画质流畅运行!

DLSS技术此时依然体现除了其强大的效用,仅开启DLSS 自动不开帧生成技术时的平均帧数达到了34.99帧,最低帧也有23.66!平均帧是不开时的三倍有余,最低帧更是达到了6倍多!

打开帧生成时,定位中高端的RTX4070Ti已经可以比较流畅的运行画质开到了最高挡位的赛博朋克2077!平均帧此时达到了57.08,是不开DLSS时的约5.5倍;最低帧也有46.96,是不开DLSS时的近乎13倍!

古墓丽影
随后登台的是古墓丽影,它是一款经典游戏,也常见于显卡评测中。在画质调至最高而且不开启DLSS时,平均帧近67帧;在开启DLSS时,帧数达到了135帧,几乎翻倍。

Farcry 6
孤岛惊魂是育碧推出的典型硬件杀手级游戏大作,它同样内置了Benchmark工具而且支持AI辅助技术。在将画质调至极高,不开启AI生成技术时的平均帧为77,最低帧为70,最高帧为84,可以说技嘉魔鹰 RTX4070Ti Gaming OC应对这款游戏游刃有余。

在开启AI辅助技术时,平均帧提升至106,最低帧提升至98,最高帧提升至123,提升效果同样显著。

幽灵行动:断点
幽灵行动是育碧的一个不错的游戏产品线,虽然断点这部作品的口碑捉急,但它同样可作为3A 大作对PC性能的需求标杆(毕竟内置benchmark工具)。
以技嘉魔鹰 RTX4070Ti Gaming OC的光栅性能运行这款游戏同样绰绰有余,最低帧60、平均帧79、最高帧108的成绩算是不错。

CSGO
作为热门网游的CSGO自然也不能缺席显卡评测benchmark,在FPSbench测试图中,1080P分辨率下画质开足的平均帧数为762.66

在4k分辨率下画质开足的平均帧为198.49,由此可见,技嘉魔鹰 RTX4070Ti Gaming OC足以喂饱绝大多数高刷显示器

小结
在4K分辨率下,不开DLSS技术时,RTX 4070Ti基本也可以畅玩3A大作

在2k分辨率下显卡位宽基本不成瓶颈,RTX 4070Ti的游戏表现则更为出色些,使用高刷新率显示器的朋友也不必担忧显卡性能不足。此外,在2K分辨率下,RTX 4070Ti相比RTX3090Ti在众多游戏上优势明显。

DLSS 3 技术加持下的技嘉魔鹰 RTX 4070Ti Gaming OC的游戏表现相当出色,尤其是在4k、光追高负载下,DLSS3的提升尤为显著!以赛博朋克 2077 游戏为例,画质等级为超级并开启光追时,DLSS至高可以实现4.5倍的平均帧数提升!

生产力应用测试
通用计算时代,人们对一块独立显卡的预期用途显然不局限于游戏,显卡的算力也是衡量一块显卡性能的核心规格。
AI和科学运算
RTX4070Ti 显卡的一大亮点在于它的算力堪比上代旗舰RTX3090Ti,而价格远低于它。我以Aida 64内置的GPGPU对其进行测试,其单精度算力达到了42056GFLOPS,是消费级桌面端旗舰处理器R9-7950x的约15.7倍!

尽管RTX 4070Ti的定位只是中高端,但是它的算力是实打实的RTX 3090Ti水平。RTX 4070Ti的半精度最大算力高达320.7 TFLOPS,甚至略强于上代旗舰RTX3090Ti的320TFLOPS。

在训练当前热门的AI 画图模型Stable DIffusion时,xformers库加持下RTX 4070Ti的实际表现比之RTX 3090Ti也有较为明显优势。

考虑算力成本时,RTX4070Ti也有着相当不错的表现。

重度办公
强劲的性能带来诸多生产力应用场景的显著表现提升,PCMark10现代办公场景下,我手上这台装载了R9-7950x+RTX4070Ti的matx主机得分超过9800分!细看小项得分可见,RTX 4070Ti对包括数字内容创作在内的众多现代办公场景应用有着明显助力。

视频编辑和渲染
NVIDIA RTX40系显卡性能强劲而且内置新一代编解码芯片,在Blackmagicdesign这一世界顶级视频方案供应商出品的RAW Speed Test软件中,技嘉魔鹰RTX4070Ti可实现218FPS的8k RAW文件编辑,足以应对小型工作室和个人博主的视频剪辑需求。

独立显卡的一大应用是渲染加速,在V-Ray官方推出的benchmark套件中,技嘉魔鹰RTX4070Ti Gaming OC的GPU RTX得分高达3105分,GPU CUDA得分达2317分


与前代产品进行对比时,RTX 4070Ti在众多渲染和视频编辑测试中表现优异,视频编辑中与RTX 3090Ti差异不大,渲染类任务中则比之RTX 3090Ti优势明显。

总结
RTX4070Ti这款显卡面世以来颇受争议,它的更新幅度巨大、性能强劲而又能效出色,它的算力是实打实的强、DLSS3的提升也是极为显著,不论是生产力运用还是游戏娱乐,其实RTX 4070 Ti都是一款不错的中高端显卡。
有的朋友考虑到它的显存位宽阉割,对于它在4k分辨率下的实际游戏表现颇为犹疑,但是在几款3A大作和热门网游的4k分辨率实测中,DLSS3加持下的RTX4070Ti基本可以满足玩家对游戏画质和流畅度的追求,它的性能也大致卡在了这么一个平衡点上,不得不称赞老黄刀法精准。
AI时代,或者说通用计算时代的显卡本身有着游戏娱乐在内的多重角色,定价逻辑与之前已有明显差异,综合考量理论性能、游戏表现、生产力应用和价格,RTX4070Ti其实是还有点甜。我手头的技嘉魔鹰RTX4070Ti Gaming OC外观漂亮、做工用料优异、性能发挥出色而且安静,私以为是市面上众多4070Ti产品中的一个不错选择。