封印者:最全硬件推荐&硬件依赖解析&硬核科普

声明:此篇文章与前几篇一样都存在时效性,因为游戏是会迭代的,一代比一代更吃性能,同一款产品也会随着时间价格越来越低,同代同定位产品性能也会更强,如果遇到与事实有很大出入的情况,请先对照文章发布时间以及阅览时间是否超出俩三年以上时差。
由于内容非常多,加上受众方面不同的影响,追求人各不相同,因此先列对应追求的推荐,需要研究参考的再继续往下拉学习,游戏逻辑原理在推荐后面。消化完之后你就会知道为什么这游戏除了显卡,什么都吃,反过来就是吃什么硬件最不吃的就是显卡。
推荐系列
如果看不懂说明,可以直接搜索红字标识出来的型号即可。
追求单号四人组队流畅可玩(核显套):极致性价比,适合买不起显卡或自己有显卡的玩家
CPU:英特尔12100或AMD5600g(有显选5600),个人更倾向使用12100,同样价位,5600g性能逊色一些,核显性能稍强一些,不是主玩clo可选5600g
主板:英特尔对应H610M,AMD对应B550M或B450M,更低的没太大必要,当然要抠几十块钱的预算也可以选择AM4插槽更低系列的板子。品牌任选性价比高的一款即可。
内存:内存默认ddr4,xmp频率可达3200Mhz,容量8g*2,时序c16-18-18以下,电脑小白开个xmp即可,购买就记xmp频率,容量,时序三个条件。品牌任选性价比高的一款即可。
硬盘:售后有保障的铠侠RC20,同价位性能更强的宏碁GM7000,更低价格更高性能的国产系列,爱国者P7000Z,达墨水瓶座,海康威视C4000,容量根据自身需求选择。
显卡:核显套装,无需购置独显。
电源:300w电源即可,若打算加装显卡,可以预留电源到500w,低端电源品牌选择知名大厂即可,如长城,航嘉,安钛克等。
散热器:用原装即可,若商家未赠,可考虑利民AX120系列。
机箱:半塔机箱即可。
以上组的一台完整主机组队60+fps是没问题的,遇到高动态率场景,帧数可能会只有二三十帧,但只是较少的情况,而价格在现市场约2k2左右。
追求单号四人组队流畅可玩:通用性更强,帧数更稳定
CPU:英特尔12400F或AMD5600或AMD5700x
主板:英特尔对应H610M,AMD对应B550M品牌任选性价比高的一款即可。
内存:内存默认ddr4,xmp频率可达3200Mhz,容量8g*2,时序c16-18-18以下,电脑小白开个xmp即可,购买就记xmp频率,容量,时序三个条件。品牌任选性价比高的一款即可。
硬盘:售后有保障的铠侠RC20,同价位性能更强的宏碁GM7000,更低价格更高性能的国产系列,爱国者P7000Z,达墨水瓶座,海康威视C4000,容量根据自身需求选择。
显卡:只考虑N卡,最低gtx1060 3g起步,全新可考虑gtx1650。
电源:500w即可,低端电源品牌选择知名大厂即可,如长城,航嘉,安钛克等。
散热器:用原装即可,若商家未赠,可考虑利民AX120系列。
机箱:半塔机箱即可。
以上组的一台完整主机组队常态60+fps,遇到高动态率场景,帧数也会相对稳定得多,并且CPU核心稍多,后台可稍微多挂些应用,应付游戏+直播也是足够的,但可能需要增加内存容量,价格在现市场约3k4左右.
追求多开四人组队流畅可玩:适合多号搬砖养成又对画质帧数有要求玩家
CPU:英特尔13600k或AMD5700x或5800x3d,5700x板u便宜接近一半,但性能确实要逊色得多,加上amd有着内存延迟的劣势,流畅度远不如13600k,5800x3d对比13600k各有优劣,根据预算选择
主板:英特尔对应B660M,AMD对应B550M,英特尔要发挥13600k的完整性能,会需要借助z690,根据自身预算而定。品牌任选性价比高的一款即可。
内存:内存默认ddr4,xmp频率可达3600Mhz,容量16g*2,时序c18-22-22以下,电脑小白开个xmp即可,购买就记xmp频率,容量,时序三个条件。品牌任选性价比高的一款即可。
硬盘:售后有保障的铠侠RC20,同价位性能更强的宏碁GM7000,更低价格更高性能的国产系列,爱国者P7000Z,达墨水瓶座,海康威视C4000,容量根据自身需求选择。
显卡:只考虑N卡,最低gtx1060 6g起步,全新可考虑rtx2060 12g。多开非常吃显卡,特别是显存这一块,渲染虽然吃频率,但量较少,大显存类型显卡基本足够,每开一个号建议当做消耗2g显存计算,6g显存不够三开动态消耗而导致掉帧,仅能当做双开帧数稳定。品牌任选性价比高的一款即可。
电源:500w电源即可,低端电源品牌选择知名大厂即可,如长城,航嘉,安钛克等。
散热器:利民FC140系列。
机箱:半塔机箱即可。购置需询问卖家尺寸是否够容纳显卡以及散热器高度
以上组的一台完整主机多开稳定60+fps,即使高动态场景,也可以保证60+帧,而价格在现市场约6k5左右。
追求多开四人组队高帧:适合对帧数要求极高又需要性价比玩家,配置等级顺带了拥有多开高帧的能力
CPU:AMD7800x3d
主板:B650M品牌任选性价比高的一款即可。
内存:xmp频率6000Mhz,容量16g*2,时序c30-36-36-76,D5内存8g是残血,为保证性能,需16g起步,电脑小白开个xmp即可,购买就记xmp频率,容量,时序三个条件。品牌任选性价比高的一款即可。
硬盘:三星的0E事件批次目前还没清完不做推荐,4.0固态天花板SolidigmP44pro,或者次一点的从盘装游戏也可致钛7100。容量根据个人而定。
显卡:只考虑N卡,rtx3060 12g,性能本身既能满足光影调教,大显存又能完美满足四开需求,非常契合clo的一张卡,往上推荐的就只有同为12g大显存的3080 12g了。品牌任选性价比高的一款即可。
电源:650w电源即可,品牌尽可能选择长城,安钛克,海韵等,650w以上我个人是只选择海韵,相对贵点,但品控更好,虽然翻车是所有厂都会,但发生概率,大厂始终是最低的。
散热器:利民FC140系列,这颗u功耗较低,散热起到的性能加持不大,考虑性价比风冷即可。
机箱:半塔机箱即可。购置需询问卖家尺寸是否够容纳显卡以及散热器高度
以上组的一台完整主机组队常态110+帧,即使高动态场景,也可以保证80+帧,多开依旧稳定,而价格在现市场约8k左右。
顶配?顶配13900k确实比7800x3d稳定多点,但是,贵呀,现在最高的硬件也就13900k了,帧数比7800x3d低点,但更稳定,多开也更强,但是需要搭个360水冷,还要支得起多开显存的4090,硬件单不就基本全卡死了。

游戏对硬件的依赖
因为前几篇都有一定的介绍,这次是进行汇总,所以采用引导式叙述,不再以分段式理解。
引导
首先我们知道了,游戏的伤害计算,模型碰撞等各种计算,都是由CPU完成的,clo的伤害计算,可以说是从进图开始就一直处于不间断的方式,你换做3a大作,哪一个是需要猛敲键盘疯狂输出的呢?没有吧,所以3a对CPU的需求远没显卡那么大就是如此。那么我们就需要挑同类来对比了,dnf一直被拿来对比,但dnf也与clo是一样的,都是需要处理大量伤害数据,所以非常吃CPU,CPU不好一样PPT,dnf可是2d游戏喔?像素人能吃得了多少显卡,不懂clo的原理你会说显卡,面对dnf总不会还在说吃显卡吧?
像素点绘制
只是概念,很多人都懂,那么我们再深入聊聊,画面成像的原理。一张画面,是CPU先计算应该怎么画,比如说先确定一个人物应该画在什么地方,先计算出这个人物轮廓的坐标,然后再3d连线,接着计算这些连起来“画出来”的面的所有像素点的rgb值,需要的参数,是到内存里找,没有再去找硬盘(clo在进图加载时就已经全部载入内存,所以图内一般不会访问硬盘)待rgb值计算都完成了,就会丢给显卡,显卡会先将这些计算好的数据,进行栅格化,也就是类似马赛克一样的颗粒状,以便进行画面完成后的数字信号传输,然后再消化CPU计算好的rgb值,给画面上色,那么这个人物就算是画完了。
定位分明
由此我们可知,一张图,CPU所参与的工作也不少,那是不是让CPU来画也可以了?当然可以,因为CPU就是通用处理器,GPU是图形处理器,那既然如此,为何不双CPU呢,而非要CPU+GPU呢?因为核心上的差别,先做一个比喻,一个8核的CPU,他的核心就只有8个,而一张3060显卡,他有3584个流处理器,他们之间是什么区别?CPU相当于是8个科学家,而GPU则是3584个小学生,简单的1+1计算,不管是科学家还是小学生都会做,但是奥数题小学怎么可能会做呢?但,GPU胜在人多啊,假如同一个时间要做3584到1+1的题目,GPU轻轻松松1秒完成,而CPU再怎么说,也就8个人,即便简单,算得再快,完成计算也要不少时间。因此区分CPU和GPU的目的也就在这,CPU来计算复杂矢量,GPU只需要听从CPU,哪里上色就画哪里。
动画形成
这里再引出一个逻辑,每秒100帧,按CPU的核心,根本就做不来那么多运算,那CPU该如何操作呢?很简单,CPU只需要计算关键帧即可,比如说,先计算完一张画面的所有数据丢给GPU,之后这1秒的100张画面并不是全都不一样的吧?那CPU只需要计算哪些矢量进行了变更,然后下达给GPU进行改变即可,没有变的话,那就一直画重复画面(dlss3的插帧原理与之大致相似),这也因此,遇到高动态的画面,经常容易发生掉帧现象,就是因为画面变动太多,CPU要计算非常多的数据,自然没法像平滑画面那么高的帧数。
实时渲染
那么这里再回到为什么不吃显卡,我们先纠正下乱用术语的说法“实时渲染吃显卡,clo就是个贴图游戏”,首先游戏都是实时渲染,大致分俩类,延迟渲染和前向渲染,相关知识由于内容太多,可以自行百度学习,而clo则属于前向渲染,这俩种渲染是以光照作为区别的,也因为当前游戏吃显卡性能的无非就是光影、粒子特效,可以参考光栅性能和光追性能。而最吃性能的俩大要素,clo都没有,当然这并不是指clo没有光影,而是渲染的方式,光照条件需要的性能非常低。
光照性能
先不说3a大作的多光源(延迟渲染),还要计算光线的多重折射,每个多边形进行的反射矢量都不同,牵一发因全局,计算量会非常巨大,所以光栅光追才会非常吃显卡性能。而clo是只有一个光源,或者是无光源,所以才会消耗非常低。所以无光源就是无光影?并不是,这里涉及“环境贴图”,也就是光影信息已经在贴图上,在完成上色的时候,就已经表现出了“伪光向”,显卡只需要统一光向营造出光照方向即可(这部分并没有文章指明光照方向是CPU决定的还是GPU决定的,按工作流程原理应该由CPU决定的, 但惯性思维文章上,基本都指向GPU决定,由于对本文影响为0,就权当GPU处理,有错可以指出)不用模拟光照极大节省了性能,但毕竟是贴图,所以并不存在光源反射。
静态贴图
既然说了渲染,那么进图之后,显卡都在工作什么呢?在进图加载的时候,CPU就已经在开始计算地图数据模型数据,clo的地图是全静态的,也就是无法造成影响,这也是被戏称贴图游戏的由来,所以在加载完成后,显卡只需要画这么一张,就一直存在显存里,后续所有画面都是直接用显存画好的现用,非常节省性能,所以进图后,显卡实际上只需要绘制工作量是非常少的,只有角色,boss,双方的特效,就这么点的工作量,根本不可能会遇到瓶颈的,一秒百帧自然是不在话下的,如果这也能遇到瓶颈,像PUBG这些树、门、草各式各样的全都是动态的,造成影响就需要重画,加上地图远比clo大得多,需要性能多得多,3060在这前提下都能200帧,又有什么理由没法给clo拉满120帧呢?再烂的优化,都没法造成显卡的瓶颈,就是拉满8k分辨率,也是像素点过多累死CPU,也轮不到显卡上色困难。
采样压力
也正是因为clo的各种消耗过低,各种技术都没有clo的份,例如视锥剔除、空间分割、模型数据实例化等不限于此,甚至为此clo的LOD都很奔放,也就分辨率有点用,但是分辨率缩放,更多的也是服务CPU,变相服务到显卡罢了,因为就像最开始说的,采样也是先从CPU开始,CPU计算完了才会丢给GPU,GPU的工作量小,即便是高分辨率,也是CPU压力远大于GPU,对GPU来说,不过是需要更大的显存罢了,也因此遇到卡顿的时候,降低分辨率永远都是最有效的方式。所以当你配置不高,或者遇到CPU瓶颈,又会缩放技术的,可以尝试用低分辨率游戏,然后实用缩放技术,放大回正常画面,而因缩放导致的颗粒状,再进行抗锯齿化,尽管会多消耗点CPU性能,但,总体比更大的分辨率要节省更多的性能。
被带有偏见的核显
直接说明可能会一头雾水,所以我们先列举几个,比如显卡阵容rx6600xt是28个计算单元,rx6650xt是32个计算单元,rx6400是12个计算单元,rx6500xt是16个计算单元,而核显阵容6800h是12个计算单元,5600G是7个计算单元,5700G是8个计算单元,同代架构,每颗计算单元在不阉割的前提下,可以近似成相同性能,也就是说6800h的核显约等于独显rx6400,性能对标就是gtx1650,如今的核显阵容还是很强的,早已不是曾经只是个亮机级别,即便5600G核显性能也能对标n卡阵容的独显gtx750ti。
核显延迟
但拥有核显,也就意味着,需要将内存作为核显的显存,显存带宽的大小,以内存频率为准,也意味着画面延迟会非常高,虽然比起显卡需要经过CPU再到内存的延迟要低,但毕竟不是内置,从CPU出发到内存延迟依旧是存在的,需要损失部分性能。且即便是双通,内存频率始终不如显存频率,带宽更是差之千里,同时还需要消耗内存性能,而且,作为显存时,对时序不敏感,内存频率更重要得多,这也是为什么四通道的高延迟lpddr5,能更大程度发挥核显的性能,毕竟内存频率重要的多。
显存带宽
如果对独显显存带宽没有什么概念的话,这里给你计算一下,以 8bit 色深为例,一个像素点需要占用 24bit 的原始信息,1080p屏幕的一帧,原始信息就有 49766400bit 的大小,每秒120帧的画面需5.98Gbps,而3060的显存带宽高达2880Gbps,应付clo理应是绰绰有余?这其实是显示器的所需的指标,实际上显存带宽还需要在内部计算中所需要的传递、存储的数据,而这些数据所需要的带宽值是非常大的,一般约等于20~25倍的出口带宽。但即便如此,四开也只是约为598Gbps的带宽左右即可。哪怕是4k,也仅是2389Gbps左右(但实际效能还要看游戏的计算逻辑而定,近似值并不百分百正确),带宽要求是足够的,但,12g的显存,那可就爆了,也应该不会有人开4k玩四开吧?
那么,CPU和显卡部分的主要原理就介绍完了,如果你看懂了,就能理解,为什么clo对CPU的消耗最大,最吃CPU,反而对于显卡,核显都足以胜任。
顺读&4K
硬盘的知识也很多,就挑几个常用的,首先最常见的硬盘指标就是顺序读取和随机4K读取,而之前也说了,游戏最重要的是4K读取,而我之前为什么在4k读取高的三星980pro和顺读高的威刚S70选了S70?因为顺读是单个文件的最高读速,比如单个视频几g的话,跑的就是顺读,而游戏文件都是几千个几k的小文件,这时跑的就是4k性能,因为4k就是最小的单位。而自从固态出现之后,4k的性能就一直涨幅很小,厂商一直在做升级的,大部分提升在顺读,4k差距过小,然后我除了玩clo,还在录视频,传视频,还会在学习之后,将有用的视频保存并转发给同好,大文件传输频繁度也不亚于游戏,自然也很吃顺读。
CPU决定硬盘性能
硬盘的最终性能,是看CPU是否强大,例如傲腾p1600x用11700K要跑最大随读1700MB/s是需要消耗掉三分之一的CPU性能,也就是说,尽管用着3.0固态,13900k和11700k的差距也会很明显,所以固态性能,不能用着低端CPU硬上高端固态,能发挥的性能也很有限。
噱头陷阱
而在选购硬盘的时候,卖家都是宣传5000MB/s,7000MB/s的顺读性能,这对只打游戏的玩家来说,是没有任何营养的信息,但这不是没用,而是服务对象根本不是臭打游戏的jpg但小白不懂啊,一看这数字有多大就会自发认为这块硬盘很强,论广告噱头的危害。
颗粒选择
游戏玩家挑硬盘,比起看这些性能,不如看主控和颗粒来得实在,主控代表了读速的主要指标,而颗粒代表了寿命和性能上限,当前主流的,颗粒必须要TLC颗粒,是相对平衡的颗粒种类,现在主要分为SLC,MLC,TLC,QLC,PLC,从左往右,性能从高到低,寿命也是从高到低,但成本也是从高到低,所以尽管SLC颗粒是性能最优寿命最久,但因为其成本,往往又贵容量又小,所以都是选择TLC最佳。
系统性能上限
而为什么固态经常跑不到标称速度?首先第一个原因就是,微软的win系统io上限所致,7000MB/s能发挥的速度只有2000~3000MB/s,具体为多少受CPU性能影响,而实际顺读性能,又被圈内人称之为“直读性能”,同样的,4k性能会受到io上限受到性能损失。那跑分是怎么跑出来的?这就该涉及到软件和缓存之间的漏洞了,相关知识比较多,这里引荐:

七读三写
当硬盘同时执行读取和写入俩项工作的时候,就会产生一定的性能损耗,这也是体现硬盘性能的主要指标之一,因为在日常里,就像聊qq的时候打游戏一样,qq接受记录就需要持续写入,尽管量少,也是占用了通道,至少吃一个通道,读取的通道也就变小了,那么损失的就是整块通道的性能,而不是说读多少+写多少=最大读。举个例子,假设有四个通道可读可写,最大读是2000MB/s*4通道=8000MB/s,而此时qq写入占用了一个通道,那么读取还能实现的性能就只剩下2000MB/s*3通道=6000MB/s,具体会占用多少个通道,性能的调取,看的就是主控的性能,但是每家的策略都不一样,所以没法一概而论,只能讲个概念,具体的七读三写性能,需要实测,4k性能也是如此。
被唾弃的叠瓦盘
而这里得重点提机械硬盘,也是之前我一直头疼的现象,首先是叠瓦盘,叠瓦盘是只能支持单通道操作的,要么就只能写,要么就是只能读,如果QQ记录是保存在叠瓦盘内,就会发生在接收完QQ记录之前,你无法读取任何盘内数据,且叠瓦盘的工作原理,会导致量少写入也会非常慢,那么用叠瓦盘来存qq记录将会非常折磨,存其他大文件也会因为速度过慢容易丢失数据而被唾弃,详细原理我引荐:

系统io性能
而我所说的QQ为什么是毒瘤呢?也正是因为其持续写入的特性,即便是垂直盘,现在也不建议使用了,因为win系统的io特性,会需要等待机械硬盘的响应,如果qq记录存入处于复杂的加密状态导致存入较慢时,qq本身会变成无响应的状态,如果机械硬盘占用满的时候,处于win系统的io设计,甚至会导致系统无响应,所以当今时代,qq记录已经不能再用机械硬盘来存了,总会时不时卡到系统,导致整体系统性能下降,这是微软的问题,也是qq的问题,但俩家都不优化。
时代对机械的淘汰
同样的机械也不再适合存游戏,举个例子,LOL放在机械你以为只影响载入吗?这个我曾经也这么认为,直到我经常切到QQ聊天和游戏之间往返切换时,几乎第三次必定导致游戏卡死,偶尔游戏期间还会时不时出现崩溃,也都是硬盘寻址读取造成的各种bug。换成3a,玩地平5也总会报带宽不足等问题,机械,已经变成只能用来存视频的地位了,而今有长江存储的存在,颗粒非常便宜,大容量固态也成了白菜价,普通游戏玩家并没有再继续固态+机械混搭必要。
多任务损耗
固态性能指标虽然都明标了,但没明标的地方,就像多任务操作,其实和七读三写原理差不多,而BV1EM41157gh里所提到的读速差异bug,便是多线程工作导致的崩溃。哪怕是盘内复制,3000MB/s的读写,也必定低于1500MB/s不仅是分半性能,除了系统性能本身的局限,还可能因为NAND颗粒的特性影响,部分情况还要吃先擦再写的性能消耗。多线程工作并不是简单的比例分划分,而是在比例划分的基础上,再额外损耗掉部分性能。
不必要的固态压力
综上所述,clo的多开,尽可能要在一个盘上进行,不能在a固态放一个游戏,在b固态放一个游戏,多开时,ab俩文件夹各开一个,这本质上,是俩个固态在抢系统性能,总有一个在排队,因为识别号上,这属于俩个不同的应用,在网络响应的时候,容易出现错开,即要等待一个游戏进入加载画面才能轮到另一个游戏,同时游戏发生的所有写入,都是各顾各的,消耗的系统性能自然也是各算各的,但是端口又是用的同一个,所以又需要进行排队。而都是一个固态一个文件夹里时大家都是并行写入,因为,游戏窗口虽然都是独立存在,但他们的源其实都是一个地方,用的同一个端口,也是一个应用的子窗而已。所以,分成俩个固态开俩个游戏,确实是分担了固态的压力,但是固态本身压力并不大,分成俩个固态之后因为要抢占端口资源从而导致消耗的系统性能翻倍,得不偿失,多有点本末倒置的意思。
游戏加载规则
这游戏的读取模式我也研究过了,从选角色开始进入大厅,就是启动加载后的第一次加载,但只会加载一个大厅的内容,硬盘会一口气把需要的内容全部搬入内存,这个操作在加载画面完成之后就结束了,但是即便存入内存内了,也不代表完成加载,因为加载画面完成只是完成地图载入内存的部分,也就是大厅只完成了地图的加载,NPC之类的,固态性能差点依旧还在调用硬盘,但固态性能好赶上加载画面一起加载完了?在内存里并不代表已经完事了,如果出现了卡顿,这里尽可能是时序的问题,内容不多,但是阶段性的反馈,时序拖了后退。
跳过网络响应
而在进图时也是需要再找硬盘载入相关的内容,但是F2则是直接从内存取,并且运用了一种技术,记录当前的信息直接调用,或许理解成缓存更合适,是比内存调用更快的命中,并且是无视网络的,仅在本地执行,所以少了网络响应,载入比起正常进图要快了数倍,同时也完成了一个小bug的诞生,在3:59最后几秒进图,在网络响应期间到了4:00,以前是卡住,然后用的是次日的疲劳,而dx11则是黑屏,然后直接踢你掉线,但F2就不一样了,因为跳了网络响应,所以计算的只有进图后的伤害计算和结算,尽管已经4:00,用的疲劳和次数,都还是未刷新前的。
单次读盘
结算完后F3回大厅并不需要重新访问硬盘,而是访问的内存,这也是为什么有的人进图特别慢,但是F2非常快,而F3也不会太慢的原因,毕竟少了读盘的步骤,而读盘也是最慢的步骤,在不换角色的情况下,每次进入不一样的大厅,都要读盘,但是,第二次进入同一个大厅时,则不需要再读盘,比如我在剧场里世界去新首尔支部,需要读取,然后我再回剧场里世界就不再需要读取,因为我之前在剧场里世界时,已经将地图数据存入了内存。也就是说,当我不换角的情况下,全图都跑一遍之后,就会将所有图都读完存入内存,再次进的时候,都会快不少,届时读图响应就是吃的内存时序了。
重复读盘
至于为什么我要强调不换角的情况下?因为换角之后,所有的地图都和刚进游戏一样,又需要重复一遍单次读盘,全部重新载入一次才能从内存调取,理论上,这应该叫清空,但实际上并不是,准确的说,是叫“关键信息丢失”,地图数据已经变成残缺数据不可用了,所以需要再次读取,而且需要全部重新读取,因为机器还没智能的知道丢的到底是什么数据,而在重新读取之后,CPU会整理内存的碎片信息,但并不会完全整理,也就是说,部分的重复读取会一直存在在那,也就导致了为什么有的人玩久了内存占的巨多,但是有的人就一直就那么点内存占用。
碎片再利用
虽然会造成重复读盘,但毕竟碎片信息是存于内存内的,CPU在简单整理的时候,命中了就会直接跳过对应的数据读盘,所以在结果上,小霸王上线打完第一张图之后加载速度会有所改善是客观存在的事实。所以只有第一次进图卡也是硬盘在拖累主机整体性能,而每次进图都卡,那就不一定是硬盘问题,比如同一个角色进同一张图一样卡,这就要考虑非硬盘因素。
内存优化
不管是单次读盘还是重复读盘,视环境的不同用法各有优劣,比如单个大地图,例如开放世界,采用单次读盘的方式,就可以极大减少持续读盘的负担,游玩时一直享受的都是内存的速度,尽管是机械也仅仅是最开始的读盘慢,而重复读盘在于小文件读取较多的地图较为常用,打个比方,花花草草这些单个又重复过多的,采用单次读取的负担会过大,导致在首次加载的时候耗时过长。所以请理性看待所谓的优化,而不是看到“啊某某游戏占用内存那么多”就开始高下立判说着渣优化了。而clo的内存溢出的原因,说到底还是因为小霸王太多,导致开发对内存“渣优化”反而不上心,毕竟那些“废弃”碎片对这些小霸王来说是福音,一时间我也对这就该列为“渣优化”的读取方式,或者应该说,无用碎片的及时内存释放,也不知道该说是真渣还是某些人的福音。而造成这种无用碎片的,说白了还是开发的问题,换个角色就“清空”,说白了就是再读取的方面出了问题,这本来应该是继续存在内存内循环利用的,但是换个角色也意味着关于角色方面的数据变更找不到完整对应的信息表而遭到废弃。
残血内存
我们上面的配置单有提到DDR5不能买8g,必须起步16g,这里是涉及了内存逻辑改变的问题,市面上的内存包括d4,逻辑地址都是4个bank,而8g的d5仅有2个bank,简易理解就是直接少了一半的通道。所以ddr5与其使用双8g,性能远不如单16g。

而相关的知识,在下面视频会有介绍,再详细点的专业解释,我并没有太过深入,毕竟D4的知识才刚整理完,D5设计竟大改了太多,并加入了PMC模块,也就是内存中央的PMIC芯片,独立出来的电压控制,同时也使得内存超频变得更加繁琐。索性如今颗粒仅有海力士一家的A-die和M-die,AMD直接只能跑6000频,时序c30就已经算体质上佳,操作空间在当前并不多,也就只有英特尔能往8000频超,但游戏的甜点频率就是6400c32,也是xmp即可获得,所以相关的知识,也许需要到未来D5技术取得新突破学习更佳。

内存延迟
然后内存延迟的问题,虽然内存有内存频率和时序,但是频率毕竟只是代表一个速率,CPU到内存和硬盘到内存都有着一个不常见的指标,内存延迟。虽然前几篇有提过,但毕竟是一笔带过,这里最近我发现一个up讲得更加全面点,就引荐一下

英特尔Ring总线
总得来讲,英特尔核心访问内存控制器,只需要走环形总线,环形总线的效能约等于内存控制器的效能,所以英特尔的内存性能较强,尽管同时兼容D4D5的关系拉高了延迟,也依旧比AMD强得多,只不过保留环形总线的代价就是大核心没法突破八核,恰如曾经只能四核的尴尬(这里别天天听着网友吹逼英特尔挤牙膏的梗,就忽略真实的原因,曾经英特尔的战略失误,认为14nm够用是其中一个原因,也有着光刻机物理性质的限制,直到引进euv才得以突破,14nm++++并非百分百英特尔所愿)
AMD的延迟
而AMD,则是外置了iodie,也就是走if总线,AMD核心访问内存控制器就需要跨die走基板,但基板信号频率就不能做得太高,AMD的解决方式就是降低效能进行分频,因此,au就出现了这么个情况,不仅频率一代比一代提升低,延迟还越来越高,尽管x3d系列大缓存可以弥补这项劣势,但毕竟缓存是随机命中,再大也存在命中失败的时候,所以就会出现,非常稳定中的不稳定,当然这种情况只会出现数据较大的情况。
未来迭代方向
所以这里就有预测了,要改变外置io的尴尬,AMD需要重新修改设计,也就是需要迭代到AM6,AMD倘若不收回AM5用五年的说法,那么接下来的8000系画饼再强,内存频率依旧很难上去,内存延迟依旧存在。而英特尔是铁了心要保环形总线,也许是“对抗”AMD的延迟所做的决定,内存性能是保住了,但也因此会一直持续大核心无法再增多的尴尬,从规划图可以看出到17代为止,英特尔都不打算舍弃。但走回正轨的英特尔又回到一如既往的模式,一年架构一年工艺,12代突破新架构提升ipc,13代精进工艺,14代突破新架构,15代精进工艺如此反复,那么14代的新架构,会导致i7少2颗大核,也意味着新架构的提升确实能大到舍得再放弃2颗大核,而15代还回去,那就是工艺成熟,也印证英特尔所说的2025带着15代重回芯片霸主地位,甚至还推出了2nm和1.8nm标准,工艺代号20A和18A,当然画饼谁都会,只是说,真期待的话,15代或许又是新一轮的“12代”,兼容高能单核和内存性能,届时AMD的x3d也许也会变得后继无力。
大小核设计理念
另外提个题外话,英特尔的大小核可以说是未来趋势,这也是英特尔不打算放弃环形总线的出路,放大大核的单核优势,核心不足导致的多核能力则用小核来补足,设计的理念与ARM节电完全不同,pc系统和安卓系统更是天差地别,调取策略自然不可一概而论,跑游戏用超强单核能力的大核,跑生产力堆小核心起来的多核能力,就是理想的设计初衷,但是现实就是大小核调度问题,这是为什么呢?真的是大小核本身的问题吗?
调度罪魁祸首
这是英特尔的问题,但也不完全是,究其原因,出现调度的问题还是系统识别上导致的,并没有物理上问题,所以与异构的干系不大,异构?有对应的指令集,用起来其实就是和胶水双核一样。那是不是可以说让微软背这个锅了?也不完全是,是英特尔叫微软这么做的...我多次翻阅相关报道的是真的满脸黑线,您玩得真花jpg
软解调度问题
与其馋信网友云发言,还不如自己动手去溯源,那么现在知道了问题就是出在软件上,并没有硬件上的物理问题,那么解决源头就行了,虽然软件调式是个头疼的问题,但总归能人还是很多的,这里我可以推荐一个,有好几个版本,不同的版本可以去up的视频里翻,调度策略都不一样,大小核用户可以根据自己的喜好选择版本:

大小核的流言蜚语
至于什么乱七八糟的大小核流言,就简单几个问题,ARM的大中小核也是异构,但是没调度方面问题,调度也可手调,倘若异构就是问题,异构本质就是胶水双核,异构能出问题,单个架构也一样崩。再者像7950x3d的,一个ccd堆叠三缓,一个不堆叠,让游戏落在有堆叠缓存的调度也是非常简单的策略,因为检索方式很简单,所以调度也比大小核用起来简单,这些问题基本都是软件上决定的东西,所以软解才会有那么明显的成效。

那么本篇文章就到此为止了,如果对你有用,不妨也向周边朋友科普硬件知识,本篇文章主旨还是阐明硬件的工作原理,挑明什么游戏应该吃什么硬件,而不是掉帧就是显卡不行的轻浮结论,然后别人反手说4090,就来句游戏优化差到4090都带不了。4090的性能说句难听的,正常游玩不存在哪个游戏会撞到瓶颈,来个mc材质包全开,不搞有的没的也是CPU先顶不住。你要说用4090开个16k80k分辨率不着边际的话,那世界上永远不存在够用的说法,这种抬杠建议还是别玩游戏了。