欢迎光临散文网 会员登陆 & 注册

[网络转载]令人惊叹!揭露ps3和xbox360的真实性能

2023-07-14 14:59 作者:趣玩研究社  | 我要投稿

原文:http://www.360doc.com/content/09/1110/00/172013_8706949.shtml

家用机的1080p谎言

1、微软360的图形核心
   设计制作 ati
   芯片代号 Xenos
   晶体管集成量 2.32亿


    Xbox360的图形核心由ati设计制造,内部包括两个芯片共集成3.37亿个晶体管,但真正由ati负责设计制造的只是其中的主芯片-拥有2.32亿个晶体管的Xenos,规模相当于 X800,那么另外一个芯片是怎么回事呢?


    还得继续回顾历史,当初ati在设计Xenos芯片时迫于微软的压力采用了尚未成熟的“同意渲染构架”,虽然提高了执行效率,却无法满足,ALPHA混合,Z轴缓冲等反锯齿技术的需要,双方不得不需求其他解决方案。最终选择了NEC提供的EDRAM(内嵌式动态随机存取存储芯片,容量仅10mb),并将两个芯片统称为-C1图形处理器。EDRAM芯片由于容量太小,仅能存储AA采样数据,对图形子系统的性能毫无帮助。这个解决方案的副产品就是著名的“3红”,问题-为了控制成本,微软将这两枚芯片焊接在一块4层pcb上,受XENOS的影响会在高温下变形,导致脱焊。




    与pc中的显示核心相比,XENOS实在太小了,2.32亿个晶体管里只能塞下48个统一着色单元(usu)和16个纹理单元(tmu),许多消费者以为XENOS是基于当时新一代的R500(X1900XT)核心设计,但实际上它只相当于R420核心的24管线改版,受散热系统限制,只能以500mhz工作,效率很低。按照微软官方公布的资料,C1图形处理器的理论运算能力为每秒480亿次像素着色,而目前主流9800gtx+级别显卡为每秒2365亿次,5倍左右的性能差距严重限制了全平台游戏的画面表现。
    

    至于现存带宽则差距更大,微软宣称的256GB/S只是edram芯片内逻辑电路到暂存电路的带宽,而edram到XENOS的数据带宽只有32gb/s。由于XENOS得数据总线只有128bit,虽然采用了频率为1400mhz的ddr3显存,但实际带宽只有22.4gb/s,这才是XBOX360最大的理论显存带宽。而在实际应用中,这22.4gb/s的带宽还要与处理器共享,显存也是与主内存共享,导致性能严重受限。

    Xbox360没有gpu独立显存,只能与处理器一起抢512mb的内存容量,所以处理器也必然占据每秒22.4gb里的一半,如此低的gpu至显存带宽会极大限制游戏分辨率和特效渲染精度,所以360无法实现真1080p。


   2、sony ps3
   设计制作 nv
   芯片代号 rsx
   晶体管集成量 3.02亿


    Sce将ps3的gpu命名为rsx(真实合成处理器),由nv设计,索尼制造。这款基于G70核心的GPU内部集成了3.02亿个晶体管,索尼官方公布的资料表示其运行频率为550mhz,然后正式销售的ps3中却悄然将为500nhz,拥有24条像素着色管线,8条顶点主色管线和24个纹理单元。从规格上看要高于Xenos,这也是sce职责游戏开发商没有发挥ps3性能的理由之一。

    但事实却非如此,尽管RSX的核心渲染能力尚可,但“配套设施”很差,不仅总线位宽被砍到128bit,显存也是频率为1400mhz的ddr3,因此其带宽与Xenos相同,也为22.4gb/s。虽然有256m独立显存,也不比Xenos强到哪去。再来看看sce宣传的浮点运算能力,rsx号称有1800gflops的浮点预算能力,但和9800gtx+的7096g相去甚远,ps3在性能上比肩主流pc纯属痴人说梦。

家用游戏机的伪1080p画面
    
    1、ps3的插值计算的1080p

    Ps3的1080p游戏画面其实是通过像素插值计算放大后的1280*720图像,在这个简单的“拉伸”过程中,rsx只要填充所采样像素的色彩均值子像素就行了,完全不需进行像素着色运算,这样的1080p即便古老的nv40芯片都能实现。

    2、XBOX360的假1080p

    工程师们发现C1里的那个简陋的edram芯片在分辨率高于1280*720时形同虚设,只要每帧画面高于100万像素就用不了反锯齿,干脆用它来进行像素插值,放大720p画面。虽然这样会在模型边缘形成明显的锯齿,但却能获得比ps3更好的帧数的“1080p”,于是360就这样具有了1080p的渲染能力。但是其画面还不如720P的画面!

任天堂北美前总裁雷吉曾表示,如果wii采用插值模拟,同样也可以到达1080p的分辨率,甚至都不需要cpu暴力提频。


    全平台开发者的苦难


    在2005~2006年,游戏开发者们还是在用pentium4 3.6和g 7900或x1900xtx当开发机或高强度负载debug机,然后大幅缩减图形规模在x360,ps3的debug机上测试会不会跑半截挂掉。开发者们眼中的这两台游戏机实际性能现在看来已是老爷车的pc都有很远的距离,其中反映尤其强烈就是对两台游戏机的处理器极其不满,gpu的问题倒好解决,缩减游戏机画面分辨率和特效精度就行了,基本上三流pc玩家也能胜任这个工作。但是处理器计算能力出问题就严重了,引擎底层代码都得重建,令大量debug程序员怨声载道。


    事实上在xbox360游戏里能保证720p就已经是谢天谢地了,根据epic调查很多别的制作者为了达到不至令人呕吐的帧率,连700p都保证不了。当然到最后epic也晚节不保,xbox360版gow最终渲染规模钉在了1244*700像素,就这样才只能勉强维持27fps,不到他们在x2 6400+和g 8800gtx的pc上渲染速度的1/4。


    GTA4的两个游戏机版本每帧画面只有1138*640,gpu像素填充优化的场景描绘距离仅为20%,并且两台游戏机只有24~26fps。在pc版出场后,大量游戏机的“菜鸟粉丝”纷纷致电rockstar开发组,幸灾乐祸的指着gtx280+e8200渲染的1920*1200像素量、全特效、场景描绘距离拉至100%的gta4大叫:“才29fps啊!最顶级的显卡也比不上游戏机。”


    而rockstar的一线卡发着在接受采访时的回应也非常简单“那就降低可视距离喽,要不就降低分辨率,而且pc版的纹理效果也全面提升,其实关键就是分辨率,实际上开到1680*1050的pc版数据量就已经是游戏机版gta4的很多倍了,具体多少忘了”显然这位开发者碍于游戏机制造商的脸皮没说的太详细。

    后面更激情,太多了不写,,最后总结是xbox360只有初代2倍的性能,最理想状态下Xenos的浮点预算只有pentium4 1/3,ps3比ps2提高6倍,只是应为ps2实在太差了。


    世界上亘古不变的唯一真理就是一分钱一分货,象cell Xenos这么小的核心,性能最理想也就是athion 64 pentium4相近。彻底分析了这代游戏机相比前任平均4倍的性能提升幅度后,蒂姆 斯维尼、约翰 卡马克这些顶级游戏程序专家,并不认为依旧在低制造成本限制下的所谓ps4 x720能和现在core i7与gforcegtx的电脑性能相提并论。

1.PS3上的假“9核心”Cell处理器
        与IBM应用于服务器的Cell处理器不同,PS3上的Cell只有2亿3千万晶体管、主频为3.2GHz。和IBM最少2.5亿晶体管、主频高达4.6GHz的芯片品质没法相比。而在大型服务器上Power PC架构的Cell处理器使用率非常低,卖不出去没别的原因——Cell处理器的实际复杂运算能力太低。
        PS3版本的Cell处理器逻辑电路由一个小型Power PC架构通用运算核心(PPE)、八个微型单精度运算核心(SPE)组成,其中一个SPE在实际产品中被屏蔽掉,所以确切说PS3的处理器应该是“伪9核心”。此外由于为了省钱,系统没有一颗硬件音效芯片,因此还要占据一个SPE专门处理音效。
        由于全能型通用运算核心(PPE)太小,即使对应了两个工作线程最大限度发挥逻辑电路效率,其计算能力也非常有限,由于只配有0.5MB高速2级缓存。另外7个协处理器(SPE)运算指令范围非常窄,连NVIDIA的GPU上的流处理单元(SPU)的指令范围都不如,这就是PS3所谓的有“次世代”游戏物理效果和PC上配备GeForceGTX显卡的硬件PhysX物理夏鸥个哦根本没法相提并论的根源。确实是够“次”的,否则《镜之边缘》PC版里超复杂的逼真物体破碎、撕裂、碰撞效果,PS3版怎么不用Cell处理器的鸡助SPE去运算……这些基本上只能胜任视频文件解码的SPE分别带有0.25MB低速缓存,所以对处理器架构设计有了解的人现在就会看出Cell处理器在晶体管规划上的严重问题了——它不是一颗适合游戏处理器通用型程序运算的芯片!
        Cell处理器将70%以上的晶体管都划分给了SPE及其低速缓存,这么一大堆SPE都不具备独立的程序运算能力,只能辅助RSX进行浮点运算,确切地说是浮点着色运算——全是些简单的非超长程序着色指令级像素填充而已。这在实际游戏中对复杂着色特效帮助能力非常可怜,要不然PS3版的GTA4也不会仅能在1138x640分辨率下勉强达到24fps。反观真正意义上可以称为处理器的,具有程序全能性计算能力的PPE核心晶体管太少了,而且使用的是还是效率低下的顺序指令执行架构。而一但那6个(屏蔽一个,音效处理占一个)SPE全速帮RSX填充像素,PS3仅256MB容量XDR内存的25.6GB/s带将被斩掉18GB/s以上,真正的PPE逻辑运算可用数据带宽连7GB都不到,加上教条的指令顺序执行效率,内存数据交通随时有可能瘫痪。

2.Xbox360上的3核心Xenon处理器
        IBM为微软下属独立部门Mountain View开发团队(即Xbox 360开发团队)设计的Xenon处理器(和ATI设计的Xenons显示核心是两码事)晶体管规模1亿6500万、运算频率3.2GHz。65nm工艺制造,看起来比PS3的处理器规模小很多,但实际上Xenon没有Cell那些形同虚设的简单像素运算用SPE,而PPE逻辑运算电路规模更大。Xenon和Cell一样,都使用Power PC架构的处理器,与PC上的Core2或Athlon、Phonem相比效率差得太远。
        Xenon的逻辑电路由3个小型通用运算核心(PPE)组成,每个核心有两个工作线程,总共6线程。和Cell上那个PPE相比,Xenon的3个PPE平均下来规模更小。在实际游戏中一般只应用单线程至3线程,也是由于和PS3一样没有硬件音效处理芯片,Xenon必须还要占据一个线程对5.1声道进行软处理。游戏编程人员无视6线程最重要的原因,就是由于Xbox360为了省钱使用的统一内存显存体系。
        因为一旦处理器的6个工作线程全部开启,能够真正有多少游戏有效计算性能暂且不论,光从内存里读取和输送数据就要占用每秒20GB的带宽。而Xbox 360仅有1400MHz运作频率的DDR3速度可以提供的最大带宽只有每秒22.4GB,所以开启处理器6线程的同时就可以直接把正在运算长着色指令的Xenos关掉了,反正GPU的画面特效运算完只剩每秒2GB多点的显存带宽也传不到那512MB内存/显存里输送到屏幕上,直接关了还可以省点电。
        此外Xbox 360数据交通无比拥挤的统一内存上,任何一条Xenon的顺序指令架构执行工作线程都有可能让数据流动停止,如此严重的数据延迟,会使Xbox 360的游戏AI直接倒退到DX7时代,所以使用两条或三条工作线程是最明智的做法。与Cell同理由于PPE运算能力很低、指令执行方式很教条,Xenon总共只有1MB高速二级缓存,与Cell的PPE保持着相近的逻辑电路/缓存比。

[网络转载]令人惊叹!揭露ps3和xbox360的真实性能的评论 (共 条)

分享到微博请遵守国家法律