回首页
小熊论坛 | 用户名: 密码: 没有注册?
我现在的位置:小熊在线首页 -> 显卡频道 -> 正文

拳打26XT脚踢86GTS-8600GT深入详测

BEAREYES.COM 北京 [ 原创 ] 作者:小熊在线——WolStame 日期:2007年09月19日


第10页:释放管线的能量(中)

总之,Shader时代的GPU流水线已经越来越没有固定的渲染流程。而且Shader本身也开始变得不确定性。在ShaderModel 1.0时代,因为硬件和API的限制,开发人员只能写很“笨”的Shader。但到了ShaderModel 2.0,3.0以及最近DX10引入的4.0版本,Shader最大指令数的提高,临时暂存器数量的增加,纹理格式的丰富,以及一系列的流控制指令[像是循环(loops)、分支(branching)、呼叫(call)和返回(return)及子程序(subroutine)等]的引入,赋予了Shader真正的编程能力,Shader的结构已经变得越来越非线性。传统意义上的流水线在这种复杂shader下效率是很低的,必须引入Multi-Threading对这些复杂的渲染过程进行控制和管理,才能在流水线陷入存储器读取的时候切换线程,进行其他操作,掩盖内存延迟。合理利用到流水线的资源,单纯的增加GPU的平行管线数量已经难以获得有效的性能提升。小熊在线www.beareyes.com.cn

下图所示的是一个Multi-Threading体系对分支性能帮助的实例,这个分支进行的是对阴影边缘进行过滤的软阴影操作。小熊在线www.beareyes.com.cn

图中绿色区域代表指令前半段操作,也就是开头的「if」指令,而蓝色区域表示后半段的「else」指令,if不需要阴影处理,那所用的textures则保持不变;if指令遇到需要阴影处理,else指令就会指示shader开始阴影操作,红色的4×4像素区域就表示进行分支抉择的部位。如果Multi-Threading越强劲,那么能同时维持的Thread就更多,图中的块也可以做到更小。这种抉择体系的应用,无形中为Shader节约了大量的资源。

R6XX所有的执行单元被分成若干个SIMD单元矩阵,每个SIMD矩阵都有两个仲裁器,根据若干条件交错地给SIMD矩阵递交下一次执行的线程。小熊在线www.beareyes.com.cn

R6XX的线程仲裁管理机构一共能为每个SIMD阵列维持总共256个或者更多平行的Thread(线程)。线程调度处理器会动态监测整个Unified Shader流水线的工作状况。一旦它发现其下某个阵列由于等待数据或工作完成而处于闲置状态,就会马上递交一个新的线程供其执行。线程在这里可以被看做指令的容器,线程里面指令的性质不同,只要做好响应的状态保存读取就完全没有差别。每个线程的作用范围为一个Batch(也就是一个像素块,R6XX的Batch是8x8大小的64个相邻pixel小块)。小熊在线www.beareyes.com.cn

R6XX的线程分配管理器工作流程如下:

G8X的Multi-Threading体系也与之类似。不过不同的是,G8X的管理架构更庞大,更复杂。G8X的线程管理调度器的基本单位是multiprocessor。G8X的每个TPC有两个multiprocessor,每个multiprocessor具备24个warp,每个warp拥有32个独立的thread,而G84一共有2个TCP,所以G84的线程调度管理器一共可以同时维持多达3072个平行的thread。G8X的“warp”是跟R6XX的Batch类似的象素块,是线程作用的基本范围。因为一个warp的大小是8x4,所以G8X的线程切换单位是32个pixel。小熊在线www.beareyes.com.cn

《释放管线的能量(下)》...继续下一页>>

《释放管线的能量(上)》...返回上一页<<


[1] [2] [3] [4] [5] [6] [7] [8] [9] [10] [11] [12] [13] [14] [15] [16] [17] [18] [19] [20] [21] [22] [23] [24] [25] [26] [27] [28] [29] [30] [31] [32] [33] [34] [35] [36] [37] [38] [39] [40] [41] [42] [43] [44] [45] [46] [47] [48] [49] [上一页] [下一页]

《拳打26XT脚踢86GTS-8600GT深入详测》分页索引


第1页:前言
第2页:影响中端GPU的因素
第3页:摩尔定律的困境
第4页:参赛阵营简介1:NVIDIA GeForce 8600/8500
第5页:参赛阵营简介2:AMD-ATi Radeon HD 2600/2400
第6页:工艺制程的障碍与阻力
第7页:SIMD流水线的问题
第8页:流水线中的乾坤
第9页:释放管线的能量(上)
第10页:释放管线的能量(中)
第11页:释放管线的能量(下)
第12页:两家芯片的其他特点
第13页:参测产品ECS 8600GT介绍(上)
第14页:参测产品ECS 8600GT介绍(中)
第15页:参测产品ECS 8600GT介绍(下)
第16页:参测产品ECS 8600GT频率规格以及总结
第17页:测试环境和游戏选择
第18页:F.E.A.R. DX9.0c
第19页:上古卷轴4:湮没 DX9.0c
第20页:潜行者:切尔诺贝利的阴影 DX9.0c
第21页:幽灵行动:尖峰战士2 DX9.0c
第22页:科林麦克雷越野:尘埃 DX9.0c
第23页:英雄连 DX10
第24页:失落的星球:极限状态 DX10
第25页:狂野西部 DX10 benchmark
第26页:世界冲突 DX10
第27页:敌占区:雷神战争 OpenGL
第28页:性能测试结论
第29页:HDTV-电脑的专有玩物?
第30页:关于各类编码的详细分析(上)
第31页:我们用户关心的事情是?
第32页:什么编码最令人头痛
第33页:什么样的CPU能够满足H264/VC-1/MPEG2片源软解的要求
第34页:AMD/INTEL多达11款CPU的纯软解压测试-H.264
第35页:AMD/INTEL多达11款CPU的纯软解压测试-VC-1
第36页:AMD/INTEL多达11款CPU的纯软解压测试-MPEG2
第37页:NVIDIA PUREVIDEO介绍
第38页:解码器,分离器以及DXVA的概念
第39页:PowerDVD开启硬解设置指南
第40页:终极解码以及完美解码设置指南(上)
第41页:终极解码以及完美解码设置指南(下)
第42页:KMPlayer播放器设置指南(上)
第43页:KMPlayer播放器设置指南(下)
第44页:KMPlayer播放器设置H.264硬解指南
第45页:KMPlayer播放器设置VC-1硬解指南
第46页:KMPlayer播放器设置MPEG2硬解指南
第47页:如何确认自己已经打开硬加速(上)
第48页:如何确认自己已经打开硬加速(下)
第49页:PureVideo开启与否测试

全文

BEAREYES.COM 北京 日期:2007年09月19日

网友评论:(请各位网友遵纪守法并注意语言文明,留言仅供参考不代表本站立场) TOP↑
用户名: 密码: 没有注册?
点击排行
留言排行
小熊在线公司版权所有 beareyes.com ©1999-2007 All Rights Reserved
本网站由 北京快网 提供FastDNS智能解析服务