用户
 找回密码
 立即注册
搜索

PS3的未来?CELL-SPE来形成类似DX10的GS流水线!

[复制链接]
发表于 2006-11-13 20:50:00
原帖由 Edison 于 2006-11-13 20:32 发表

当然是直接PASS给Setup,然后就给PS/TMU处理了。
直接忽视VS/T&L这层 直接丢给Rasterzier 类似最古老的Fixedfunction  #不对Vertex操作么
看来太习惯于D3D这套ProgramPipeline的观念
使用道具 举报 回复 支持 反对
发表于 2006-11-13 22:46:00
原帖由 ayanamei 于 2006-11-13 20:50 发表

直接忽视VS/T&L这层 直接丢给Rasterzier 类似最古老的Fixedfunction  #不对Vertex操作么
看来太习惯于D3D这套ProgramPipeline的观念
都说XO的C1由于US的关系可以把shader资源全部做VS或者PS,我很想知道如果没有VS,PS的数据从哪里读入?没有了PS,VS的数据又怎么到ROP?DX10之前的封闭流水线结构是不允许shader直接访问内存单元的。就算DX10,VS也是必须存在的部分,PS虽然可以不要,但是最终大部分的AP还是必须PS的。
使用道具 举报 回复 支持 反对
发表于 2006-11-13 22:53:00
原帖由 vp 于 2006-11-13 22:46 发表

都说XO的C1由于US的关系可以把shader资源全部做VS或者PS,我很想知道如果没有VS,PS的数据从哪里读入?没有了PS,VS的数据又怎么到ROP?DX10之前的封闭流水线结构是不允许shader直接访问内存单元的。就算DX10 ...
trangle setup之后VS操作Vertex 然后交给PS
如果PS全部繁忙状态情况下 把VS threading挂起 切换到PS threading  这样反复来回切换
反之亦然
实际threading数量肯定是比shader单元多得多的
这些theading需要消耗寄存器
不需要访问内存 
使用道具 举报 回复 支持 反对
发表于 2006-11-13 23:46:00
trangle setup是在CPU/VS完成VS动作后操作。
使用道具 举报 回复 支持 反对
发表于 2006-11-14 00:10:00
原帖由 vp 于 2006-11-13 22:46 发表

都说XO的C1由于US的关系可以把shader资源全部做VS或者PS,我很想知道如果没有VS,PS的数据从哪里读入?没有了PS,VS的数据又怎么到ROP?DX10之前的封闭流水线结构是不允许shader直接访问内存单元的。就算DX10 ...
PS的数据直接从光栅化单元取出。不要忘记,就算是古老的fixed T&L,也是有transformed vertex的,它就直接跳过所有几何变换和后几何变换(主要是齐次空间归一->屏幕坐标变换)。
后来的DX,在支持上面那种方式外,如果不想使用硬件vs,那就把device设为mixed,然后调用CPU运算就可以咯。
XO的48:0,大概只能是memexport使用的时候了吧。
至于0:48,大概主要时机是image space操作时了。这时哪怕不涉及上面那些方式,只凭借调度器也基本可以达到这种比例,毕竟顶点和像素操作的复杂度相差太多,调度器的time slice又不可能过于长……
使用道具 举报 回复 支持 反对
发表于 2006-11-14 00:26:00
原帖由 Edison 于 2006-11-13 23:46 发表
trangle setup是在CPU/VS完成VS动作后操作。
Rasterzier的开始第一步
哎 不行了
好多东西就忘得差不多了
不水贴了  复习去

低级错误越来越多
使用道具 举报 回复 支持 反对
发表于 2006-11-14 00:27:00
原帖由 hourousha 于 2006-11-14 00:10 发表

PS的数据直接从光栅化单元取出。不要忘记,就算是古老的fixed T&L,也是有transformed vertex的,它就直接跳过所有几何变换和后几何变换(主要是齐次空间归一->屏幕坐标变换)。
后来的DX,在支持上面 ...
恩 US应该可以切换threading 平衡VS/PS开销
使用道具 举报 回复 支持 反对
发表于 2006-11-14 08:49:00
原帖由 PS5
2006-11-13 18:45 发表
RSX如果专门针对CELL设计,可以
把VS省略,只加PS就可以了,VS留
给CELL来做
為什麼大家都很想把RSX的VS給省
略? 嫌Cell資源太多?
使用道具 举报 回复 支持 反对
发表于 2006-11-14 09:55:00
对架构完全没有概念的人...以为运算核心放在哪里都一样吗? 只要flops足够就可以?
8个VS, 500Mhz, 极端的时候可能会输出多少带宽? FlexIO还剩下多少? 这个带宽消耗既然可以避免为什么还要舍近求远?

我看到ID以数字做结尾的人就很郁闷。
使用道具 举报 回复 支持 反对
发表于 2009-10-16 18:18:18
感觉Ps3的结构太复杂了啊,类似的DX10的GS流水线只是理论上可能成立啊,不过制造商怎么利用又是一回事了。
使用道具 举报 回复 支持 反对
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则