用户
 找回密码
 立即注册
搜索

关于G80 shader performance的疑问

[复制链接]
发表于 2006-10-20 09:39:00
网断了,这两天没空...
要不真得让8800跑跑那个未优化的版本
X1900XT是221 FPS吧?
使用道具 举报 回复 支持 反对
发表于 2006-10-20 09:44:00
不知道G80在寄存器限制上面有没有改观...
使用道具 举报 回复 支持 反对
发表于 2006-10-20 09:59:00
原帖由 RacingPHT 于 2006-10-20 09:44 发表
不知道G80在寄存器限制上面有没有改观...
DX10 好象改变了寄存器定义吧? 大量的片外寄存器
NV30死有瞑目?
使用道具 举报 回复 支持 反对
发表于 2006-10-20 11:18:00
原帖由 txdyr 于 2006-10-20 06:51 发表
G80会不会象当初5800仓促上阵(不是指性能,而是指存在时间),没多久来个G81顶上呢
嗯.... 這不太清楚。

G80這個結構確定是已經存在很久了,當初從NV47/NV50 rename(2004年11月),
當時NV50就已經存在了,但是效率並不是很好;然後經過不斷修正,
才能達到現在這樣shader時脈超過核心時脈兩倍以上的結構,而且還是比G73-B1要早定案。

所以,如果G80照現在知道還是TSMC 90nm生產的話,那毫無疑問地65nm成熟之後很快就會推出新版,
存在時間就不會太長了。
只是NV30當初存在問題,NV35上場替換的時間非常短;
G70即使預定由G71替換,時間仍然拖得很長,以求盡量利用其經濟價值,
所以G81完成之後,離推出取代G81也應該有一定間隔才是。
使用道具 举报 回复 支持 反对
发表于 2006-10-20 12:15:00
原帖由 Eji 于 2006-10-20 11:18 发表


嗯.... 這不太清楚。

G80這個結構確定是已經存在很久了,當初從NV47/NV50 rename(2004年11月),
當時NV50就已經存在了,但是效率並不是很好;然後經過不斷修正,
才能達到現在這樣shader時脈超過核心時 ...
G80是如何使shader的时脉达到核心的2倍的呢?对这个比较感兴趣。

还有就是G80做这么大的fillrate到底有何用意?
使用道具 举报 回复 支持 反对
发表于 2006-10-20 13:44:00
原帖由 XDR3 于 2006-10-20 12:15 发表

G80是如何使shader的时脉达到核心的2倍的呢?对这个比较感兴趣。
还有就是G80做这么大的fillrate到底有何用意?
G70已經實現Shader/core不同步,雖然只是定比例。
這可以說已經比Northwood的2x ALU要來得驚人了....
不過時脈不同步時,訊號的同步、資料的吞吐都會成為問題,
這些細部結構的設計都是很大的挑戰,似乎還沒有人去嘗試過G70到底可以容許多大的差距。

總之G70已經提供了非等頻shader的基礎,之後就是"可以達到多大的差距"的問題。
以目前來說,G80感覺上最大的問題是高頻Shader的物理狀況如何維持,
聽ghrs2010提到,過高的頻率是會讓shader部分掛掉的。
(不過其實降頻比較多的反而是core部分.... core從750降至575,反而shader是從1500微降至1350)

此外,US其實從觀念上來看,相對於VS/PS的部份最大的差距也是在Texture上。
因為除卻Texture,ALU部分的落差是很小的。
所以如果要做出一個獨立於Shader的Texture結構,就代表它本身就要有一定的延遲隱藏能力,
而不是像過去那樣由PS的threading來做部分的保護工作。

比方說,R5x0的PS每bank thread數和C1的總thread數有相當大的差異,
NV40的VS與PS的thread總數也有極大的落差,大過VS與PS間的個數差距許多,都和這個有一定程度的關係。

最後,由於VS/GS/PS現在都存在著sampler,也就是VS/GS/PS都會需要texture,Texture unit必須能夠提供這些不同單位各自不同的需求。
所以,DX10的Texture單元存在著稱為Texture Array的結構,來同時滿足各種不同的texture需求。

如果有留意的話,C1的ROP規模大約是8pixel、但是TMU的總規模則是16個。
照當初ATI在宣佈R520/R580時的說法,這算不算是一種超量?
不過如果把上面提到的幾個特性(VS/GS/PS都會用到texture)考慮進去的話,其實就沒那麼大的問題。
使用道具 举报 回复 支持 反对
发表于 2006-10-20 18:22:00
原帖由 Eji 于 2006-10-20 13:44 发表



G70已經實現Shader/core不同步,雖然只是定比例。
這可以說已經比Northwood的2x ALU要來得驚人了....
不過時脈不同步時,訊號的同步、資料的吞吐都會成為問題,
這些細部結構的設計都是很大的挑戰,似 ...
G80的shader/core不同步,那么高的频率,是否稳定呢?
使用道具 举报 回复 支持 反对
发表于 2006-10-20 18:29:00
eji说的应该是这个

当时的评测说:
 nVIDIA的首席科学家David Kirk也公开承认了G70内建多个频率“对我们来说,现在很难再说‘G70的核心时钟频率是多少多
少赫兹了’”……我们不愿被人们指过分夸大时钟频率,所以我们在谈及其核心频率时选择了一个相对保守的数字。不过,这只是其多
时钟频率的其中一个而已。”
使用道具 举报 回复 支持 反对
发表于 2006-10-20 18:53:00
原帖由 Eji 于 2006-10-20 13:44 发表



G70已經實現Shader/core不同步,雖然只是定比例。
這可以說已經比Northwood的2x ALU要來得驚人了....
不過時脈不同步時,訊號的同步、資料的吞吐都會成為問題,
這些細部結構的設計都是很大的挑戰,似 ...
Eji大又回来上课了,搬板凳听讲
使用道具 举报 回复 支持 反对
发表于 2006-10-21 04:13:00
話說剛剛去問的結果,G80把 programmable part 和 Fix function part分得蠻清楚的。
前者自然是shader,後者就是TMU 和 ROP之類的地方....
所以TMU是64個、575MHz,獨立於Shader之外,fillrate為36.8Gtexel/s,應該是支援FP32 Filtering。
ROP的數量不明,不過應該可以估計是24個,分成六組64bit。

這回TMU還維持這麼大的量(而且顯然破壞NV40/G70的平衡),應該是非常值得探討的地方。

此外,另外有個問題,就是G80的65nm版。
R600雖說有很多來源指出是80nm製造,但是以ATI先前的發表來說,R600應該是65nm產品。
如果R600是65nm的話,那麼G80的die size較大就會顯得比較合理,R600也應該不會只有500M。
使用道具 举报 回复 支持 反对
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则