Radeon HD 4000 系列
对 AMD 而言,这称不上愚蠢之举。大家都深知大多数的销售数字并不是来自 623.61 到 935.39 美元之间的高阶卡,而是定价 233.85 到 467.69 美元之间的「平价」产品。但 AMD 此举仍隐含风险。虽然显示卡制造厂商的多数利润来自初阶与中阶卡,但高阶产品仍扮演了尖端技术展示橱窗的角色。当 Geforce 8800 在效能测试上领先时,Geforce 8600 会比 Radeon HD 2600 好卖,因为 HD 2900 的不良名声已经深植人心-无视中阶卡的表现可能又是另一番景况。但在我们担心 AMD 此世代的未来成功度之前,先更进一步观察这个架构所带来的牛肉吧。
Radeon HD 4000
| Card | HD 4850 | HD 4870 |
|---|---|---|
| GPU clock frequency | 625 MHz | 750 MHz |
| RAM clock frequency | 993 MHz | 900 MHz |
| ALUs | 800 | 800 |
| Texture units | 40 | 40 |
| ROPs (Raster Operation units) | 16 | 16 |
| Memory controller | 256 bits (8 channel 32 bits) | 256 bits (8 channel 32 bits) |
| RAM type | GDDR3 | GDDR5 |
创新记录! 以其 160 个五路 (five-way) VLIW 着色器单元 (总计 800 个 ALU),RV770 拿走了 GT200 的王座,它 993 Mflops 的效能成为首次超越 1 Tflop 象征性目标的首款 GPU (HD 4850 为 1 Tflop,而 4870 为 1.2 Tflop)。令人更为印象深刻的是这是以仅仅不到 260 mm² 体积的 GPU 达成的成绩。
但令人高兴的意外还不仅止于此。AMD 善用这个新架构-我们终于说出憋了很久的话-以增加纹理单元的数目!新架构已有 40 个单元,而 R420 仅有 16 个。即使这离 Nvidia 的 80 个单元还有一段距离,但增量已相当可观。事实上,AMD 仍未放弃原则。纹理单元照 ALU 数目比例增加:较之 RV670 的 64 个处理单元,RV770 拥有 160 个-处理能力增加为 2.5 倍,同时原本 16 个纹理单元也以相同倍数增加到 40 个。因为 AMD 认为上一代架构中算术指令与纹理指令之间 4:1 的比例是很好的平衡,因此在新 GPU 上再次使用相同概念。
如果读者比较竞争的 Nvidia 架构,可以看出新款 GT200 已重新调整这个比重,但 RV770 在较高数目的算术作业时仍较为轻松。AMD 最新 GPU 上滤波的处理能力/纹素 (texel; 纹理像素简称) 比例为 40:1,竞争产品则为大约 20:1。让我们用常用的理论值效能测试程序来测试其间的差异。(注意:虽然 Radeon HD 4870 最适合这次用来分析 GPU 架构的综合测试,但 AMD 订定的推出日期有点草率,导致现在仍未供货。所以我们别无选择,只能先以 HD 4850 进行测试,所以效能成绩可能会让 AMD 稍觉不利。)

就像我们对待 GT200,我们先从简单的来,使用只支持 Pixel Shader version 2.0 的 RightMark 3D 版本。事实上,HD4850 在 PS2.a 与 2.0a 测试都击败了 GTX 280,而在 PS2.0 测试上显得没那么轻松。虽然可以轻易理解的是 RV770 较适合用在进阶打光模型上,我们原本期待它能在善用其惊人处理能力的程序化着色器测试上表现更好一些。
