几何效能,PowerPlay

AMD 不但改良其架构的缺失,该公司工程师也进一步提升显卡的既有强项。几何着色器的效能已经改良,这并不令人意外,这种类型的着色器也才诞生不久,前一代架构即是 AMD 或 Nvidia 建置的第一版本,现在他们终于有时间来改良其第一版本了。就像 Nvidia,AMD 增加了几何着色器的输出缓冲大小,以在 GPU 上保存更多资料。同一时间内处理的几何着色器执行绪数已经增加为四倍,现在让我们来看看这些改良之处的实际效果:

虽然 RV770 在 Galaxy 效能测试表现并不令人印象深刻 (读者可以注意到 GT200 超出 G92 的幅度有限,似乎不太受缓冲大小的影响),但在 Hyperlight 就发挥了潜能,落在 GTX 280 之后成为第二。

让我们将重点放在几何效能上继续测试,这次搭配顶点着色:

再次不意外的是,AMD 架构仍然领先。但还是有另人失望之处,因为通常我们会期待具有 800 ALU 的架构能创造更佳的分数。但实际上目前所有 GPU 仍受到设定引擎的限制,在最佳情况下也只能每个周期跑一个三角形。The Vertex Shader 3.0 测试无法在 RV770 上执行。

让我们继续看顶点着色器的效能,不过这次专门锁定在纹理撷取 (fetching) 上-这是个实用的技巧,尤其是置换贴图 (displacement mapping) 时。Nvidia 在 Earth 测试保有些微的优势,但在 Waves 测试中,AMD 远远超前-甚至让 Nvidia 最夯的新系列产品落后。

PowerPlay

AMD 也改善了 GPU 功耗的管理方式,尤其是导入了可在芯片的特定组件不使用时关闭的时脉选通 (gating) 功能。AMD 也修正了搭配中阶或低阶 CPU 时 RV670 上所出现的电源管理错虫。以前在搭配上述 CPU时,RV670 有时候会使用率不足而切换为低耗电模式,当 CPU 完成数据处理并突发传送数据时,GPU 必须转移回高效能模式,此时需要几个周期处理,因此会造成顿顿的现象。

GPU 上的微控制器也可以读取以下数据:

  • 散布在 GPU 上不同传感器的温度;
  • 不同 GPU 区域的活动。这个微控制器也控制了根据读数反应的时脉选通功能与 GPU 的频率,降低了驱动器层面的成本。

Google 广告
广告
显示卡的文章和评比