GeForce GTX 580 アーキテクチャの特徴
新しい GeForce GTX 580 は革新的なものではありません。 同社のエンジニアが直面した主なタスクは、以前に犯した過ちを修正することと、主要な競合他社である AMD を大幅に上回るパフォーマンスを向上させることでした。

残念ながら、新しいアーキテクチャに基づいた最初のアクセラレータである GeForce GTX 480 は、NVIDIA エンジニアが内蔵したすべてのコンピューティング機能を受け取ることができませんでした。 GPU GF100。実際のところ、製品版 GTX 480 モデルでは 16 個のストリーミング マルチプロセッサーのうち 32 個が無効になっており、その結果、そのステータスにもかかわらず、新しい最上位モデルは XNUMX 個の CUDA コア、XNUMX 個のテクスチャ ユニット、および XNUMX 個のポリモーフ エンジンを失いました。おそらく、NVIDIA のエンジニアがそのような措置を講じたのは、Fermi ベースのソリューションのリリースに備えて、かなり長い間同社を悩ませてきた生産上の問題のためだけでした。ただし、今ではこれはそれほど重要ではなくなりました。 GPU GF110 は 16 個の SM をすべて自由に使用できます。これは、512 個の本格的な CUDA コア、64 個の TMU ユニット、および 16 個の Polymorph Engine モジュールを意味します。さらに、NVIDIA エンジニアは、GeForce GTX 580 が 16 ビット精度 (FP16) でフルスピードの浮動小数点テクスチャ フィルタリングを実行できるようにするための多くの変更を加えました。これにより、大量のテクスチャ作業を必要とするアプリケーションのパフォーマンスを向上させることができます。 。
実際のところ、GeForce GTX 480 でのテクスチャリング速度は、重要なフィルタリングで 64 ビット (fp16x4) フォーマットを使用すると半分に低下します。 たとえば、バイリニア フィルタリングを使用して fp16x4 フォーマットからテクスチャリングする場合、速度は 30 ビット フォーマットの 60 PPC と比較して、32 クロックあたり 580 ピクセル (PPC) に低下します。 GeForce GTX 32 では、そのようなフォーマットからのテクスチャリングは「フル スピード」で行われます。 バイリニア フィルタリングを使用する 64 ビットと 64 ビットの両方のフォーマットは、XNUMX PPC で動作します。
さらに、GeForce GTX 580 では、目に見えないサーフェスの Z カリングのブロック除去が改善されています。 GF100 GPU の場合、特定の Z バッファ フォーマットを使用すると、Z カル ユニットの効果が低下しました。 GF110 での新しい Z カリング深度バッファー表現形式の導入により、この問題は解決されました。 一般に、GeForce GTX 580 の前の主力製品である GeForce GTX 480 と比較したパフォーマンスの向上は、主にアクティブな機能ブロックの数の増加と動作周波数の増加によるものであり、アーキテクチャによる影響はそれほど大きくありません。 Z-Cull ブロックの強化に関連する改善、および FP16 テクスチャ フィルタリングの速度の向上。
ここで完全に正当な疑問が生じます。新しいアクセラレータの消費電力をどうするかということです。以前のフラッグシップである GeForce GTX 480 の重大な欠点の 580 つが、ワットあたりのパフォーマンスの最高の比率からはほど遠いことは周知の事実だからです。消費されるエネルギーの。新しい GeForce GTX XNUMX の場合、NVIDIA エンジニアが徹底的な再設計を実行したため、この問題も解決されました。 GPU、重要な場所にリーク電流が低いトランジスタを使用しています。これにより、以前の上位の値と比較して GTX 580 の動作周波数を上げることができるだけでなく、GeForce GTX 480 と比較して新しいフラッグシップの消費電力を削減することもできました。
他のほとんどの最新の NVIDIA アクセラレータと同様に、GeForce GTX 580 は NVIDIA PhysX および CUDA テクノロジを完全にサポートしており、さまざまな種類の並列コンピューティングに GPU リソースを使用できます。 PhysX エンジンに基づくゲーム。 残念ながら、現時点では NVIDIA PhysX テクノロジをサポートするゲームはそれほど多くありませんが、バットマン アーカム アサイラム、マフィア II、メトロ 2033 などの非常に優れたプロジェクトがいくつかあります。
NVIDIA Surround および NVIDIA 3DVision Surround テクノロジは言うまでもありません。 実際、NVIDIA Surround は、AMD が 2009 年の秋に発表した Eyefinity テクノロジのやや限定的な類似物です。 NVIDIA Surround の本質は、3 台のモニターをコンピューターに接続することで、ユーザーがそれらを 3 つのワークスペースに結合できるという事実にあります。これは、システムが 120 つの大きなモニターと見なすものです。 NVIDIA サラウンドの制限は、XNUMX 台以上のモニターを XNUMX つのスペースに結合できないこと、および NVIDIA サラウンド テクノロジを有効にするために SLI モードで少なくとも XNUMX 組の NVIDIA ビデオ カードを使用する必要があることに関連しています。 NVIDIA XNUMXDVision Surround に関しては、このテクノロジにより、NVIDIA XNUMXD メガネと XNUMX つの XNUMX Hz モニターを組み合わせて使用することにより、仮想世界での存在感をさらに高めることができます。
新しい GTX 580 CO は GTX 480 のリファレンス バージョンのクーラーとは著しく異なるという事実にもかかわらず、ノベルティの冷却システムの設計は、多くの NVIDIA ハイエンド製品に固有の特徴を示しています。 お気づきかもしれませんが、GTX 580 の新しい冷却システムには、GeForce GTX 480 CO にあったヒート パイプがありません。今回は、最上位の NVIDIA アクセラレータの冷却システムは蒸発チャンバーに基づいています。 グラフィックプロセッサはプラットフォームと接触しており、その真上には密閉されたコンパートメントがあり、低沸点の液体が含まれています。 温度が上昇すると、液体は凝集状態を変化させて気体になり、冷却システムの上部に熱を伝達します。 少し冷却すると、気体が凝縮して再び液体になり、サイクルが再び繰り返されます。 次に、タービンは、加熱されたラジエーター フィンを介して冷気を駆動し、ケースの外に熱を取り除きます。 ビデオメモリと電源システムの要素は、特別なサーマルパッドを介してクーラーの金属ベースと接触しています。
GF110 グラフィックス プロセッサには 8266 つの電源フェーズがあり、CHiL Semiconductor CHL480 コントローラによって制御されます。これは、GeForce GTX 1 のリファレンス バージョンにインストールされていたものとまったく同じです。メモリは、1 + 1 方式 (1 フェーズ Vdd + 7066 相 Vddq)、Anpec APW9800 コントローラーによって制御されます。 GeForce XNUMX GTX でも同様のコントローラーが使用されていました。 この場合、XNUMX つのデュアル チャネル コントローラが両方のビデオ メモリ電圧 (Vdd と Vddq) を、各電圧に XNUMX つのチャネルで制御します。
次のイノベーションは、メインの 12 V ビデオ カード電源ライン (6 ピンと 8 ピンの電源コネクタ、および PCI-Express スロット) の電流と電圧をハードウェアで監視するメカニズムでした。 仕様で許可されている値を超える過剰な電力がビデオ カードに供給されると、ドライバはアクセラレータのクロック周波数を自動的に下げて、アクセラレータの障害を防ぎます。 メーカーは特に、OCCT や FurMark などのストレス テスト ユーティリティを実行すると、最新の NVIDIA ドライバーがアクセラレータの動作周波数を自動的に 50% 下げるという事実に注目しています。 NVIDIA のエンジニアによると、このようなプログラムはビデオ カードに重大な負荷を発生させますが、実際のアプリケーションはそのような負荷を発生させることはありません。 そのため、ドライバーによって人為的に周波数を下げることが決定されました。 また、エンド ユーザーがこの制限を解除できないことも報告されています。 残念ながら、現時点では、ドライバーの保護メカニズムによって引き起こされる周波数の低下を追跡できるユーティリティはありませんが、適切な更新プログラムのリリース後、ユーザーは作業のすべての変更に気付くことができますGeForce GTX 580 ビデオ カード。

周波数 GPU 新製品は 772 MHz (コア周波数の 1544 倍で動作するシェーダ ドメインの場合は 10 MHz) です。これは、GF100 ビデオ カード GeForce GTX 480 (700/1401 MHz) の動作周波数よりも約 XNUMX% 高くなります。アーキテクチャの改善を考慮する GPU GTX 580 のパフォーマンス上の利点はさらに重要になる可能性があります。
| 仕様 NVIDIA GeForce GTX 580 |
|
GeForce GTX 580 のリリース前に、NVIDIA が GeForce GTX 480 の明らかな欠点を解消するために真剣かつ骨の折れる作業を行ったことは容易にわかります。前世代と比較して消費電力が低く、発熱が少ない GPU そしてかなり静かな冷却システム - 新製品が GTX 480 よりも著しく高速であることが判明したという事実にもかかわらず、さらに、多くのアプリケーションでは GTX 580 が Radeon HD 5970 よりも生産性が高いことが判明しました。




