Radeon R9 290X
AMD Radeon R9 290X グラフィックス カードの心臓部にある新しいハワイ グラフィックス チップは、私たちがすでに知っている Graphics Core Next (GCN) アーキテクチャに基づいています。以前は、Radeon R11.2 7790X のベースにもなったチップ Bonaire (Radeon HD 7) で行われていました。 Bonaire と Hawaii でのアーキテクチャの変更は、コンピューティング機能の改善 (より多くの同時実行スレッドのサポート) と、AMD PowerTune テクノロジの新しいバージョンに関連しています。これについては、以下で詳しく説明します。

DirectX 11.2 の新機能には、Hawaii のハードウェア仮想メモリ管理機能を活用するタイル リソースが含まれます。 GPU部分常駐テクスチャ (PRT) と呼ばれます。仮想ビデオ メモリを使用すると、アプリケーションで大量のテクスチャを使用し、それをビデオ メモリにストリーミングできるアルゴリズムの効率的なハードウェア サポートを簡単に得ることができます。 PRT を使用すると、このようなタスクでビデオ メモリを使用する効率を高めることができ、同様の技術は一部のゲーム エンジンですでに使用されています。
GCNの機能は拡張されましたが、AMDが新しいトップエンドを設計する際の主な目標は GPU タヒチはすでに電力を消費しすぎていたが、ハワイにはさらに多くの計算ユニットが搭載されたため、チップのエネルギー効率が向上した。 AMD のエンジニアが競争力のある製品を市場に投入するために何を成し遂げたかを見てみましょう。

新しいグラフィック プロセッサは論理的に 11 つの部分 (シェーダー エンジン) に分割され、それぞれに XNUMX の拡大されたコンピューティング ユニット (コンピューティング ユニット) が含まれています。これには、テクスチャ モジュール、XNUMX つのジオメトリック プロセッサとラスタライザー、およびいくつかの ROP ユニットが含まれます。 言い換えれば、最新の AMD チップのブロック図は、同様の構成を持つ NVIDIA チップの図にさらに似ています。
合計で、Hawaii グラフィックス チップには、44 個のストリーム プロセッサ、2816 個の ROP ブロック、および 64 個の TMU ブロックを含む 176 個のコンピューティング ユニットが含まれています。検討中 GPU 512 つの 64 ビット コントローラで構成される 1 ビットのメモリ バスと 28 MB の L6.2 キャッシュを備えています。これは、Tahiti と同じ 4.3 nm プロセス技術を使用して製造されていますが、XNUMX 億個のトランジスタが含まれています (Tahiti は XNUMX 億個)。
Hawaii GPU を構成するシェーダー エンジンのブロック図を考えてみましょう。 これは、次の XNUMX つのエンジンを含むチップの大きなブロック部分です。
各シェーダー エンジンには、クロック サイクルごとに 1 つのジオメトリ プリミティブを処理できる 1 つのジオメトリ プロセッサとラスタライザーが含まれています。ハワイの幾何学的パフォーマンスは向上しただけでなく、以前のバージョンと比較してかなりバランスが取れているように見えます。 GPU AMD 企業。

GCN アーキテクチャ シェーダー エンジンには、それぞれ 11 つの ROP ブロックを含む最大 11 つの拡大された Render Back-end (RB) ブロックを含めることができます。 シェーダー エンジンのコンピューティング ユニットの数も異なる場合がありますが、この場合は 12 個ありますが、命令と定数のキャッシュは XNUMX つのコンピューティング ユニットごとに分割されます。 つまり、シェーダー エンジンに XNUMX ではなく XNUMX のコンピューティング ユニットを含める方がより論理的ですが、そのような数はハワイの消費電力制限に含まれなくなったようです。
GCN アーキテクチャのコンピューティング ユニットには、テクスチャ フェッチ モジュール (16 個)、テクスチャ フィルタリング モジュール (16 個)、分岐予測ユニット、スケジューラ、計算ユニット (64 つのベクトルと XNUMX つのスカラー)、第 XNUMX レベルのキャッシュなど、さまざまな機能ユニットが含まれています。メモリ (コンピューティング ユニットあたり XNUMX KB)、ベクトルおよびスカラー レジスタ用のメモリ、および共有メモリ (コンピューティング ユニットあたり XNUMX KB)。
Hawaii GPU には 4 つのシェーダ エンジンがあるため、ジオメトリ処理ユニットとラスタライズ エンジンは合計 4 つあります。したがって、新しいトップ GPU AMD は、クロック サイクルごとに最大 4 つのジオメトリ プリミティブを処理できます。さらに、ハワイではジオメトリデータのバッファリングが改善され、ジオメトリプリミティブパラメータのキャッシュが大きくなりました。これらを組み合わせることで、ジオメトリ シェーダーでの大量の計算とテッセレーションの積極的な使用により、パフォーマンスが大幅に向上します。
また、グラフィカルではありますが、新しいプロセッサのコンピューティング機能にもいくつかの変更が加えられました。 このチップには、PCI Express 3.0 バス機能をフルに活用する 16 つの DMA エンジンが含まれており、XNUMX GB / s の双方向帯域幅が宣言されています。 XNUMX つの (ハワイ チップの場合) 非同期コンピューティング エンジン (ACE) を使用して実行される非同期コンピューティングの可能性も、比較的新しいと言えます。

ACE ユニットはグラフィックス コマンド プロセッサと並行して動作し、それぞれ 2 つのコマンド ストリームを管理できます。この構成により、マルチタスク環境での独立したスケジュールと操作、グローバル メモリと LXNUMX キャッシュ内のデータへのアクセス、および高速なコンテキスト切り替えが実現します。これは、コンピューティングタスクやゲームアプリケーションで特に重要です。 GPU グラフィカルコンピューティングと一般的なコンピューティングの両方に使用できます。この革新は、理論的には、機能への低レベルのアクセスを使用する場合にも利点となる可能性があります。 GPU Mantle などの API を使用します。
グラフィカル コンピューティングに適用されるハワイの機能に戻りましょう。 拡大が予想される許可要件の上昇のため UltraHD モニターでは、ラスター操作ユニット (ROP) の計算能力を高める必要があります。 Hawaii チップには 16 の Render Back End (RBE) ブロックが含まれており、これは Tahiti の 64 倍です。 64 個の RBE には XNUMX 個の ROP が含まれており、XNUMX クロックあたり最大 XNUMX ピクセルを処理できます。これは場合によっては非常に便利です。
メモリ サブシステムに関しては、ハワイには 1 メガバイトの L16 キャッシュがあり、64 KB の 33 のセクションに分割されています。 キャッシュ メモリが 2% 増加し、内部スループットが 1 分の 1 増加したと主張されています。 LXNUMX / LXNUMX キャッシュの合計スループットは、XNUMX TB / s と宣言されています。
メモリは、64 ビット バスを構成する 512 つの 9 ビット コントローラを介してアクセスされます。 Radeon R290 5.0X のメモリ チップは 320 GHz で動作し、Radeon HD 20 GHz よりも 7970% 以上高い 20 GB/秒の合計メモリ帯域幅を提供します。 同時に、メモリ コントローラーが占有するチップ面積は、タヒチの 384 ビット コントローラーと比較して XNUMX% 削減されました。
Radeon R9 290X の仕様
| 名前 | Radeon R9 290X |
| コア | ハワイ |
| プロセス技術 (µm) | 0.028 |
| トランジスタ (百万) | 6200 |
| コア周波数 | 1000 |
| メモリ周波数 (DDR) | 5000 |
| バスとメモリの種類 | GDDR5 512 ビット |
| 帯域幅 (Gb/秒) | 320 |
| 統合されたシェーダー ブロック | 2816 |
| 統合されたシェーダー ユニットの頻度 | 1000 |
| コンベアあたりのTMU | 176 |
| ROP | 64 |
| フィルレート (Mpix/秒) | 64600 |
| 充填率 (Mtex/秒) | 176400 |
| DirectXの | 11.2 |
| メモリ容量 | 4096 |
| インターフェース | PCI-E 3.0 x16 |
先代のRadeon HD 7970と比較、ハワイの性能 Radeon R9 290X と比較すると、約 40 ~ 60% 増加します。




