enfrdepluk
検索結果 4120  ディスカスソシア  tg2 f2 lin2 in2 ×アイコン3 y2  p2 ティック steam2

Radeon HD 3870 アーキテクチャーの特徴

4574242

DirectX 10 をサポートする第 2600 世代の大容量グラフィックス プロセッサとそれに基づくビデオ アダプタが、まず第一に、パフォーマンスの面で非常にうまくいかないことが判明したことは、今日では誰にとっても秘密ではありません。 革新的なアーキテクチャにもかかわらず、ATI Radeon HD 8600 と Nvidia GeForce 128 は、ゲームでうまく機能せず、完全ではありませんが、多くの場合、前世代のソリューションに屈服しました。不十分な最適化ドライバー。 同様に重要な制約は、特に FSAA と高解像度を使用する場合、最新のゲームで GPU をデータで飽和させることが明らかにできない XNUMX ビット メモリ バスのグラフィックス市場の両方の巨人による使用でした。

ATI Technologies のすべての資産の現在の所有者である AMD は、特に消費者向け 2006D グラフィックス セクターにおける同社のますます不安定な地位に照らして、「報復の武器」で急ぐ必要があるように思われました。 AMD のリーダーシップの下、今年の暦年の 40 年第 2006 四半期の ATI の収益は、19,1 年の第 27,6 四半期と比較して 670% 減少しました。一方、ATI の Radeon 市場シェアは、両社の合併発表時の 19% から 2.30% に減少しました。 ATI と AMD。 明らかに、AMD は状況を是正し、軌道に戻すための措置を緊急に必要としていました。 新しい RV670 GPU の迅速な発表とそれに基づくソリューションの大量出荷の確立は、特にプロセッサが昨年 XNUMX 月に正常にテストされたため、まさにそのような手段である可能性がありますが、Advanced Micro Devices は新しい ATI Radeon を発売することを決定しました。 「スパイダー」というコードネームの新しいゲーム プラットフォームの発表の一環としての HD ライン。 同様に、AMD Phenom プロセッサが必要なクロック速度に到達するという問題が原因で、その発売は繰り返し延期されてきました。 その結果、プラットフォームの発表は XNUMX 月 XNUMX 日まで延期され、この時点でさえ、新しい AMD プロセッサは XNUMX GHz にしか到達できず、グラフィックス部門は損失を被り続けました。 ただし、RVXNUMX に戻ります。遅れはありましたが、それでもようやく光が見えました。

以前、ATI Technologies は、その製品名の混乱について、繰り返し正当に批判されてきました。 アドバンストマイクロデバイスの一部門である彼女は、今もその習慣を変えていません。 RV670ベースのビデオアダプタはRadeon HD 2950と呼ばれることが予想されていましたが、これは常識の観点からは非常に論理的であり、新しいチップは革新的とは言えませんでした。 それは R600 の自然な進化の発展でした。 代わりに、命名システムが完全に変更され、新しいファミリは Radeon HD 3800 と呼ばれ、あたかも新世代の GPU に基づいているかのようになります。 DirectX 10.1 のサポートの存在は、新製品に「次世代ソリューション」のステータスを割り当てるための根拠ではありませんでしたが、行われたことは行われ、新しい AMD ATI Radeon グラフィックス カードは次のようにマークされます。

114110

ATIのRadeon HD 3850
ATIのRadeon HD 3870

ATI Radeon HD 3800 アーキテクチャ

AMD は、Nvidia よりもさらに巧妙な技術プロセスを習得しました - そのチップは、少なくとも古い Radeon HD 55 モデルで、自信を持って 700 MHz のマークを越えることを可能にした 3800nm 生産標準を使用する世界で最初の GPU になりました。機能ブロック RV670 は R600 に相当するため、明らかにチップの内部アーキテクチャを最適化し、リング メモリ コントローラのトポロジを簡素化することによって、チップの複雑さを軽減します。 これは、新しい ATI GPU がトランジスタ数の点で同様のクラスの Nvidia GPU に遅れをとった最初のケ​​ースです。 この観点から、ATI は再び技術リーダーになることができましたが、新製品は GeForce 8800 GT と比較してどのように見えますか?

まず第一に、ATI Radeon HD 3800 はコア クロックで Nvidia GeForce 8800 GT を上回っていますが、TMU などの少数の機能ユニットによって補われています。 すでに知っているように、実行ユニット数の大きな利点は本質的にそのようなものではなく、Nvidia チップの ALU がより高い周波数で動作することだけではありません。Radeon HD に実装されている VLIW アーキテクチャには特に注意が必要です。ドライバーの最適化により、効率的なシェーダー コードの並列化が保証されます。 そうしないと、独立した命令ですべての ALU をロードできない場合、Radeon HD スーパースカラー シェーダー プロセッサのパフォーマンスが急激に低下します。 最悪の場合、1 のそのようなプロセッサのそれぞれの一部である 5 つの ALU のうち 64 つの ALU しか使用できません。 皮肉なことに、ソフトウェアの最適化で最も問題を抱えているのは AMD/ATI Technologies です。正式リリース前に Nvidia の「The Way It's Meant To Be Played」プログラムの下で開発されたゲームのコードにアクセスできないためです。 多くの場合、この状況は、ゲームでの AMD/ATI グラフィックス ソリューションのパフォーマンスに直接影響を与えます。

114092

RV670 のブロック図だけに注目すると、R600 との違いを検出することはできません。 それらはより深いレベルにあるため、より詳細に議論する必要があります。 RV670 と R600 の顕著な違いには、DirectX 10.1 (Shader Model 4.1) のサポートと、ATI Radeon HD 2600 に含まれるものと同様の本格的なハードウェア UVD ビデオ プロセッサが含まれます。

R600 と同様に、各 RV670 シェーダー プロセッサは XNUMX つのブロック (XNUMX つの ALU と、分岐、一致チェック、ループ、サブルーチン呼び出しなどのフロー制御命令を実行するための XNUMX つのブロック) で構成されます。 さらに、一連の汎用レジスタが含まれています。

114093

3 つの ALU のうち XNUMX つはシンプルで、クロックごとに XNUMX つの FP MAD 命令を実行できます。XNUMX 番目の ALU は、SIN、COS、LOG、EXP などの複雑な命令も実行できます。 このアーキテクチャは非常に柔軟でスケーラブルですが、ソフトウェアの最適化に依存するという弱点があります。 ATI Radeon HD グラフィックス コアには特別なタスク マネージャーが含まれていますが、その効率は、ドライバーの一部であるシェーダー コード コンパイラーの効率に直接依存します。 実際のところ、スーパースカラー アーキテクチャは、すべての ALU が独立した操作を実行するのに忙しいときに最大の効率を達成しますが、XNUMXD アプリケーションでは多くの操作が前の操作の結果に依存するため、これを達成するのは非常に困難です。

ATI Radeon HD 3800 のアーキテクチャ テクスチャおよびラスター プロセッサも、ATI Radeon HD 2900 の同様のブロックと違いはありません。これらは複雑なデバイスであるため、従来の TMU および ROP との同等性についてのみ説明できます。 RV670 には合計 XNUMX つの大きなテクスチャ プロセッサがあり、それぞれに次のブロックが含まれています。

8 テクスチャ アドレス ユニット
20 のテクスチャ サンプリング ブロック
4 つのテクスチャ フィルタリング ユニット

114094

各 RV670 ラスタ プロセッサには次が含まれます。
アルファ チャンネルとフォグを使用した 4 ブロックの作業
Z バッファーとステンシル バッファーを使用した 8 ブロックの作業
4つのブレンドユニット
16個のマルチサンプリング処理ユニット
したがって、4 つの従来の ROP とほぼ同等であり、合計で 16 つのそのようなプロセッサがあるため、サイクルごとに 32 つのピクセルを処理でき、合計で 670 になります。 Z バッファ、つまりカラー データを含まないピクセルを使用する場合、パフォーマンスは 10.1 倍になり、XNUMX クロックあたり XNUMX ピクセルになります。 テクスチャ ユニットと同様に、RVXNUMX のラスター プロセッサは、DirectX XNUMX 機能をサポートするためにかなり大きな変更が加えられました。

RV670 メモリ コントローラが改善され、メモリ帯域幅が新しいチップによってより効率的に使用されるため、R600 と同等の条件で競合できるようになります。 ただし、実際には、外部メモリ バスの幅が 512 ビットから 256 ビットに減少し、コントローラーの内部リング バスの合計幅が 1024 ビットから 512 ビットに減少するだけです。 残念ながら、より微妙な変更があったとしても、私たちには隠されています.RV670とR600の宣言された同等のパフォーマンスがそれらの結果なのか、後者のメモリサブシステム機能の非効率的な使用の結果なのかはわかりません. 実際のゲーム条件では、帯域幅が 512 GB/s を超える 100 ビットの外部メモリ バスが存在しても、ATI Radeon HD 2900 XT に利点がないことが多いため、XNUMX 番目のオプションに傾倒します。

ATI RV670 は、ATI のモバイル グラフィックス コアと同じ高度な電源管理機能を提供する世界初のデスクトップ GPU でもあります。 ATI PowerPlay テクノロジのおかげで、新しいチップは周波数、供給電圧を柔軟に制御でき、コアの負荷が軽い場合は未使用のブロックをオフにすることさえできます。 他のデスクトップ GPU とは異なり、RV670 の省電力機能はハードウェアに組み込まれており、より高速な負荷応答を提供し、GPU 検出エラーを排除します。

ATI Technologies の歴史の中で、以前は広く配布されていなかった標準を会社がサポートしたケースがすでにありました。 たとえば、ATI Radeon 8500 は、DirectX 1.4 の一部である Pixel Shader 8.1 仕様をサポートしていました。 これらの仕様は、Nvidia チップがサポートする PS1.0/1.1/1.3 よりもはるかに柔軟で、より高品質の特殊効果を可能にしました。 ATI Radeon 8000 同様の運命は、ATI Radeon X2.0/X700/X800 ファミリに実装された Shader Model 850b サポートと、GeForce FX ファミリで Nvidia によって促進された Shader Model 2.0a に降りかかりました。 DirectX 9 シェーダー モデル 3.0 は、Microsoft Xbox 360 および Sony PlayStation 3 ゲーム コンソールからのゲーム ポートが登場して初めて、重要な配布を獲得し始めました。これは、明らかに GeForce 6 および初期の GeForce 7 のライフ サイクルの範囲外でした。

DirectX 10.1 は、DirectX 10 の最初で最後のサブセットでした。Service Pack 1 のリリースにより、Windows Vista に正式に含まれました。

DirectX 10.1 の主なイノベーション:

キューブマップの配列のサポート: 1 つのレンダー パスで複数のキューブマップにアクセスすることにより、シーンのグローバル イルミネーションを使用する場合に、許容できる速度を達成できます。 このグローバル イルミネーション方法には、間接拡散照明、屈折、ソフト シャドウの計算、および反射のより正確な計算が含まれます。
遅延レンダリングと FSAA 手法の改善: 各 MRT の独立したブレンディング モードのサポート、MSAA 4x の必須サポート、シェーダーからのピクセル カバレッジ マスクの書き込みのサポート、パターン サンプルの選択、マルチサンプリング バッファーからのサンプリング、アンチを必要とするピクセル検出フィルターのサポート-エイリアシング。
頂点シェーダー レジスタの数を増やしました。新しい仕様では、DirectX 32 仕様の 16 から 10 レジスタが提供されます。
Gather4 サポート: ATI Radeon X4 の Fetch1000 機能と同様に、単一コンポーネント テクスチャの 4 ピクセル (2x2) のブロックを取得できます。 シャドウ マップの作業を高速化し、シャドウの品質を向上させるのに役立ちます。
改善されたブレンディングおよびフィルタリング技術: フィルタリングされたテクスチャ フェッチの詳細レベルを返す LOD 命令のサポート、ブレンディング用の INT16 およびフィルタリング用の FP32 のサポート (DirectX 8 の INT16 および FP10)

RV670 GPU は、そのコア サイズに感銘を受けます。666 億 192 万個のトランジスタで構成されているにもかかわらず、その面積はわずか 13.7 平方ミリメートル (14x55 mm) です。 これは、新しい 39nm プロセスの能力を明確に示しています。 ATI のロゴと製造日を除いて、コアにはエンド ユーザーにとって意味のある情報は含まれていません。 私たちのコピーは、2007 年 23 月 29 ~ 26 日の第 3870 週に作成されました。 ATI Radeon HD グラフィックス プロセッサは、チップの異なる部分に対して異なるクロック周波数を宣言しないため、異なるドメインが 775 の異なる周波数で動作するという事実にもかかわらず、チップの「メイン」周波数のみを示すのが通例です。 Radeon HD XNUMX の場合は XNUMX MHz です。 クリスタルのパッケージには保護フレームがないため、冷却システムを取り付けたり取り外したりするときは、コアが欠けないように注意する必要があります。

ブロック構成に関しては、ATI Radeon HD 2900 XT との違いはありません。チップには、それぞれ 320 つの ALU を持つ 64 のスーパースカラー コンピューティング ユニットにグループ化された 5 の ALU が含まれています。 同時に、このような各ブロックの 4 つの ALU は、MAD (Multiply + Add) などの単純な命令を実行でき、600 番目のより複雑な ALU は、SIN、COS、LOG、EXP などの超越命令も実行できます。 さらに、各コンピューティング プロセッサには、フロー制御命令 (比較、ループ、サブルーチン呼び出しなど) の実行を担当する分岐制御ブロックが含まれています。 この場合の R10.1 との唯一の違いは、高度な DirectX 4.1 機能 (Shader Model XNUMX) のサポートです。

 

仕様 ATI Radeon HD 3870

名前 のRadeon HD 3870
コア RV670
プロセス技術 (µm) 0.055
トランジスタ (百万) 666
コア周波数 775
メモリ周波数 (DDR) 1125(2250)
バスとメモリの種類 GDDR4 256 ビット
帯域幅 (Gb/秒) 72
統合されたシェーダー ブロック 320
統合されたシェーダー ユニットの頻度 775
コンベアあたりのTMU 16(合計)
ROP 16
クロックあたりのテクスチャ 16
パスごとのテクスチャ 16
シェーダー モデル 4.1
フィルレート (Mpix/秒) 12400
充填率 (Mtex/秒) 12400
DirectXの 10.1
アンチエイリアシング (最大) MS-24x
異方性フィルタリング (最大) 16x
メモリ容量 512
インターフェース PCI-E 2.0
RAMDAC 2x400

 

グラフィックス カードの ATI Radeon HD 3870 と ATI Radeon HD 3850 は優れたパフォーマンスを発揮しますが、HD 3870 の配置は非常に不快な後味を残しました。 結局のところ、GeForce 8800 GT 512MB および Radeon HD 3870 と競合する代わりに、AMD が Nvidia と競合することをためらうようになりました. ATI は依然として速度ではなく価格で競合していました.

ニード・フォー・スピード プロストリート

210708143a3c