3DMark 2006

YOM:2006
開発者: 株式会社フューチャーマーク
プラットフォーム:PC
最小システム要件
オペレーティングシステム: マイクロソフト Windows 2000 または XP オペレーティング システム
プロセッサ: MMX をサポートする x86 互換プロセッサ、2000MHz
RAM: (512MB を推奨)
DIRECTX:DirectX9.0c以降(必須)
このパッケージに含まれる3つのいわゆる「グラフィックテスト」のうち05つが、XNUMXDMarkXNUMXのゲームテストの改良版に過ぎないという事実からも、このことが分かります。実際、新バージョンと旧バージョンの違いは質的というより量的です。根本的な新機能としては、HDRのサポート、ユニフォームシャドウマップ、マルチコアのサポートなどが挙げられます。 CPU Shader Model 3.0 の使用に重点を置いていますが、排他的ではありません。2 つのグラフィック テストのうち 2.0 つは Shader Model XNUMX 内で実行されます。
残りの変更は本質的に定量的なものです。テスト シーンの詳細、光源の数、使用されるシェーダーの複雑さ、テクスチャの解像度などが増加しました。 したがって、3DMark06 の一般的なコンセプトは、SM3.0 互換の GPU に焦点を当てることです。
3DMark06: グラフィック エンジンの機能
ご存知のように、3DMark05 用に新しいグラフィック エンジンが開発されました。これは、以前使用されていた MAX-FX エンジンとは共通点がなく、実際のゲーム エンジンとの類似性が非常に高いものでした。 3DMark06 エンジンはその修正版であり、Shader Model 3.0 を完全にサポートし、FP16 形式でテクスチャとブレンディングを行います。 最後の 3 点は、HDR を使用できる可能性に過ぎません。 Futuremark は、ハイ ダイナミック レンジのサポートが次世代ゲームで広く使用されると予測していますが、そのようなゲームの数は現時点では非常に少ないです。 05DMarkXNUMX と同様に、特定のマテリアルを構成するシェーダーは HLSL 形式で動的に生成されます。 次に、システムにインストールされている GPU に最適に一致するように、自動的に、またはユーザー定義のプロファイルに従ってコンパイルされます。
FP16 テクスチャとブレンディングのサポートは、SM3.0 グラフィックス テストにのみ必要です。これらのテストでもFP16フィルタリングが使用されていますが、 GPU この機能をサポートしていないため、特別なシェーダーを使用してエミュレートします。これにより、Radeon X3.0 ベースのカードは、浮動小数点テクスチャ フィルタリングをサポートしていない GPU でも SM1000/HDR テストに合格できます。 SM3.0/HDR グラフィックス テストでは、ブルーム効果、カメラの XNUMX 枚羽根シャッターをエミュレートする「スター」効果、およびレンズで発生する反射効果を画像に適用する後処理が使用されます。最後に、結果の画像はトーン マッピング プロセスを経て、従来のディスプレイに適した色の値を取得します。
開発者によると、新しいテスト パッケージは、vFace レジスタを除いて、SM3.0 のすべての主要機能を使用しています。
-vposレジスタ
-派生命令
-動的フロー制御
-多数のインターポレーター
-多数の定数
-より多くの命令スロット
-明示的な LODVertex を使用したテクスチャ命令
-頂点シェーダーからのテクスチャ フェッチ (シェーダー パーティクル テストに合格するために必要)
動的な影は、3DMark2001 以降、Futuremark のグラフィックス テスト スイートに登場しています。 次に、それらは投影シャドウ マップを使用して作成されました。これは、多くの制限があり、特にオブジェクトが自分自身に影を落とすことができない、かなり要求の厳しい方法でした。 さらに、オブジェクトの下のすべての面、さらには数階下の部屋の床に影が投影されました。 3DMark03 は、動的な影、いわゆるステンシル シャドウを作成する別の手法を使用します。 この方法は動作が異なります。光源の側面から見たオブジェクトのエッジは、照明のない多角形として強調表示されます。 このポリゴンのボリューム内にあるものはすべて影になります。 この手法には、前の手法の欠点がなく、オブジェクトが自分自身に影を落とすことができますが、普遍的ではなく、特定のタイプのシーンやローポリ オブジェクトにのみ適しています。
実際には、影のボリュームになるオブジェクトのエッジをサンプリングすることは、かなりリソースを消費する操作であり、これらのボリュームを形成するポリゴンは、目に見えませんが、シーンの塗りつぶし速度の大部分を消費します。
3DMark05 では、いわゆる LiSPSM マップ (ライト スペース パースペクティブ シャドウ マップ) を使用して、ダイナミック シャドウを生成する新しい方法が適用されました。 3DMark は、カスケード シャドウ マップ (CSM) と呼ばれる別のタイプのシャドウ マップを使用することで、この手法を改善しました。 CSM を使用すると、角度に関係なく、画面上のすべてのオブジェクトの影を取得できます。
この方法は、ビュー フラスタムを Z 軸に沿って 5 つのセクションに分割することによって機能します。各セクションは、標準の 2048 x 2048 均一シャドウ マップを使用してシェーディングされます。もし GPU 深度テクスチャをサポートする場合は、D24X8 または DF24 形式の深度マップが使用され、それ以外の場合は、32 ビット浮動小数点表現のテクスチャの R32F コンポーネントが深度マップとして使用されます。ハードウェア シェーディングはデフォルトで有効になっています (SM24/HDR テストの D8X3.0 を除く) が、ユーザーの判断で無効にすることができます。
どの方法にも欠点があります。 深度マップの解像度は非常に高いですが、これでは不十分な場合があり、3DMark05 のように、場合によっては影のエッジでちらつきが発生することがあります。これは、いわゆるプロジェクション エイリアシング (投影エイリアシング) です。 この現象は、法線の方向が照明の方向に対して垂直またはほぼ垂直である場合に発生する可能性があります。 現在、重大なパフォーマンスの低下なしにそれを取り除くことはほとんど不可能です。
新しいエンジンで影のエッジを滑らかにするために、SM3.0/HDR テストでは 16 個のサンプル (4x4) の配列を使用します。各シャドウ エッジ ピクセルごとに、この配列はランダムな角度で回転します。サンプル ポイントが 16 個あると、シャドウ スムージングの品質が向上しますが、追加のハードウェア リソースが必要になります。ポイント サンプリングは、ハードウェア シャドウ マッピングと R32F シャドウ マップの両方に使用されます。 SM2.0テストでは、4ピクセル(2x2)の小さなコアを使用しますが、 GPU ハードウェアは、D24X8、DF24、または Fetch4 形式の深度バッファからのサンプリングをサポートしており、32 つのバイリニア サンプルのみが取得されます。アンチエイリアシングの品質は多少異なります。異なるアーキテクチャのレンダリング パフォーマンスを比較したい場合は、ハードウェア シャドウ マッピングを無効にすることができます。この場合、動的シャドウは常に RXNUMXF 深度マップを使用して作成され、そのアンチエイリアシングは XNUMX つのサンプルを使用して実行されます。
Futuremark によると、この方法はゲーム開発者によって既に使用されており、今後も使用されるため、深度マップを使用して動的な影を生成することは 3DMark06 では理にかなっています。 テクスチャ圧縮に関しては、3DMark06 のすべてのカラー マップは DXT1 アルゴリズムを使用して圧縮され、アルファ マップは DXT3 アルゴリズムを使用して圧縮され、法線マップは DXT5 アルゴリズムを使用して圧縮されます。 ATI Radeon X3 以降のカードに固有の 700Dc メソッドはサポートされていません。
3DMark06: グラフィックベンチマーク
新しい Futuremark パッケージには 2.0 つのグラフィックス テストがあり、3.0 つのグループに分けられます。 2.0 つ目は SM2.0 のフレームワーク内で動作し、3 つ目は SM05 グラフィック アクセラレータでサポートされるように設計されています。 SMXNUMXテストから順番に始めましょう。 最初の SMXNUMX グラフィックス テストは、XNUMXDMarkXNUMX の一部であった最初のゲーム テスト「Return to Proxycon」の作り直されたバージョンです。 テスト中に表示されるシーンは、SF XNUMXD シューティング ゲームのジャンルに属します。 重装甲歩兵に支援されたスペースマリーンのグループが、プロキシコン宇宙ステーションを攻撃して捕獲し、アーティファクトを抽出します(そのシーンはモードで見ることができます Demo)。 オリジナルと比較して、光源の数が大幅に増加し (26 対 8)、シャドウ マップの解像度が向上し、シーンのディテールが向上しました。
このテストは、現代のシューティングゲームと比較すると、やや非典型的です.後者では、そのような大規模なオープンスペースと戦闘はまれです. これの最も顕著な例は、多数の狭い廊下と広々とした部屋のまれな隙間がある Doom III です。 SF シューティング ゲームのジャンルでの例外は、今日ではほとんどありませんが、それでも発生します。 たとえば、Starship Troopers では、フレーム内に 200 ~ 300 体の敵モデルがいる大きなシーンも見ることができます。

2.0 番目のグラフィック テストである SM3 も新しいものではありません。その前身は 05DMarkXNUMX の XNUMX 番目のゲーム テストである「Firefly Forest」です。以前と同様に、テストの基礎は動的に生成された植生であり、テストにはそのような植生が多数含まれています。この場合、シーンのスペースは非常に限られていますが、植物の量が膨大であるため、パフォーマンスをテストするのに適した場所として機能します。 GPU 影を適用したり照明を操作したりするときに、頂点プロセッサとシステムの中央プロセッサの効率を評価します ;)。同様の 3DMark05 テストと比較すると、テストには「ホタル」が XNUMX つ多くあり、シャドウ マッピング方法が変更され、深度マップ/ハードウェア シャドウ マップの解像度が向上しました。

次の 3.0 つのテストは、SM3.0 プロファイルのみを使用するため、Shader Model 3.0 をサポートするビデオ アダプターでのみ機能します。 最初の SM3 グラフィック テストは、「Canyon Flight」と呼ばれる 03 番目の XNUMXDMarkXNUMX ゲーム テストの大幅に改訂および改良されたバージョンにすぎません。 このテスト シーンでは、反射/屈折 (屈折) の作業を含め、HDR が使用されます。
前と同様に、水面は深度フォグを使用して深度の錯覚を作成しますが、これに加えて、XNUMX つのスクロール法線マップと XNUMX つの XNUMX つの Gerstner 波動関数を使用して水面を歪ませ、水が非常にリアルに見えるようにします。 複雑な不均一な霧を使用して、湿気の多い気候をシミュレートします。 また、空をレンダリングするためのアルゴリズムは複雑です。 シーンにはまだ XNUMX つの光源 (太陽) しかありませんが、峡谷の壁が大規模で複雑な形状であるため、動的な影を適用することは非常に困難です。

3.0 番目の SM3 グラフィックス テストは、以前のバージョンの 2DMark では比類のないものであり、まったく新しいものです。 放棄された北極ステーションの例を使用して、広い領域での HDR とダイナミック シャドウの使用方法を示します。 このテストの主な特徴は、日が変わることです。その間、オブジェクトによってキャストされる影が長くなるのを観察できます。これは、CSM メソッドの柔軟性を実証するものです。 Snow は、Blinn-Phong シェーディング モデル、1 つの法線マップと XNUMX つのカラー マップ、および本物とほとんど見分けがつかないサブサーフェス スキャッタリング エフェクトを使用しています。 また、このテストは、パーティクル システムを操作する際のグラフィックス アダプターのパフォーマンスの指標としても役立ちます。その助けを借りて、シーン内で吹雪がシミュレートされます。

3DMark06: CPU ベンチマーク
新しい3DMark06の特徴の一つは、最終的な指標を計算する際に使用される新しい考え方です。このベンチマークの以前のバージョンでは、グラフィックスサブシステムのパフォーマンスのみに基づいて最終結果が算出されていましたが、3DMark06の指標は、グラフィックステストとCPUテストの両方の測定値に基づいて計算されます。つまり、テストによって得られる最終スコアは、ビデオカードの速度とCPUのパフォーマンスの両方に依存します。 CPU.

このイノベーションは、3DMark06 をビデオ サブシステムの相対的なパフォーマンスを判断するための単なるベンチマークにするだけでなく、最新の 3D ゲームに関してプラットフォーム全体のパフォーマンスの尺度にもしたいという開発者の願望によって引き起こされました。 このアプローチには完全に論理的な正当性があります。最新のゲーム アプリケーションは、グラフィックス パフォーマンスだけでなく、中央処理装置のコンピューティング リソースの能力に対してもかなり高い要求を課し始めています。 この傾向は今後も続くと予想され、ゲーム ソフトウェア開発者は、ゲーム内で動作するオブジェクトの物理環境と人工知能の高品質なモデリングの問題にますます注意を払うようになるでしょう。
だからテストは CPU 3DMark06では、Futuremarkのプログラマーは、このテストをより現実に即したものにしました。例えば、このテストは CPU 3DMark05のプロセッサ性能は、ゲームパフォーマンスとはほとんど関係がありませんでした。これは全く驚くべきことではありません。このテストでは、現実とは全く関係のない、人為的なアルゴリズムを用いてプロセッサ性能を測定していたからです。特に、3DMark05のプロセッサ指数は、プロセッサが頂点シェーダを実行した結果に基づいて算出されていました。 CPU ゲームのタスクですね。
以前の3DMarkテストにおけるプロセッサ性能評価の問題点は、実際のゲームで使用されるような特殊なアルゴリズムが採用されていなかったことです。新しい3DMark06テストでは、この欠点が修正されています。3DMark06プロセッサテストは、負荷に直接関連する特殊なアルゴリズムに基づいています。 CPU 3D ゲームで。
3DMark06 でのプロセッサ パフォーマンスの測定は、Red Valley ベンチマークの設計者と呼ばれる実際のゲームの状況をシミュレートすることによって実行されます。 このテストのアクションは、87 つの山に挟まれた要塞の周りで行われます。 これらの山のふもとには峡谷が点在しており、そこに沿って高速車が突進し、その任務は要塞に突入し、衝突を回避して敵軍を守ることです。 この前哨基地の防御には、低速ではあるが短距離ミサイルを搭載した一種の飛行戦車が使用されます。 合計で、これら XNUMX つのタイプの XNUMX のボットが Red Valley シーンに参加しています。
プロセッサ ベンチマーク中のグラフィックスの出力は、ビデオ サブシステムによって完全に処理されます。 グラフィックス パフォーマンスがプロセッサ テストの結果に与える影響を軽減するために、640x480 の解像度が使用され、さらに動的シャドウがオフになっています。 同時に、プロセッサはその典型的な機能だけに専念しています。つまり、ゲームロジック、物理環境のモデリング、ボットに人工知能を与えることを任されています。 Red Valley の物理演算は、現在ゲーム開発者の間で非常に人気のある AGEIA PhysX ライブラリを使用して計算されますが、ボットの知性は、グラフ内のパスを見つける問題を解決することによって達成されます。
レッドバレーには多数のインテリジェントボットが生息しているため、プロセッサテストはリアルタイム戦略を連想させることに注意してください。 ただし、3DMark06 は現代のゲームのようなものではないことを理解しておいてください。 このベンチマークの目的は、将来のゲーム アプリケーションをシミュレートすることです。Futuremark の開発者は、最新のゲームよりもはるかに多くのアクティブなスマート オブジェクトを備えていると考えています。
3DMark06の開発陣は、将来のゲーム開発に焦点を合わせるため、最新のデュアルコアプロセッサ向けにプロセッサテストを最適化する必要がありました。さらに、このテストは、 CPU 多数のコアを持つプロセッサは、特に多数のオブジェクトの最適パスを見つけるタスクを容易に並列化できるため、非常に有利です。一般的に、プロセッサテストにおける計算は次のようにスレッドに分割されます。1つのスレッドはゲームロジックを計算し、カウントプロセスを制御し、2つ目のスレッドは環境の物理シミュレーションに使用されます。残りのスレッド(スレッドの数はシステム内のコンピューティングコアの数によって異なります)は、最適パスを見つける問題を解決します。
3DMark06 でプロセッサをテストすると、Red Valley シーンが異なるアルゴリズム設定で XNUMX 回発生します。 XNUMX 回目は人工知能モデリングにより多くのリソースが費やされ、XNUMX 回目は環境の物理学の計算に重点が置かれます。
3DMark06: 理論的テスト
このカテゴリの一部として、3DMark06 には、3DMark05 の一部であったすべての理論的テストと、3.0 つの新しいテスト (Shader Particles Test (SM3.0) および Perlin Noise (SM3.0)) が含まれています。 名前が示すように、両方のテストが動作するには Shader Model XNUMX のサポートが必要です。
シェーダー パーティクル テスト (SM3.0) - 3DMark 2001 のパーティクル システム テストを幾分連想させますが、それとは異なり、Shader Model 3.0 の機能を使用します。 パーティクルの動作の物理モデルは、ピクセル シェーダーを使用して計算され、頂点シェーダーのテクスチャ サンプリング機能を使用して視覚化されます。 中程度の抵抗が存在する単純な重力場における 409600 個の粒子の軌道は、オイラー積分を使用して計算され、これらの粒子と高さ場との衝突がチェックされます。 シェーダー モデル 3.0 のサポートに加えて、このテストでは GPU が頂点シェーダーからテクスチャーをフェッチできる必要があるため (頂点テクスチャー フェッチ)、GeForce 6/7 アーキテクチャのカードでのみ動作します - ATI Radeon X1000 は VTF をサポートしません。
パーリン ノイズ (SM3.0) - いわゆる 3 次元 Perlin ノイズを使用して、リアルに変化する雲をシミュレートします。パーリン ノイズは、多くの場合、手続き型テクスチャや一部のモデリング テクニックの基礎となります。パーリン ノイズを使用して作成されたエフェクトは、高い計算能力を必要としますが、ビデオ アダプタのメモリ サブシステムに対する負荷が比較的小さく、そのパフォーマンスの向上は数学的パフォーマンスの向上よりもはるかに遅いため、今後ますます人気が高まるでしょう。 GPU。このテストで使用されるピクセル シェーダーは 495 個の命令で構成されており、そのうち 447 個は算術命令、48 個はテクスチャ検索命令です。参考までに: SM3.0 標準に適合する最小仕様では、最大 512 命令の長さのシェーダーのサポートが必要です。すべてのテクスチャ命令は、解像度 32x256 の単一の 256 ビット テクスチャを作成します。サイズはわずか 64 KB なので、テストではビデオ メモリの容量と周波数を要求しません。
バッチ サイズ テストを含む他のすべてのテストは同じままです。




