Intelは9月1日(現地時間)、Intel Arc GPUにおけるレイトレーシングの実装、およびレイトレーシング対応ゲームプレイ時の性能を明らかにした。
Arcにおけるレイトレーシングハードウェアは「Ray Tracing Unit(s):RTU」として実装される。RTUには2本のレイ(光線)トラバーサルパイプラインを搭載しており、1サイクルあたり12回のボックスインターセクション(光線とオブジェクトの交差判定)と1回のトライアングルインターセプションが可能。また、バウンディングボリューム(BVH)キャッシュも備えている。
ちなみにAMDのRDNA 2における「Ray Accelerator」(RA)では、レイトラバーサルを行なうとは謳っておらず、1クロックあたり4回のボックスインターセクションと1回のトライアングルインターセプションが可能で、BVHワークセットについてはInfinity Cacheに保管するとしている。Intel ArcのRTUではボックスインターセクション数が上なだけでなく、レイトラバーサルも行なえる点で一歩先に進んだ実装になっていると見られる。
Intel ArcではこのRTUの実装に留まらず、同社が「Asynchronous Ray Tracing(非同期レイトレーシング)」と呼ぶ技術を可能にする「Thread Sorting Unit(TSU)」も備えている。TSUではレイの分岐を処理し、似ているヒットシェーダーにまとめて実行することで、シンプルなシーンでも複雑なシーンでもXeコアの利用率を最大限に引き上げるという。
なおRTUもTSUも、1つのXeコアにつき1基ずつ内蔵されている。ダイが最も大規模な「ACM-G10」ではXeコアは32基とされているので、RTUもTSUも同じ32基ずつと考えるのが妥当だろう。
同社が公開したArc A770とGeForce RTX 3060のゲーム内におけるレイトレーシング有効時の性能比較(ベータドライバを利用)によれば、タイトルによるものの、ほぼ同等かそれ以上の性能を実現できていることが分かる(1080p解像度においての場合)。また1440p解像度では、アップスケーリング技術のXeSSを有効にすることで現実的な性能を達成できるとしている。
[embedded content]
コメント