Oct 08, 2023
テスト済み: Nvidia の GeForce RTX 4090 はコンテンツ作成の巨人です
Quando la Nvidia GeForce RTX 4090 fu annunciata al prezzo incredibile di $ 1.600
Nvidia GeForce RTX 4090 が 1,600 ドルという驚くべき価格で発表されたとき、ミームは野火のように広がりました。 1,600 ドルは、ほとんどのゲーマーにとって 1 つのコンポーネントに費やすには少し高すぎます (私が見たほとんどの PC 構築予算は、PC 全体の予算よりも少ないです)。 私は自分の仕事の潜在的なパフォーマンス向上に興味をそそられずにはいられませんでした。ご存知のとおり、私はゲームではなく、EposVox YouTube チャンネルの管理の一環として 1 日のほとんどを費やしている 3D および AI を活用したタスクに取り組んでいます。
ネタバレ注意: GeForce RTX 4090 のコンテンツ作成パフォーマンスは魔法のようです。 非常に多くの場合、一般的にはナンセンスな「パフォーマンスが 2 倍向上する」という考えは実際に当てはまります。 しかし、どこでもというわけではありません。
掘り下げてみましょう。
私のベンチマークのほとんどはこのテストベンチで実行されました。
私の目的は、RTX 4090 が前世代の GeForce RTX 3090 および RTX Titan (以前主に取り組んでいたカード) と比べてどの程度アップグレードされるかを確認することでした。 私のユースケースでは、RTX 3090 は RTX Titan に比べて最小限の改善しか見られなかったので、4090 が本当に大きな進歩となるかどうかはわかりませんでした。 後で説明するように、さらに本格的なテストについては、このテストベンチでテストが行われました。
各テストでは、結果が混在しないように同じ構成で各 GPU を使用しました。
もちろん、私の本業は YouTube コンテンツを作成することなので、最初にテストしなければならないことの 1 つは、ビデオ コンテンツを作成することで得られるメリットです。 Puget Systems のワークステーション ビルダーの PugetBench を使用すると、Adobe Premiere Pro では、RTX 4090 でのパフォーマンスの向上はごくわずかしか見られません (現時点で予想されるとおり)。
アダム・テイラー/IDG
アダム・テイラー/IDG
ただし、BlackMagic DaVinci Resolve では、重要な RTX 3090 と RTX Titan の両方よりも全体的にパフォーマンスが向上しています。 Resolve は Premiere Pro よりも GPU ワークフローに対してはるかに最適化されているため、これは当然のことです。 エフェクトの 3D コンピューティングの向上だけでなく、オンボードのエンコード ハードウェアの高速化の両方のおかげでレンダリングが大幅に高速になり、一般的な再生とワークフローがより「きびきび」とした感触と応答性になりました。
アダム・テイラー/IDG
アダム・テイラー/IDG
ここ数週間、GeForce RTX 4090 で編集を行ってきましたが、そのエクスペリエンスは素晴らしかったです。ただし、Resolve の公開リリースに戻さなければならなかったので、ほとんどの部分で AV1 エンコーダーを使用してエクスポートできませんでした。私のビデオの。
アダム・テイラー/IDG
また、AI ハードウェアの改善が、Resolve のロトスコーピング用の Magic Mask ツールや、Face Refinement プラグイン用のフェイス トラッカーに利益をもたらすかどうかをテストしたいと思いました。 確かに、ここで RTX 4090 によるさらなる改善が見られることを期待していましたが、改善が見られ、時間を節約でき、勝利でした。 これらのタスクは退屈で時間がかかるため、少しでも時間を短縮できれば、私の生活は楽になります。 おそらく、やがて、Lovelace (RTX 40 シリーズの基礎となる GPU アーキテクチャのコードネーム) の新しいアーキテクチャの変更に特化したさらなる最適化が行われる可能性があります。
アダム・テイラー/IDG
アダム・テイラー/IDG
元の Resolve ベンチマークのパフォーマンスに非常に感銘を受けたため、Threadripper Pro ワークステーションを使用して第 2 層テストを構築することにしました。 8K RAW ソース映像、多くのエフェクト、スーパー スケール (Resolve の内部「スマート」アップスケーラー) を使用した 8K ビデオを 4K 映像でレンダリングしてエクスポートするなどです。このプロジェクトは冗談ではありません。通常の上位ゲーム カードはエラーが発生するだけです。 VRAM の量が少ないとプロジェクトを処理できなくなり、RTX 3060、2080、および 3080 が稼働しなくなります。 しかし、24 GB VRAM モンスターをテストすると、RTX 4090 はテストよりも 8 分も速くプロジェクトをエクスポートしました。8分。このような時間のスケーリングは、私のような 1 人のワークフローにとって状況を一変させます。
アダム・テイラー/IDG
高解像度のビデオ編集者やエフェクトを多用するビデオ編集者であれば、RTX 4090 を使用すれば、すぐに何時間もの待ち時間と作業の遅さが軽減されます。また、エンコード速度についてはまだ話していません。
H.264 および H.265 でビデオをトランスコーディングするだけの場合、GeForce RTX 4090 は以前の Nvidia GPU を周回するだけです。 H.265 は、Radeon 5000 GPU 以来、AMD の HEVC エンコーダが非常に高速であるため、エンコーダ速度 (必ずしも品質ではありませんが) で AMD が Nvidia を上回る唯一の領域です。
アダム・テイラー/IDG
新しい Ada Lovelace アーキテクチャには、新しいデュアル エンコーダ チップも搭載されており、H.264 および H.265 エンコードに関しては個別にすでに Ampere や Turing よりもかなり高速に実行されていますが、AV1 (Ada Lovelace の新しいオープンソース ビデオ コーデック) もエンコードします。オープンメディアのためのアライアンス。
アダム・テイラー/IDG
AV1 は Web ストリーミング ビデオの未来であり、メディア ストリーミングに関与するほとんどの大手企業もコンソーシアムのメンバーです。 目標は、現代の高解像度、高フレーム レート、HDR ストリーミングの世界のニーズを満たすことができる、高効率 (ビットあたりの品質など) のビデオ コーデックを作成し、H に関連する高額なライセンスと特許コストを回避することです。 .265 (HEVC) および H.266 コーデック。 ここで PCWorld で取り上げたように、Intel は Arc GPU を搭載したハードウェア AV1 エンコーダを最初に市場に送り出しましたが、現在は Nvidia がそれを自社の GPU に導入しています。
ソフトウェアのサポートが限られているため、Intel と Nvidia の AV1 エンコーダ間の品質を完全に正確に比較することはまだできません。 私が実行できた基本的なテストから、Nvidia の AV1 エンコードは Intel のものと同等であることがわかりました。しかし、両方で使用できるソフトウェアのエンコーダ実装でも、両方の側面を最適に表現するには微調整が必要であることがわかりました。
パフォーマンスの面では、AV1 は RTX 4090 上の H.265/HEVC とほぼ同じ速度でパフォーマンスします。これは問題ありません。 しかし、新しいデュアル エンコーダ チップにより、H.265 と AV1 の両方を使用して 8K60 ビデオ、またはより高速な 4K60 ビデオをエンコードできるようになります。 これを行うには、ビデオ フレームを水平方向の半分に分割し、その半分を別々のチップでエンコードし、ストリームを完成させる前に再びつなぎ合わせます。 これは、Intel の Hyper Encode がどのように動作するはずだったのかのように思えます。Hyper Encoder は、代わりに Arc を使用して iGPU と dGPU の間で GOP (ピクチャまたはフレームのグループ) を分離します。しかし、すべてのテストで、Hyper Encode がプロセスを遅くすることが判明しただけでした。スピードを上げるのではなく。 (さらに、AV1 では動作しませんでした。)
前述のエンコーダー速度の向上により、画面、カメラ、またはゲームプレイのストリーミングと録画のエクスペリエンスがはるかに向上しました。 これには、OBS Studio 内の NVENC エンコーダー SDK のアップデートが付属しており、最高/最低品質の P1 から最低/最高品質の P7 までの 7 つのプリセット (X264 の「CPU 使用率プリセット」に似ています) がユーザーに表示されます。 このビデオでのテストでは、P6 と P7 は RTX 2000、3000、および 4000 GPU 上で基本的にまったく同じ結果となり、品質では X264 VerySlow と競合しました。
ゲームのストリーミング中に、H.264 を使用した Spider-Man Remastered の他の GPU とほぼ同じパフォーマンス記録が見られました (ただし、他のゲームではさらに利点が見られます)。しかし、AV1 でエンコードすると、ゲームのパフォーマンスにほとんど影響がありませんでした。 ほぼ透明でした。 最高品質のプリセットであっても、録音していることに気づかないでしょう。 OBS を 8K キャンバスに設定し、1440p ゲーム キャプチャを OBS 内で 8K にアップスケールし、デュアル エンコーダー チップを使用して録画するのに十分なヘッドルームさえありましたが、それでも大きな影響は見られませんでした。
アダム・テイラー/IDG
残念ながら、Nvidia の Shadowplay 機能は、デュアル エンコーダーを介して Lovelace で 8K60 をサポートしていますが、現時点では HEVC のみがサポートされています。 HEVC はそのままでは 8K または HDR でのみ機能するため、AV1 がすぐに実装され、すべての解像度でサポートされることを願っています。
また、GeForce RTX 4090 は、4K 60FPS で完全にロスレスの 4:4:4 HEVC 録画を実行できるほど高速であることもわかりました。これは、前世代では不可能なことです。 4:4:4 クロマ サブサンプリングは、テキストの明瞭さを維持し、ビデオの場合のように小さな要素にズームインするときに画像をそのまま保つために重要です。4K では、スループットが低いため、4K は私の「シロイルカ」のようなものでした。 RTX 2000/3000 が十分ではないか、4:4:4 の OBS 実装が十分に最適化されていません。 残念ながら、これらのカードの AV1 では 4:4:4 はまったく不可能です。
写真編集は、GeForce RTX 4090 では事実上ゼロの改善が見られます。Adobe Photoshop PugetBench テストでは、前世代と比較してわずかにスコアが増加しましたが、新しいカードを購入するほどの価値はありません。
アダム・テイラー/IDG
アダム・テイラー/IDG
Lightroom Classic も同様です。 恥。
アダム・テイラー/IDG
しかし、Affinity Photo ユーザーの場合、RTX 4090 は他の GPU よりもはるかに優れたパフォーマンスを発揮しますが、この場合、Affinity が多かれ少なかれ最適化されていると解釈すべきかどうかはわかりません。
AI は最近大流行しており、AI アップスケーラーの需要は現在高いです。 理論的には、GeForce RTX 4090 の改良された AI ハードウェアはこれらのワークフローに恩恵をもたらすでしょう。そして私たちはこの考えがほぼ真実であると考えています。 RTX 4090 は、Topaz Labs Video Enhance AI と Gigapixel、および ON1 Resize AI 2022 の最速アップスケーリングでチャートのトップに立っています。
アダム・テイラー/IDG
アダム・テイラー/IDG
しかし、Topaz の新しい PhotoAI アプリでは、すべての Nvidia カードのパフォーマンスが奇妙に低いことがわかります。 これはバグである可能性があると言われていますが、修正版はまだ配布されていません。
アダム・テイラー/IDG
FlowFrames を使用して、スローモーション用に 60FPS の映像を 120FPS に AI 補間することで、RTX 4090 は RTX 4090 と比較して 20% 高速化しました。これはそれはそれで素晴らしいことですが、FlowFrames Discord のユーザーから聞いた話です。 Lovelace の最適化が開発されると、理論的にはさらに拡張できる可能性があると考えられます。
アダム・テイラー/IDG
AI アートの生成についてはどうですか? N00mkrad の Stable Diffusion GUI をテストしたところ、GeForce RTX 4090 は、半精度生成と全精度生成の両方で、以前のすべての GPU を吹き飛ばしたことがわかりました。そして、結果はさらに高い「はずである」と再び言われました。 エキサイティングな時代。
アダム・テイラー/IDG
さて、大胆な「2X 高速」の主張がここにあります。 2022 年にはこれらの新しいツールにますます興味を持っているため、Threadripper Pro リグで 3D ワークフローをテストしたいと考えていました。
アダム・テイラー/IDG
アダム・テイラー/IDG
Blender をテストすると、Monster ベンチマーク シーンと Classroom ベンチマーク シーンの両方で、RTX 4090 のレンダリングが RTX 3090 の 2 倍速くなり、Junkshop シーンのレンダリングは 2 倍近く速くなりました。
アダム・テイラー/IDG
これにより、最終的なレンダリングが高速化されるだけでなく、実際のプレビュー/ビューポートの作業がすべてよりスムーズになり、応答性が向上し、最終的な結果をより簡単にプレビューできるようになり、クリエイティブなプロセスがよりスムーズになります。永遠に待っています。
アダム・テイラー/IDG
Cinema4D、Blender、Unity で 3D アーティストや VFX クリエイターが使用するレンダラーである Octane のベンチマークでも、RTX 4090 は RTX 3090 の 2 倍の速度で動作します。
アダム・テイラー/IDG
…繰り返しになりますが、CUDA ワークフローと RTX ワークフローの両方の V-Ray にも同じことが当てはまります。
そこに価値があるのです。 Titan RTX の価格は 2,500 ドルでしたが、RTX 3090 でそのパフォーマンスが 1,500 ドルで得られるのはすでに驚異的でした。今回、さらに 100 ドル追加して、GeForce RTX 4090 は、ゲームのクリエイターのワークフローに真の革新的な影響を与える方法で、以前の GPU を周回して実行します。すべての種類。
これは、以前は Quadro として知られていたカード シリーズがここ数年あまり重視されなくなった理由も説明できるかもしれません。 1,600 ドルで同じパフォーマンス (あるいはそれ以上、Quadros は決して超高速ではなく、大量の VRAM を搭載しているだけ) が得られるのに、5,000 ドル以上のグラフィックス カードを購入する必要はありません。
明らかに、1,200 ドルの RTX 4080 と、最近発売された 899 ドルの 4080 12GB の価格設定は、独立したテストの数値が確認されるまで依然として懸念される可能性がありますが、GeForce RTX 4090 は、マーケティングで製品の「2 倍高速」パフォーマンスを誇った初めての製品になる可能性があります。そしてその約束を実際に受け取ったような気がします。 特に、主流のツールやゲームではなく、自分のニッチな仕事の興味の範囲内で結果を得るにはどうすればよいでしょうか? これはすごいですね。
純粋なゲーマーは、妥協せずに高リフレッシュ レートの 4K モニターに給電することが目標でない限り、グラフィック カードに 1,600 ドルを費やす必要はないでしょう。 しかし、本物の核心的なコンテンツ作成作業を迅速に完了することに興味がある場合は、GeForce RTX 4090 に勝るものはありません。深夜の Call of Duty セッション中、耳から耳までニヤリとさせられるでしょう。同様に飛び込みます。
インターネットのストリーム教授として、アダムは主に YouTube チャンネル EposVox でのキャプチャとエンコードのウィザードリーによる技術教育に重点を置いています。 彼が最新のハードウェアやストリーミング ツールをテストしていないときは、通常、ネオンや CRT モニターの輝きの中に隠れて、アナログ ビデオやレトロなハードウェアをいじっているのを見つけることができます。
重要な8分間。