ビデオエンコーディングのテスト: AMD GPU は依然として Nvidia、Intel に遅れをとっています (更新)

ニュース

ホームページホームページ / ニュース / ビデオエンコーディングのテスト: AMD GPU は依然として Nvidia、Intel に遅れをとっています (更新)

Jun 03, 2023

ビデオエンコーディングのテスト: AMD GPU は依然として Nvidia、Intel に遅れをとっています (更新)

Codifica AVC, HEVC, AV1 testata Le migliori schede grafiche sono molto più che semplici

AVC、HEVC、AV1 エンコーディングがテストされる

最高のグラフィックス カードはゲームをプレイするためだけのものではありません。 人工知能のトレーニングと推論、プロフェッショナル アプリケーション、ビデオのエンコードとデコードはすべて、より優れた GPU の恩恵を受けることができます。 はい、依然としてゲームが最も注目を集めていますが、私たちは他の側面にも注目したいと考えています。 ここでは、さまざまな世代の GPU から期待できるビデオ エンコーディングのパフォーマンスと品質に特に焦点を当てます。一般的に、各世代の GPU のビデオ エンコーディング/デコーディング ブロックはすべて同じパフォーマンスを発揮しますが、状況に応じて多少の違いはあります。ビデオブロックのクロック速度。 例として RTX 3090 Ti と RTX 3050 (Nvidia の Ampere RTX 30 シリーズ世代の最速および最も遅い GPU) をチェックしましたが、実質的に違いは見つかりませんでした。 ありがたいことに、これにより、必要な GPU よりも少ない数の GPU が必要になります。チーム グリーンの Nvidia の RTX 4090、RTX 3090、および GTX 1650 をテストします。これは、Ada Lovelace、Turing/Ampere (機能的に同一)、およびPascal 時代のビデオ エンコーダ。 Intel については、Arc A770 と統合 UHD 770 を備えたデスクトップ GPU を検討しています。AMD が、少なくとも速度の点で最も広く普及しているため、最終的には RX 7900 XTX、RX 6900 をテストすることになりました。 XT、RX 5700 XT、RX Vega 56、および RX 590。また、CPU ベースのソフトウェア エンコーディングに対して GPU エンコーダーがどのように機能するかを確認したいと考えており、そのために Core i9-12900K と Core i9-13900K を使用しました。2013 年 3 月 9 日更新:最初の VMAF スコアは逆方向に計算されました。つまり、「歪んだ」ビデオを「参照」ビデオとして使用し、その逆も同様です。 言うまでもなく、これにより、意図したよりもはるかに高い VMAF スコアが得られました。 その後、すべての VMAF スコアを再計算しました。 不思議に思っている方のために説明すると、これは非常に計算量が多く、Core i9-13900K では GPU ごとに約 30 分かかります。幸いなことに、チャートは現在修正されています。 悪いニュースは (最初に間違った結果が公開されたこと以外に)、最初の torrent ファイルを削除し、新しい VMAF 計算からのログを含む新しいファイルで更新していることです。 また、スコアも低くなったため、16Mbps での 4K 60 fps エンコードが基本的に元の品質と一致すると考えていた場合、それは選択的に当てはまるだけです (ソース ビデオによって異なります)。

テストのほとんどは、最新のグラフィックス カードのレビューに使用したのと同じハードウェアを使用して行われましたが、2022 GPU ベンチマーク階層を強化する 12900K PC で CPU テストも実行しました。 より厳しい CPU エンコード テストとして、より高品質のエンコード プリセットを使用して 13900K も実行しましたが、それについては後ほど詳しく説明します。

インテル第 13 世代 PC Intel Core i9-13900KMSI MEG Z790 Ace DDR5G.Skill Trident Z5 2x16GB DDR5-6600 CL34Sabrent Rocket 4 Plus-G 4TB静かです! 1500W Dark Power Pro 12Cooler Master PL360 FluxWindows 11 Pro 64 ビットインテル第 12 世代 PCIntel Core i9-12900KMSI Pro Z690-A WiFi DDR4Corsair 2x16GB DDR4-3600 CL16Crucial P5 Plus 2TBCooler Master MWE 1250 V2 GoldCorsair H150i Elite CapellixCooler Master HAF500Windows 11 Pro 64 ビット

私たちのテスト ソフトウェアでは、ffmpeg nightly が現在の最良のオプションであることがわかりました。 最新の AMD、Intel、Nvidia ビデオ エンコーダをすべてサポートしており、比較的簡単に構成でき、ビデオ エンコーディングの品質を比較するために使用している VMAF (Video Multi-Method Assessment Fusion) 機能も提供します。 ただし、Nvidia Pascal テストには最後の公式リリース 5.1.2 を使用する必要がありました (夜間のビルドは HEVC エンコーディングで失敗しました)。これらのテストはすべてシングルパス エンコーディングを行っています。さまざまな GPU によって提供されるハードウェアを使用しますが、より複雑なエンコード命令を常に処理できるとは限りません。 GPU ビデオ エンコーディングは通常、ゲームプレイのライブストリーミングなどに使用されますが、最高の品質が必要な場合は、通常、17 または 18 の高い CRF (一定レート係数) を備えた CPU ベースのエンコーディングを選択する必要がありますが、当然の結果になります。はるかに大きなファイルとより高い平均ビットレートで。 ただし、議論する価値のあるオプションはまだたくさんあります。AMD、Intel、Nvidia はすべて、品質を向上させるためのさまざまな「プリセット」を持っていますが、これらのプリセットが正確に何であるか、またはそれらが何をするのかは必ずしも明確ではありません。 ffmpeg の Nvidia の NVENC はデフォルトとして「p4」を使用します。 また、「p7」(最高品質) に切り替えると VMAF スコアはほとんど変化せず、エンコード パフォーマンスは 30 ~ 50% 低下しました。 AMD はエンコーダの「速度」に「-品質」設定を選択していますが、「バランス」でもテストしました。Nvidia と同様に、「品質」を最大設定にするとパフォーマンスは大幅に低下しましたが、VMAF スコアは 1 ~ 2 しか改善されませんでした。パーセント。 最後に、Intel は「中」のプリセットを使用しているようで、それが良い選択であることがわかりました。「非常に遅い」はエンコードにほぼ 2 倍の時間がかかり、品質はほとんど向上しませんでしたが、「非常に速い」は適度に高速でしたが、品質は大幅に低下しました。最終的に、2 セットのテストを選択しました。 まず、各 GPU のデフォルトのエンコーダー設定があり、指定したのはターゲット ビットレートだけです。 それでも、エンコードされたファイル サイズにはわずかな違いがあります (約 +/-5% の広がり)。 次に、ffmpeg サブレディットに相談した後、GOP サイズを 2 秒 (60 fps ビデオの場合は「-g 120」) に指定して、エンコード設定が少し安定するように GPU を調整しようとしました。 AMD は私たちのチューニングの最大の恩恵を受け、速度と引き換えに VMAF スコアを約 5 ~ 10% 向上させました。 しかし、ご覧のとおり、AMD は依然として他の GPU に後れを取っていました。他にも多くの潜在的な調整パラメーターがあり、その中には状況を大きく変える可能性のあるパラメーターもあれば、ほとんど効果がないようなものもあります。 私たちはアーカイブ品質を目指しているわけではないので、GPU を使用する高速なプリセットを選択しましたが、将来的には見直す可能性があります。 さまざまな GPU で使用する最適な設定に関する別の推奨事項があれば、その設定の機能の説明とともにコメントで知らせてください。 また、ffmpeg の設定と品質が他の潜在的なエンコード スキームとどのように比較されるかは不明ですが、それはこのテストの範囲を超えています。デフォルトのエンコードと「調整された」エンコードの両方で使用した設定は次のとおりです。

AMD:デフォルト: ffmpeg -i [ソース] -c:v [h264/hevc/av1]_amf -b:v [ビットレート] -y [出力]調整: ffmpeg -i [ソース] -c:v [h264/hevc/av1] ]_amf -b:v [ビットレート] -g 120 -品質バランス -y [出力]

インテル:デフォルト: ffmpeg -i [ソース] -c:v [h264/hevc/av1]_qsv -b:v [ビットレート] -y [出力]調整: ffmpeg -i [ソース] -c:v [h264/hevc/av1] ]_amf -b:v [ビットレート] -g 120 -preset media -y [出力]

エヌビディア:デフォルト: ffmpeg -i [ソース] -c:v [h264/hevc/av1]_nvenc -b:v [ビットレート] -y [出力]調整: ffmpeg -i [ソース] -c:v [h264/hevc/av1] ]_nvenc -b:v [ビットレート] -g 120 -no-scenecut 1 -y [出力]

「調整された」設定で試みたほとんどの試みは、実際には品質やエンコード速度を向上させることはなく、一部の設定では ffmpeg (またはテスト PC) が完全に機能不全に陥る可能性がありました。 上記の設定の主な点は、キー フレーム間隔を一定に保ち、潜在的に画質をわずかに向上させることです。繰り返しになりますが、より良い設定をお勧めする場合は、コメントに投稿してください。 喜んで試してみます。 重要なことは、ビットレートを同じに保ち、最新世代の GPU に対して少なくともリアルタイム (つまり 60 fps 以上) の適切なエンコード速度が必要であるということです。 とはいえ、今のところ、AMD GPU を除いて、「調整された」設定はデフォルト設定に非常に近い結果になったので、それらのグラフを示すだけです。前置きはさておき、以下に示します。結果。 『ボーダーランズ 3』、『ファークライ 6』、『ウォッチドッグス レギオン』のゲームプレイをキャプチャーした 4 つのテストビデオがあります。 『ボーダーランズ 3』では 1080p と 4K でテストを実行し、他の 2 つのゲームでは 4K でテストを実行しました。 H.264/AVC、H.265/HEVC、AV1 の 3 つのコーデックもあります。 設定とコーデックごとに 2 つのグラフがあり、VMAF を使用して品質を比較し、エンコード パフォーマンスを示します。参考までに、VMAF スコアは 0 ~ 100 のスケールに従い、20 が「悪い」、40 が「悪い」、60 に相当します。評価は「普通」、80 は「良い」、100 は「素晴らしい」です。 一般に、スコアは 90 以上が望ましく、95 以上は元のソース素材とほとんど区別がつきません。VMAF スコアには重複する部分がたくさんあるため、線の 1 つが見えない場合は、下の表を確認してください。生の数値を示しています。または、隣接する世代の GPU はほぼ同じ品質であることが多いということを覚えておいてください。 以下の表全体を解析したくない場合は、AMD の RDNA 2 世代と RDNA 3 世代の H.264 エンコード品質は同じ結果になりますが、パフォーマンスはかなり異なります。 Nvidia の GTX 1080 Ti と GTX 1650 は、H.264 と HEVC の両方で同一の品質を備えていますが、RTX 2080 Ti と RTX 3090 は HEVC で同一の品質を備えています。

1080p のボーダーランズ 3 のビデオから始まり、他の場所でも見られる興味深い傾向がいくつかあります。 GPU 間で若干の一致があるため、「調整された」結果について説明します。 まずは、最も人気のあるコーデックである AVC/H.264 から始めましょう。 約 10 年前から存在し、それ以来品質で上回っていますが、事実上ロイヤルティ フリーであるため、広く普及しました。AMD の GPU は、このテストでは、Polaris、Vega、RDNA 1 とともにチャートの最下位にランクされています。どの世代のハードウェアも、品質の点ではほぼ同じパフォーマンスを発揮します。 RDNA 2 ではエンコードが少し改善され、主に低ビットレートでの品質が約 10% 向上しました。 RDNA 3 は、H.264 に対して RDNA 2 と同じロジックを使用しているようで、6900 XT と 7900 XTX のスコアは同点で、3Mbps では他の AMD カードよりも少し高いですが、6Mbps と 8Mpbs の結果は実質的に変わりません。Nvidia のH.264 実装は、品質の点でトップのソリューションとして挙げられ、Intel の Arc がわずかに遅れていますが、実際には違いを見分けるのは難しいでしょう。 Turing、Ampere、および Ada GPU は、古い Pascal ビデオ エンコーダよりもわずかに優れていますが、品質に大きな改善はないようです。CPU エンコーディングで選択した「中」設定では、libx264 コーデックが使用されます。最終的には、少なくともこれらの 1080p テストでは、AMD の UHD 770 (Xe LP) グラフィックスとほぼ同じレベルになり、Nvidia の古い Pascal 時代のエンコーダよりもわずかに遅れています。パフォーマンスに関する限り、これは二次的な懸念事項のようなものです。ライブストリーミングでは 60 fps を超える可能性がありますが、RTX 4090 は 500 fps 近くで最速となり、RTX 2080 Ti、RTX 3090、RX 7900 XTX を約 15% 上回りました。 3 位は Intel Arc で、次に GTX 1650 の Nvidia の Pascal、その次が RX 6900 XT、そして GTX 1080 Ti が Pascal に代わっています。GTX 1080 Ti と GTX 1650 は同一の品質結果を示していることに注意してください。そのため、違いは次のとおりです。興味深いことに、Core i9-13900K は古い RX Vega 56 よりも高速に 1080p でエンコードできます。これは、Core i9-13900K の UHD 統合グラフィックスとほぼ同じ速度です。 AMD の古い RX 590 は、100 fps をわずかに超える速度で車掌車を起動します。 繰り返しになりますが、2016 年から 2018 年の時代には、これはおそらくそれほどひどいことではありませんでした。

HEVC に切り替えると画質が確実に向上します。HEVC はかなり前から存在しており、事実上すべての最新の PC が適切な GPU エンコーディング サポートを備えているはずです。 より多くのアプリケーションでの採用を実際に妨げているのはロイヤルティだけであり、多くのソフトウェアはそれを避けるために H.264 を使い続けることを選択しました。ランキングに関する限り、AMD のさまざまな GPU はこのテストでも残りのオプションを下回っています。 、ただし、H.264 よりもかなり近いです。 RDNA 3 ビデオ エンジンは RDNA 1/2 バージョンよりわずかに優れていますが、興味深いことに、古い Polaris GPU と Vega GPU は基本的に RDNA 3 と一致します。Nvidia が 2 位となり、Turing、Ampere、および Ada ビデオ エンジンは基本的に HEVC 品質で並んでいます。 。 UHD 770 における Intel の前世代の Xe-LP アーキテクチャは、新しい Nvidia GPU にも一致し、次に Nvidia の旧世代の Pascal、そして CPU ベースの libx265 の「中」結果と一致します。しかし、HEVC 品質の大きな勝者は、最終的に Intel の Arc アーキテクチャになります。 これは大きな勝利ではありませんが、あらゆるビットレートにおいて他のオプションより明らかに優れています。 ビットレートが 8Mbps の場合、多くのカードは元のソース素材に (知覚的に) 非常に近いレベルに達し、Arc は VMAF スコア 92.1 を達成しました。テストした設定では、CPU と Nvidia Pascal の結果は基本的に次のとおりです。同点で、7900 XTX を 3 ~ 5% 上回っています。 Intel の Arc A770 は、純粋な数値で RTX 4090/3090 をかろうじて上回り、ビットレートに応じて 0.5 ~ 1.9% の差を付けています。 また、8Mbps で 95 ~ 96 のスコアを示し、Arc、Ada、Ampere GPU はすべて、ソース素材と実質的に区別できないエンコーディングを効果的に達成していることにも注目してください。特にハードウェアの世代を見ると、パフォーマンスは少し興味深いものになります。 古い GPU モデルは一般に、H.264 エンコードよりも HEVC で高速であり、場合によってはかなり大きなマージンを持っています。RX 590、GTX 1080 Ti、GTX 1650 を見てください。しかし、RTX 2080 Ti、RTX 3090、RTX 4090 は高速です。そのため、Turing 世代以降では、Pascal に比べて HEVC 速度の優先順位が低くなっているようです。 一方、Arc は HEVC で最高のパフォーマンスを実現しますが、Xe-LP UHD 770 は H.264 でより優れたパフォーマンスを発揮します。特に 3Mbps の低いビットレートでは、全体的な品質に大きな変化があります。 VMAF の最悪の結果は現在 60 台半ばで、CPU、Nvidia GPU、Intel GPU はすべて 80 以上に留まっています。しかし、AV1 がそれ​​以上の結果を出せるかどうか見てみましょう。

AV1 は HEVC よりも品質が優れていますか? おそらく、使用している GPU (または CPU) によって異なります。 全体として、AV1 と HEVC は、少なくとも私たちが持っている 4 つのサンプルについては、ほぼ同等の品質を提供します。 いくつかの違いがありますが、その多くはコーデックのさまざまな実装に起因します。たとえば、AMD の RDNA 3 は、HEVC よりも AV1 の方が 1 ~ 2 ポイント優れています。 Nvidia の Ada カードは、これまでのところ最高の結果を達成しており、HEVC よりも約 2 ポイント向上しています。 Intel の Arc GPU は逆に、AV1 と HEVC のスコアが 2 ~ 3 ポイント低くなります。 libsvtav1 コーデック CPU の結果に関しては、8Mbps では基本的に HEVC と同点ですが、6Mbps では 1.6 ポイントリードし、3Mpbs では比較的大幅な 5 ポイントのリードがあります。RX 7900 シリーズおよび RTX 40 シリーズ カードのコストを考慮すると、現時点で多くの人にとって実用的な AV1 の選択肢は Arc GPU だけでしょう。 ちなみに、A380 は A770 と同等の品質の結果 (小数点以下 6 桁まで) を提供し、実際には若干高速でした。これはおそらく、使用した Gunnir の A380 カードに工場出荷時のオーバークロックが搭載されているためでしょう。 あるいは、CPU ベースの AV1 エンコードを選択することもできます。これは、GPU エンコーダとほぼ一致し、13900K で 200 fps 以上で実行できます。これは、AV1 をわざわざ使用したいと考えていることを前提としていますが、この段階ではまだサポートされていません。 HEVC と同じくらい広範囲にサポートされています。 (たとえば、AV1 ファイルを Adob​​e Premiere にドロップしてみてください。)CPU 上で HEVC エンコードがどれほど要求されるのかも興味深いですが、比較すると AV1 はかなり「簡単」に見えます。 場合によっては (4K で)、AV1 の CPU エンコードは実際には H.264 エンコードよりも高速でした。ただし、それは明らかにそれぞれに使用される設定と特定の CPU に依存します。

4K エンコードに移行すると、H.264 でのビットレート要求は 1080p よりも大幅に高くなります。 8Mbps では、Intel の Arc がわずか 65 のスコアで最高の栄誉を獲得していますが、Nvidia の Ada/Ampere/Turing GPU (実質的に同じ VMAF 結果が得られました) は、Intel UHD 770 と同じ約 57 でした。Nvidia の Pascal 世代エンコーダは 54 を獲得しました、次に CPU エンコーダが 48 ポイントです。最後に、AMD の RDNA 2/3 は 44 ポイントを獲得していますが、AMD の古い GPU はわずか 33 ポイントでかなりひどいです。ビットレートを 12Mbps と 16Mbps に上げると、当然のことですが、かなりの効果があります。 16Mbps での 4K H.264 エンコードの最良の結果はまだ 80 にすぎません。これは「良い」結果ですが、それより良い結果ではありません。 4K で 16Mbps、ピンチの場合は 60 fps で対応できますが、実際には、適度なビットレートでより高い解像度をより適切に処理するには、最新のコーデックが必要です。AMD は RDNA 2 で改良を加えましたが、RDNA 3 では同じコア アルゴリズム (同一のもの) が使用されているようです。 6900 XT と 7900 XTX の間のスコア)、より高いパフォーマンスを備えています。 しかし、初期の AMD GPU に対する利点は、ほとんどが低いビットレートで実現されます。 最新の 7900 XTX は、最悪の場合の Vega GPU よりも 1 ~ 2 ポイント高いスコアしか得られません。予想どおり、4K でのエンコーディング パフォーマンスははるかに要求が厳しくなります。 ほとんどのソリューションは 1080p の約 1/3 の速度であり、場合によっては 1/4 に近いパフォーマンスになることもあります。 私たちのテストによると、AMD の古い Polaris GPU は 30 fps さえ管理できませんが、Vega カードは 60 fps をはるかに下回ります。 Core i9-13900K は約 80 fps で動作しますが、ゲームをプレイしている場合は、ビデオ エンコードのタスクにそれほど多くの CPU 馬力を費やしたくないかもしれません。

HEVC および AV1 エンコードは 4K 以上までスケールアップできるように設計されており、この点はグラフがよく示しています。 一般に、8Mbps の HEVC および AV1 は、12Mbps の H.264 の品質を上回ることができます。 すべての GPU (および CPU) は 16 Mbps で VMAF スケールで 80 を突破する可能性があり、上位の結果は 90 のスコアで競い合います。画質を求めるのであれば、AMD の最新の RDNA 3 エンコーダーは依然として遅れをとっています。 エンコード速度はかなり速いですが、少なくとも ffmpeg テストでは、Nvidia の Pascal 時代のハードウェアでさえ、AMD のハードウェアと比較して一般に優れた結果を提供します。 HEVC を搭載した GTX 1650 でさえ、すべてのビットレートで AMD の AV1 スコアを上回ることができますが、7900 XTX は AV1 でのスコアが HEVC よりも 2 ~ 3 ポイント高くなります。 一方、Nvidia の RTX 40 シリーズ エンコーダは、絶対的な総合品質で勝利を収めており、その AV1 の結果は、4K、さまざまなビットレートで Intel の HEVC の結果を上回っています。AMD は、コードの品質を改善するために ffmpeg と連携していると報告しました。それがどうなるか見てみる必要があるだろう。 これによって品質が大幅に向上し、AMD が Nvidia と同等になるのか、それとも 1 ポイントか 2 ポイントにとどまるのかはわかりません。 それでも、少しずつ改善されるのは良いことです。パフォーマンスの観点から見ると、HEVC と AV1 は H.264 よりも優れているわけではありません。 AMD の 7900 XTX は、AV1 で 200 fps に達し、かなりの差を付けて群の中で最速であり、これもまた品質向上への期待を残しています。 それ以外の場合、4K HEVC の場合は、60 fps を超える速度で 4K エンコードを処理するには、Pascal 以降の Nvidia カード、RDNA 以降の AMD カード、または Intel の Arc が必要になります (GPU が実際にライブストリーミング用に高速にフレームを生成できると仮定します)。パフォーマンスに関しては、HEVC と AV1 の CPU 結果にも注目してください。 その一部は、選択したエンコーダ (libsvtav1 および libx265) および選択したプリセットに起因します。 それでも、VMAF の結果が CPU 経由の HEVC と AV1 エンコーディングにどれだけ近いかを考慮すると、スループットが 2 倍を超えているため、ここで AV1 エンコーディングについて適切な議論を行うことができます。そして、実際には libx264 の結果よりも高速であり、これはおそらくマルチ処理が優れているためです。 -アルゴリズムのスレッド スケーリング。

4K での他の 2 つのゲーム ビデオの結果は、4K でのボーダーランズ 3 で見たものと実質的に変わりません。 Far Cry 6 は、パフォーマンスに多少の違いはあるものの、3 つのコーデックすべてで VMAF スコアが高くなりましたが、ストーリーに追加する必要があるのはこれだけです。これまでのところ、あまり時間をかけて調べていないので、見てみましょう。インテルの統合 UHD グラフィックス 770、つまり第 12 世代 Alder Lake および第 13 世代 Raptor Lake CPU の統合グラフィックスについて詳しく説明します。 品質は Arc より少し低く、H.264 の結果は VMAF スコアの点で Nvidia の Pascal と最近の Turing/Ampere/Ada 世代の間に位置します。 一方、HEVC エンコーディングは、ほとんどの場合、Arc や Nvidia GPU よりわずか 1 ~ 2 ポイントの差にすぎません。パフォーマンスは別の話で、予想よりもはるかに低く、Arc の能力の半分にも満たません。 確かに、Arc には 2 つのビデオ エンジンがありますが、UHD 770 は H.264 の 4K で 44 ~ 48 fps しか管理できず、HEVC エンコードでは 24 ~ 27 fps に低下します。 HEVC エンコードの場合、12900K CPU エンコードの方が高速で、AV1 では UHD 770 の HEVC 結果の約 3 倍高速でありながら、より高い忠実度を実現しました。UHD 770 とアークGPU。 これらのモードはディープ リンクと呼ばれますが、Xe グラフィックス ソリューションの品質とパフォーマンスがわずかに低いことを考慮すると、品質よりも最大のパフォーマンスが重要な状況で主に役立つのではないかと考えられます。

Watch Dogs Legion も同じストーリーを繰り返しますが、Far Cry 6 と比較して VMAF スコアが再び増加しました。これはおそらく、カメラの動きがそれほど速くないため、フレーム間の変化がそれよりも小さくなり、より優れた圧縮が可能となり、より高い目標が得られます。同じビットレート内での品質。パフォーマンスはほとんどの場合、Far Cry 6 とほぼ同じになります。実行ごとに多少の変動があり、実際には考慮していません。誤差は約 3% と推定されます。 FPS は、GPU ごとに各エンコードを 1 回だけ行ったためです。

すべてのグラフの別のビューとして、表形式でまとめられた生のパフォーマンスと品質データを次に示します。 ビットレート、次にコーデックごとにグループ化されているため、解析するのはそれほど簡単ではないことに注意してください。ただし、興味があれば、これによりすべての正確な VMAF スコアが得られます。また、一部のハードウェア間でどれだけ小さな変化があったかを確認することもできます。 2 番目のテーブルもあり、今回は各コーデックとビットレートの最良の結果と比較したパフォーマンスと品質に基づいて色分けされています。 すぐに目に見える興味深い側面の 1 つは、AMD のエンコード ハードウェアが RX 7900 XTX で 4K でどれだけ高速であるかです。同様に、RTX 40 シリーズ エンコーダーが 1080p でどれだけ高速であるかがわかります。 一方、品質では 40 シリーズと Arc GPU が有利です。

オリジナルのビデオ ファイルを見たい場合は、個人的にホストされている BitTorrent マグネット リンクを作成しました。マグネット:?xt=urn:btih:df31e425ac4ca36b946f514c070f94283cc07dd3&dn=Tom%27s%20ハードウェア%20ビデオ%20エンコーディング%20テスト更新:これは、VMAF 計算が修正された、更新された torrent です。 不正な VMAF を使用した最初のエンコードのログ ファイルも含まれていますが、これらのファイルにはエンコード時間の FPS 結果が含まれています。トレント ダウンロードでは、各 GPU にも 2 つのログ ファイルがあります。 「Encodes-FPS-WrongVMAF」テキスト ファイルは、逆方向 VMAF 計算を含む、最初のエンコード テストのログです。 「Encodes-CorrectVMAF」ファイルは、修正された VMAF 計算のみです (グラフの生成に使用されるデータのインポートを少し楽にするために、AV1 エンコードをサポートしていない GPU のプレースホルダー「—」値が含まれています)。 興味深い場合は、適切なフォルダー内のコマンド ラインから次のコマンドを発行すると、VMAF の前後の結果とエンコード速度の FPS 値を確認できます。

独自のテストを行いたい場合は、上記の BitTorrent マグネット リンクは今後数か月間アクティブのままになります。これは私自身のホーム ネットワークからシードされており、上り 20Mbps に制限されているため、可能であれば参加して共有してください。 以前に Arc A380 テストをダウンロードしたことがある場合は、これらのテスト用に 100Mbps より高いビットレートで新しいビデオを録画したため、ほぼすべてのファイルが完全に新しいことに注意してください。 そのレビューでは VMAF の比較も交換したと思います。そのため、これらの新しい結果が優先されます。ファイルはすべてフォルダーに分散されているため、コレクション全体に興味がない場合は、必要なものだけをダウンロードできます。 また、何らかの理由で 350 以上のビデオをすべて楽しみたい場合は、16.4 GiB のダウンロードが必要です。 乾杯!すべてのファイルをダウンロードしたくない人のために、参照用にボーダーランズ 3 1080p および 4K ビデオからの限られたスクリーン キャプチャ セットを以下に提供します。 そうしないと非常に時間がかかるため、最近の GPU からの画面のみを実行することにします。

1080p ソース 38Mbps

AMD RDNA3 1080p H.264 3Mbps

AMD RDNA3 1080p HEVC 3Mbps

AMD RDNA3 1080p AV1 3Mbps

インテル Arc 1080p H.264 3Mbps

インテル Arc 1080p HEVC 3Mbps

インテル Arc 1080p AV1 3Mbps

Nvidia Ada Lovelace 1080p H.264 3Mbps

Nvidia Ada Lovelace 1080p HEVC 3Mbps

Nvidia Ada Lovelace 1080p AV1 3Mbps

CPU 13900K 1080p H.264 3Mbps

CPU 13900K 1080p HEVC 3Mbps

CPU 13900K 1080p AV1 3Mbps

4Kソース 50Mbps

AMD RDNA3 4K H.264 8Mbps

AMD RDNA3 4K HEVC 8Mbps

AMD RDNA3 4K AV1 8Mbps

インテル Arc 4K H.264 8Mbps

インテル Arc 4K HEVC 8Mbps

インテル Arc 4K AV1 8Mbps

Nvidia は Lovelace 4K H.264 8Mbps を搭載

Nvidia Ada Lovelace 4K HEVC 8Mbps

Nvidia は Lovelace 4K AV1 8Mbps を搭載

CPU 13900K 4K H.264 8Mbps

CPU 13900K 4K HEVC 8Mbps

CPU 13900K 4K AV1 8Mbps

上のギャラリーは、AMD RX 7900 XTX、Intel Arc A770、Nvidia RTX 4090、および Core i9-13900K の CPU エンコードからの 1 フレームのみのスクリーンキャプチャを示しています。 もちろん、単一のフレームが重要ではなく、キー フレームの配置場所に違いが生じる可能性がありますが、理論的にはすべてのエンコーダーがキー フレームを配置するように「-g 120」オプションを使用したのはそのためです。同じ場所。 いずれにせよ、これらの画像を閲覧したい場合は、別のタブで画像全体を表示することをお勧めします。最低のビットレートでのみスクリーン グラブを実行することを選択しましたが、これだけでも十分な時間がかかりました。 少なくとも、エンコードされたビデオがどのように見えるかをある程度把握することはできますが、VMAF スコアは、指定されたエンコーダーを使用してストリームを視聴する全体的なエクスペリエンスがどのようなものになるかについて、おそらくより良いガイドを提供します。選択した解像度のビットレートを比較すると、VMAF の結果は「悪い」から「まあまあ」までの範囲にあることに注意してください。ビットレートの高いビデオは、ここで示しているビデオよりもはるかに優れていることは間違いありません。

さまざまなエンコードを何度も実行および再実行した後、競争条件を平準化するために最善を尽くしてきましたが、それでも所々でかなりでこぼこしています。 おそらく、速度を犠牲にすることなく品質を向上できる、私たちがよく知らないオプションがいくつかあるかもしれませんが、そのようなことを理解するのに多大な時間を費やす予定がない場合、これらの結果は、期待されることの適切なベースラインを提供するはずです。 AV1 エンコードについては誇大宣伝されていますが、実際には、見た目も感じも HEVC とそれほど変わりません。 唯一の本当の利点は、AV1 がロイヤルティ フリーであることになっているということです (これを争う​​いくつかの訴訟が進行中です) が、自分の映画をアーカイブする場合は、確かに HEVC の使用を続けることができ、次の場合に多くのものを逃すことはありません。何でも。 おそらく、H.264 が過去 10 年以上にわたって事実上のビデオ標準となったのと同じように、今後 AV1 が引き継ぐことになるでしょう。 確かに、その背後にはいくつかの有名企業がおり、現在では主要な PC GPU メーカー 3 社すべてがエンコーディングのサポートを加速しています。全体的な品質とパフォーマンスの観点からは、Nvidia の最新の Ada Lovelace NVENC ハードウェアが、AV1 をコーデックとして選択し、勝者となっています。 、しかし現時点では、RTX 4070 Ti の場合、799 ドルから始まる GPU でのみ利用可能です。 最終的には 4060 および 4050 のバージョンが登場する予定で、これらはすでにラップトップに搭載されていますが、重要な注意点があります。12GB 以上の VRAM を搭載した 40 シリーズ カードにはデュアル NVENC ブロックが搭載されていますが、他のモデルには 1 つのエンコーダ ブロックしか搭載されていません。これは、ここでのテストと比較してパフォーマンスが約半分であることを意味する可能性があります。少なくともビデオ エンコーディングに関する限り、品質とパフォーマンスの点で Nvidia に劣らず、Intel の Arc GPU はストリーミング目的にも最適です。 実際、HEVC では AV1 よりも高品質の結果が得られ、基本的には Nvidia の 40 シリーズに匹敵します。 確かにアーカイブに使用することもできますが、それが重要な魅力ではないでしょう。 ただし、Nvidia がより多くのチューニング オプションをサポートしていることは間違いなく、ソフトウェア サポートも増えているようです。一方、AMD の GPU は競合他社に遅れをとっています。 RDNA 3 ベースの RX 7900 カードは、これまでの AMD GPU の中で最高品質のエンコードを提供しますが、それは多くを意味するものではありません。 実際、少なくとも現在のバージョンの ffmpeg では、品質とパフォーマンスは 2016 年当時の GTX 10 シリーズ GPU から得られたものとほぼ同等です。AV1 サポートがないことを除けば、当然のことながら、AV1 は以前のものではないためです。ビデオ エンコーディングの能力だけを目的としてグラフィックス カードを購入する人はほとんどいないと思われるため、GPU ベンチマークと安定拡散テストをチェックして、さまざまなカードが他の領域でどのように評価されるかを確認してください。 次に、安定拡散の更新された数値を実行する必要があり、他の AI ベンチマークをいくつか検討していますが、それは別の日の話です。

25 年以上にわたり、熱心な PC 技術ニュースの内部情報として Tom's Hardware を読んでいる専門家に加わりましょう。 CPU、GPU、AI、メーカーのハードウェアなどに関する最新ニュースと詳細なレビューをあなたの受信箱に直接お届けします。

Jarred Walton は、Tom's Hardware の上級編集者であり、GPU 全般に重点を置いています。 彼は 2004 年からテクノロジー ジャーナリストとして活動しており、AnandTech、Minimum PC、および PC Gamer に寄稿しています。 最初の S3 Virge の「3D 減速機」から今日の GPU まで、Jarred は最新のグラフィックス トレンドをすべて把握しており、ゲーム パフォーマンスについてよく質問します。

AMD RX 7600 は RX 7900 XTX よりもキャッシュ レイテンシが優れています

Nvidia ドライバーが PCIe 5.0 SSD で GPU 圧縮解除を 17% 向上

AMD、Jedi CPU バンドルを拡張、新しい Resident Evil 4 GPU セールを開始、7900X3D が 50 ドルオフ

スチュワート・ベンドル著2023年6月5日

アーロン・クロッツ著 2023年6月5日

By Mark Tyson2023年6月5日

アントン・シロフ著2023年6月5日

By Mark Tyson2023年6月5日

アッシュ・ヒル著 2023年6月5日

アッシュ・ヒル著 2023年6月5日

By Mark Tyson2023年6月4日

By Mark Tyson2023年6月4日

アッシュ・ヒル著 2023年6月4日

アッシュ・ヒル著 2023年6月4日

更新 3/09/2013: INTEL 第 13 世代 PC INTEL 第 12 世代 PC AMD: Intel: Nvidia: Magnet:?xt=urn:btih:df31e425ac4ca36b946f514c070f94283cc07dd3&dn=Tom%27s%20Hardware%20Video%20Encoding%20Tests 更新:テスト済みビデオエンコーディング: AMD GPU は依然として Nvidia、Intel に遅れをとっています : 続きを読む