Simple Science

最先端の科学をわかりやすく解説

# 電気工学・システム科学# 画像・映像処理

ビデオエンコーディングの複雑さ制御の進展

新しい方法で動画ストリーミングのエンコーディング効率がアップしたよ。

― 1 分で読む


動画エンコードの複雑さ制御動画エンコードの複雑さ制御のブレイクスルーアップしたよ。新しい方法で動画エンコーディングの効率が
目次

最近の動画エンコーディング技術の進歩で、動画ファイルの圧縮がかなり良くなったけど、その分コンピュータのリソースに対する要求も高まってる。オンライン動画のトラフィックが近年急増しているから、質と効率のバランスを取った効果的なエンコーディングが必要になってきた。それに応えるためには、エンコーダーの複雑さをコントロールするメカニズムが必要なんだ。このメカニズムは処理時間を管理して、パフォーマンスと複雑さの良いトレードオフを確保してくれる。

これを実現する一つの方法が、SVT-AV1でのスピード適応プリセット切り替えというやり方。これを使うと、動画のエンコーディングに時間制限を設定できるから、その制限内でエンコーディングが行われつつ、利用可能なプリセットのフルレンジを使えるんだ。このアプローチは平均で8.9%の精度を示していて、エンコーディングプロセスに余計な遅延を加えることもないんだ。

効率的な動画ストリーミングへの推進

コンピュータの性能が向上し続けてるから、様々な問題への解決策が手に入れやすくなってる。ただ、技術の急速な進化は消費者にも企業にもコストがかかることがある。最新技術に追いつくために、クラウドコンピューティングサービスに頼る人が多いんだ。これらのサービスはリーズナブルな価格で高度な処理能力を提供してくれるから、ユーザーが最新の技術にアクセスしやすくなる。

こういうサービスを使うとき、プログラムの予想処理時間を事前に知っておくと便利だよね。タスクの複雑さをコントロールできると、データセンターの効率が良くなるんだ。これは特に、現在ウェブトラフィックのかなりの部分を占める動画ストリーミングの世界では重要なんだ。動画エンコーディングにはかなりのコンピュータリソースが必要だから、動画エンコーディングタスクのために効果的な複雑さのコントロールが必要なんだよ。

AV1コーデックの登場

2018年に、オープンメディアアライアンスがAV1コーデックを発表したんだけど、これは前のVP9よりもビットレートの節約ができる新しいコーディング基準なんだ。でも、これにはトレードオフがあって、エンコーディング時間が長くなっちゃう。翌年、インテルがSVT-AV1というオープンソースの実装を出して、AV1がもたらした複雑さを少し減らそうとしたけど、全体的な複雑さは高いままでプリセットを使ってエンコーディングオプションを効果的に管理する必要があったんだ。

これらのプリセットは、エンコーダーの最適化の選択を制限するのに役立って、ユーザーがエンコーディングの質と処理時間のバランスを素早く決めることができるようにしてくれる。でも、このプリセット内で時間を正確にコントロールするのは難しいことが分かってる。

既存の複雑さコントロール手法

AV1の最初の複雑さコントロール手法はマルチオブジェクティブ最適化に基づいていて、コントローラーが現在の設定を維持するか変更するかを決定して速度を最適化するんだ。この方法では複雑さを10%から40%削減できるんだ。さらに、Versatile Video Coding (VVC)やHigh Efficiency Video Coding (HEVC)などの他のコーデックもそれぞれ自分たちの複雑さコントロール手法を持っていて、パーティション処理を制限したり、エンコーディングされるコンテンツに基づいて特定のパラメーターを調整するようなさまざまな戦略が含まれてる。

SVT-AV1の複雑さコントロールに対する新しいアプローチ

SVT-AV1に提案された新しい方法は、高い精度でプリセット全体の複雑さをコントロールすることに焦点を当ててる。これにより、ユーザーはプリセットを手動で選ぶことなく、エンコーディングのためのターゲット時間を指定できるんだ。圧縮性能に少しの損失があるかもしれないけど、複雑さを正確にコントロールできる能力は、動画を効率的にエンコーディングするための貴重なツールになるよ。

SVT-AV1でのスピードフィードバック

スピード適応プリセット切り替えを実装するためには、エンコーディングプロセス中にエンコーディング速度を継続的に評価することが重要なんだ。SVT-AV1では、エンコーディングプロセスの各ステップが同時に行われて、動画データが先入れ先出し方式で処理される。最初のフレームがエンコーディングされると、最後の処理ステップにかかった時間を使ってエンコーディング速度を推定し、次のフレームのプリセット調整に反映させるんだ。

スピード推定の課題

エンコーディング速度を計算するのは、並列処理やフレームのバッファリングのやり方のせいで難しいことがある。1フレームにかかる時間を測る際には、同時に処理されている他のフレームの時間も含まれちゃうから、正確な速度測定は推定に過ぎないんだ。

スピード推定のためのルックアップテーブルの使用

プリセット切り替えを助けるために、様々な動画シーケンスや設定に基づくエンコーディング時間のルックアップテーブルが作成される。このテーブルは、希望するエンコーディング速度と適切なプリセットを合わせるのに役立つんだ。異なるシナリオにおけるエンコーディング時間の平均を取ることで、テーブルは様々なプリセットに対するおおよその速度推定を提供するよ。

意思決定プロセス

各フレームに対して、現在のプリセットがターゲット速度と比較される。もし変更が必要なら、エンコーディングをどれだけ速くしたり遅くしたりする必要があるかを計算する。この計算に基づいて、プリセットが調整されるんだ。この方法により、エンコーダーは大きな遅延なしに速度の要件に迅速に対応できるよ。

新しい複雑さコントロール手法の評価

新しい複雑さコントロール手法は、ターゲット速度に達する効果を測るために複数の動画シーケンスでテストされたんだ。複雑さは、エンコーディング中の処理時間で測定されたよ。各テストで特定のターゲット速度が選ばれて、その速度に達しつつ合理的な圧縮性能を維持することが目指されたんだ。

スピード推定の精度

正確な速度推定を確保することは、複雑さコントロールの成功にとって重要なんだ。推定された速度と実際のパフォーマンスを比較する評価が行われて、動画の複雑さやバッファサイズなどのさまざまな要因が考慮された。結果は、提案された手法が速度推定の面で強力なパフォーマンスを維持し、効果的な複雑さコントロールを可能にすることを示していたよ。

圧縮性能の評価

スピードコントロールの部分を測定するだけじゃなくて、複雑さと圧縮性能のトレードオフも評価するのが大切なんだ。新しいコントロール手法を使う際に必要とされる追加のビットレートが、従来のエンコーディング手法に比べてどれだけかを計算したんだ。その結果、小さな動画解像度では新しい手法が確立された性能基準に非常に近い結果が出たんだよ。

複雑さコントロールの今後の方向性

SVT-AV1における複雑さ管理の提案された手法は、動画エンコーディングの効率に新たな機会を開くんだ。今後の研究では、特に最初のフレームに関する時間推定技術を洗練させて、さらなる精度向上を目指す予定だよ。どのエンコーディングステップが処理時間に最も寄与しているかを特定できれば、研究者たちはより良い予測や調整ができるようになるんだ。

さらに、全体的な効果を向上させるために、もっと高度な速度予測モデルを導入する可能性もあるよね。動画エンコーディングの需要が増え続ける中で、複雑さコントロールを強化する方法を見つけることは、サービスプロバイダーと消費者の両方にとってますます重要になっていくと思う。

結論として、SVT-AV1におけるスピード適応プリセット切り替えの統合は、動画エンコーディング技術における大きな進歩を示してる。高い精度と最小限のパフォーマンスロスで複雑さを効果的に管理することで、この手法はマルチメディア通信の広い領域に利益をもたらすことができるし、最終的にはユーザーやサービスプロバイダーにとってより良い体験につながるんだ。

オリジナルソース

タイトル: Encoder Complexity Control in SVT-AV1 by Speed-Adaptive Preset Switching

概要: Current developments in video encoding technology lead to continuously improving compression performance but at the expense of increasingly higher computational demands. Regarding the online video traffic increases during the last years and the concomitant need for video encoding, encoder complexity control mechanisms are required to restrict the processing time to a sufficient extent in order to find a reasonable trade-off between performance and complexity. We present a complexity control mechanism in SVT-AV1 by using speed-adaptive preset switching to comply with the remaining time budget. This method enables encoding with a user-defined time constraint within the complete preset range with an average precision of 8.9 \% without introducing any additional latencies.

著者: Lena Eichermüller, Gaurang Chaudhari, Ioannis Katsavounidis, Zhijun Lei, Hassene Tmar, André Kaup, Christian Herglotz

最終更新: 2023-07-11 00:00:00

言語: English

ソースURL: https://arxiv.org/abs/2307.05208

ソースPDF: https://arxiv.org/pdf/2307.05208

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。

著者たちからもっと読む

類似の記事