tencent cloud

フィードバック

製品の機能

最終更新日:2022-10-24 16:16:06

    Media Processing Serviceはオーディオビデオファイルを様々なビットレートと解像度のフォーマットに変換し、様々なネットワーク帯域幅と端末デバイスのユーザーのニーズを満たします。以下の機能をサポートしています。

    オーディオビデオトランスコーディング

    トランスコードは、元のオーディオビデオストリームを別のオーディオビデオストリームに変換するオフラインタスクです。トランスコードによって、コーデック、解像度、ビットレートなどの元のビットストリームのパラメータを変更して、様々なデバイスやネットワーク環境での再生に適合させます。トランスコードによって以下の機能を実現できます。

    実現可能な機能 説明
    多様な端末に適応 元のビデオを端末適応性の高い形式(例:MP4)にトランスコードして、ビデオリソースをより多くのデバイスで再生できるようにします
    さまざまな帯域幅に適応 ビデオをLD、SD、HD、FHDなどに変換して出力します。ユーザーは、現在のネットワーク環境に応じて、ビデオ再生に適したビットレートを選択できます
    再生効率を改善 トランスコードにより、MP4の末尾にあるソース情報MOOVをあらかじめ先頭にもってくることができるので、プレーヤーはビデオ全体をダウンロードせずに、すぐに再生することができます
    帯域幅の削減 より高度なコーデック(例:H.265)を使用してトランスコードすることで、元の画質を失うことなく、ビットレートを大幅に削減し、再生帯域幅を削減できます

    トランスコードの目標仕様には、コーデック、解像度、ビットレートなどのパラメータが含まれます。以下のトランスコード関連パラメータがカスタマイズ可能です。

    パラメータ タイプ 詳細説明
    入力形式 コンテナ形式 3GP,AVI,FLV,MP4,M3U8,MPG,ASF,WMV,MKV,MOV,TS,WebM,MXF
    ビデオコーデック形式 AV1,AVS2,H.264/AVC,H.263, H.263+,H.265,MPEG-1,MPEG-2,MPEG-4,MJPEG,VP8,VP9,RealVideo,Windows Media Video,Quicktime
    オーディオコーデック形式 AAC,ADPCM,AMR,DSD,MP1,MP2,MP3,PCM,RealAudio,Windows Media Audio,VORBIS,AC-3
    出力形式 コンテナ形式 ビデオ:FLV、MP4、HLS(m3u8+ts)、MXF
    オーディオ:MP3、MP4、OGG、FLAC、m4a
    画像:GIF、WEBP
    ビデオコーデック形式 H.264/AVC, H.265/HEVC,AV1
    オーディオコーデック形式 MP3,AAC,FLAC,MP2,VORBIS
    コンテナ ビデオストリームの削除 「ビデオストリームの削除」を有効にすると、トランスコードしたビデオにはビデオストリームが含まれません(オーディオストリームのみ残ります)
    オーディオストリームの削除 「オーディオストリームの削除」を有効にすると、トランスコードしたビデオにはオーディオストリームが含まれません(ビデオストリームのみ残ります)

    オーディオビデオエンハンスメント

    画質修正および画質エンハンスメントという2つのモジュールにAIアルゴリズムを組み合わせることで、解像度を向上させると同時に、ビデオノイズ除去、輪郭修正、超解像度再構成などの機能をご提供できます。UGC/PGCビデオ品質向上、古い映像の修復、4K制作などの業務シーンに適しています。

    機能 説明
    ビデオノイズ除去 映像の撮影中にカメラと環境に由来するランダムノイズが発生する場合があります。ここでご提供するノイズ除去サービスは、ディテールが失われないよう維持しながら画面内のランダムノイズを除去するものです。
    アーティファクト(グリッチ)除去 映像のトランスコード中または複数回のトランスコードを行う過程でビデオの圧縮を複数回行うことで、ブロックノイズ、リンギング効果、色にじみ、モスキートノイズなどが発生し、視覚効果に影響するひずみがビデオ画面にあらわれます。圧縮アーティファクト除去によって、エンコードに起因するひずみを効果的に修復できます。
    スクラッチ除去 映像の撮影、保存および別のメディアへの再保存の過程で、何らかの要因でフィルムに傷や白点などの破損が生じることがあります。スクラッチ除去はビデオの中の傷や白点などの破損した内容を修復することができる機能です。
    ディテールエンハンスメント カメラの品質、その後の保存およびトランスコードの過程でビデオのディテールが不鮮明になることがあります。ディテールエンハンスメントはビデオの中で際立たせたいディテールを強調し、画面の内容をより鮮明に、より豊富にします。
    総合エンハンスメント AIの総合分析機能により、画面のテクスチャ内容を自動的にバランシングし、圧縮アーティファクトおよびグリッチを除去すると同時に重要なディテールを強調し、それにより画面全体の主観的な感じ方を向上させます。
    超解像度 解像度が低く、最近の高解像度の要件に適さない映像に対し、超解像度機能によってディテールの強調と修復を行います。AIモデルを利用して高解像度出力を実現すると同時に、ディテールをより鮮明にします。
    フェイスエンハンスメント 顔検出により、ビデオの中で視覚的に特に注目される顔の部分を強調し、そのエリアのディテールをより鮮明にすることで、主観的な感じ方を向上させます。
    カラーエンハンスメント 撮影機材の色の問題または映像の保存の問題で、映像の色彩がある程度実際と異なることや、強調が必要となることがあります。カラーエンハンスメントは画面をよりリアルな色彩に近づけるとともに、目に心地よく感じられるように一定程度の強調を行います。
    低照度エンハンスメント 環境および撮影カメラのハード面の問題により、シーンによっては撮影画面の明るさとコントラストが失われ、画面全体が暗くなったり、画面の暗い部分のディテールが見えなくなったりすることがあります。このため、低照度エンハンスメントではシーンを自動認識して画面に対し適応型のエンハンスメントを行うことで、特に暗所のシーンで暗い部分のディテールおよびコントラストを大幅に引き上げ、肉眼での主観的品質を向上させることができます。
    HDR SDRのHDRへの変換機能によって通常のSDRビデオをHDRビデオに変換し、色深度を10bitに向上させることで、より広い色域を実現します。より多くのカラーディテールを表現できるため、より高品質のビデオコンテンツを提供できます。
    フレーム補間 オリジナルビデオのフレームの間に新しいビデオフレームを追加することで、よりスムーズで滑らかな視覚効果が得られます。また、低フレームレートの古いビデオにみられるラグ、ジッターなどの画質の問題の解決にも役立ちます。

    ウォーターマーク

    ウォーターマークの追加は、ビデオのトランスコーディングまたはスクリーンキャプチャ時に、特定の画像を画面の指定位置に追加するプロセスであり、オフラインタスクです。MPSでは以下のタイプのウォーターマークをサポートしています。

    • 静的画像ウォーターマーク:PNG形式の画像ウォーターマーク。版権元のLOGO、放送局ロゴなど、通常、ビデオの版権の帰属の表示に利用されます。
    • 動的画像ウォーターマーク:APNG形式の動的画像ウォーターマーク。ウォーターマーク画像のダイナミックな変化による效果を実現できます。

    MPSではビデオまたはスクリーンキャプチャに対する複数のウォーターマークの追加をサポートし、各ウォーターマークの画面の中でのサイズと位置を指定できます。
    ウォーターマークの目標仕様には、ウォーターマークのタイプ、幅と高さ、位置などのパラメータが含まれます。以下のウォーターマーク関連パラメータがカスタマイズ可能です。

    パラメータ 説明
    ウォーターマークのタイプ(Type) 静的画像ウォーターマークと動的画像ウォーターマークをサポート
    ウォーターマーク位置(Position) ウォーターマークのビデオ画面上の対応する位置
    画像サイズ(ImageSize) 画像ウォーターマークがビデオ画面に占める大きさ
    画像コンテンツ(ImageContent) 画像ウォーターマークの中の画像のバイナリーコンテンツ

    ビデオスクリーンキャプチャ

    スクリーンキャプチャはビデオの特定の位置の映像を切り取り、画像を生成するプロセスであり、オフラインタスクです。MPSでは次のタイプのスクリーンキャプチャを提供しています。

    • 指定タイムポイントのスクリーンキャプチャ:1組のタイムポイントを指定し、これらのタイムポイントのビデオの画像を切り取ります。
    • サンプリングスクリーンキャプチャ:同じ時間間隔でビデオから複数枚の画像を切り取ります。
    • スプライトイメージ:同じ時間間隔でビデオから複数枚の小さな画像を切り取り、組み合わせてやや大きめの画像( スプライトイメージ)を作成します。

    スクリーンキャプチャの目標仕様には、スクリーンキャプチャのファイルフォーマット、スクリーンキャプチャの幅と高さなどのパラメータが含まれます。以下のスクリーンキャプチャ関連パラメータがカスタマイズ可能です。

    タイムポイントスクリーンキャプチャ

    パラメータ 説明
    形式(Format) スクリーンキャプチャのファイル出力形式。現在はJPGのみをサポートしています
    幅(Width) スクリーンキャプチャの幅。範囲は128px~4096px
    高さ(Height) スクリーンキャプチャの高さ。範囲は128px~4096px
    塗りつぶしタイプ(FillType) スクリーンキャプチャの幅と高さの比率とオリジナルビデオの幅と高さの比率が異なるときに、スクリーンキャプチャの処理方式が、「塗りつぶし」になります。一般的な塗りつぶしタイプには次のようなものがあります。
  • 引き伸ばし:画像を引き伸ばして、フレーム全体に広げます。画像は「圧縮されたり」、「長く延びたり」します
  • 黒で補填:画像の幅と高さの比率は変えず、縁の余った部分は黒で補填します
  • 白で補填:画像の幅と高さの比率は変えず、縁の余った部分は白で補填します
  • ガウシアンぼかし:画像の幅と高さの比率は変えず、縁の余った部分はガウシアンぼかしを入れて画面を埋めます
  • サンプリングスクリーンキャプチャ

    パラメータ 説明
    形式(Format) スクリーンキャプチャのファイル出力形式。現在はJPGのみをサポートしています
    幅(Width) スクリーンキャプチャの幅。範囲は128px~4096px
    高さ(Height) スクリーンキャプチャの高さ。範囲は128px~4096px
    サンプリング方式(SampleType) サンプリング方式は2種類に分かれます。
  • パーセンテージによるサンプリング:例えば、5%の間隔でサンプリングした場合、生成されるスクリーンキャプチャの枚数は20枚になります
  • 時間間隔によるサンプリング:例えば、10sの間隔でサンプリングした場合、スクリーンキャプチャの枚数はビデオの長さによって決まります
  • サンプリング間隔(Interval) サンプリング間隔の長さ:
  • パーセンテージによるサンプリングの場合、間隔はパーセンテージになります
  • 時間間隔によるサンプリングの場合、間隔は秒になります
  • 塗りつぶしタイプ(FillType) スクリーンキャプチャの幅と高さの比率とオリジナルビデオの幅と高さの比率が異なるときに、スクリーンキャプチャの処理方式が、「塗りつぶし」になります。一般的な塗りつぶしタイプには次のようなものがあります。
  • 引き伸ばし:画像を引き伸ばして、フレーム全体に広げます。画像は「圧縮されたり」、「長く延びたり」します
  • 黒で補填:画像の幅と高さの比率は変えず、縁の余った部分は黒で補填します
  • 白で補填:画像の幅と高さの比率は変えず、縁の余った部分は白で補填します
  • ガウシアンぼかし:画像の幅と高さの比率は変えず、縁の余った部分はガウシアンぼかしを入れて画面を埋めます
  • スプライトイメージ

    パラメータ 説明
    形式(Format) スプライトイメージのファイル出力形式。現在はJPGのみをサポートしています
    小さい画像の幅(Width) スプライトイメージの中の小さい画像の幅
    小さい画像の高さ(Height) スプライトイメージの中の小さい画像の高さ
    小さい画像の行数(Rows) 1枚の大きな画像の中にある小さい画像の行数
    小さい画像の列数(Columns) 1枚の大きな画像の中にある小さい画像の列数
    サンプリング方式(SampleType) 小さい画像のサンプリング方式。現在は時間間隔によるサンプリングのみをサポートしています
    サンプリング間隔(Interval) どの位の間隔で1枚の小さい画像をサンプリングするかのサンプリング間隔
    注意:

    • Width × Columnsは128px~4096pxの間にする必要があります(大きい図の幅が128px~4096pxの間)。
    • Height × Rowsは128px~4096pxの間にする必要があります(大きい図の高さが128px~4096pxの間)。

    ビデオアニメーション画像生成

    アニメーション画像生成とは、ビデオフィルムを切り取り、動画(GIF、WEBPなど)を生成するプロセスを指し、オフラインタスクとなります。動画は1組の連続したフレームをシームレスに循環させ、これにより小さい容量でアニメーション効果を実現します。
    アニメーション画像生成の目標仕様には、動画のフォーマット、幅と高さ、フレームレートなどのパラメータが含まれます。以下の動画関連パラメータがカスタマイズ可能です。

    パラメータ 説明
    形式(Format) 動画ファイルの出力形式。現在はGIFとWEBPのみをサポートしています
    幅(Width) 動画の幅。範囲は128px~4096px
    高さ(Height) 動画の高さ。範囲は128px~4096px
    フレームレート(FPS) サポートするフレームレート範囲:1fps~60fps

    コンテンツ理解

    コンテンツ認識

    コンテンツ認識はTencentラボの最新の研究成果に基づいてご提供する、ビデオコンテンツの全方位的認識であり、ビデオ内の人物、音声、文字、フレームタグを認識して、ビデオに対し多次元構造化分析を行うことができます。

    認識タイプ 機能説明
    顔認識 ディープラーニングソリューションをベースにしており、お客様がビデオ内の顔情報を速やかに認識して、ビデオ内の人物のいるフレーム画面ならびに顔のあるエリアを速やかに特定する上で役立ちます。お客様は人物データベースをカスタマイズするか、またはビデオAIパブリック人物データベースを呼び出して顔認識を行うことができます。
    音声認識 ディープラーニングソリューションをベースにしており、お客様はビデオ内の音声を速やかに認識して文字に変換することができます。お客様がキーワードをカスタマイズし、キーワードが存在するビデオの時間位置を特定することをサポートします。
    文字認識 お客様がビデオ内の文字情報を認識する上で役立ちます。ビデオ内のカスタムキーワードの抽出に用いることができ、縦書き文字の認識もサポートします。
    フレームタグ認識 ディープラーニングソリューションをベースにしており、お客様がカスタマイズしたビデオのフレームキャプチャインターバルに基づき、フレームキャプチャ画面内のタグを自動認識し、タグの存在するビデオの位置を特定することができます。フレームタグは人物、風景、人工物、建物、動植物、食べ物などの9つの分類をカバーし、日常生活のそれぞれの情報面が含まれるほか、タグシステムをベースにしたカスタムタグを使用することもできます。転移学習機能を備え、オリジナルユーザーデータを提供するだけでカテゴライザーをカスタマイズでき、様々なタイプのユーザーニーズを満たすとともに、タグのカテゴリーをより柔軟なものにすることができます。
    先頭末尾認識 ビデオ画面の特徴、文字、音声などの情報の自動認識に基づき、映画/ドラマの先頭と末尾の時点を特定します。

    コンテンツ分析

    分析タイプ 機能説明
    カテゴリー認識 ビデオコンテンツの分析によって、ビデオに推奨カテゴリーを提示します。現在はグルメ、旅行、アニメ・漫画、ミュージックなどの19カテゴリーをサポートしています(有料でのオーダーメイドにも対応します)。
    ビデオタグ認識 Tencentのディープラーニングソリューションをベースに、ビデオコンテンツに最も合った上位5項目のタグ概要をインテリジェント認識し、ビデオのおすすめ、検索などのシーンに用いることができます。ユーザーはインターフェース上で、返されるタグの個数をご自身で選択することができます。
    インテリジェントカバー ビデオ画面のテクスチャ、シーン認識などの特徴的な情報を組み合わせてファイルカバーを自動生成します。静的カバー出力をサポートし、ビデオカバー体験とクリックコンバージョン率を向上させます。

    インテリジェント審査

    インテリジェント審査には大きく分けてセキュリティ審査と品質審査があります。
    セキュリティ審査はAIのサポートにより、ビデオコンテンツ(画面、音声、文字の3つの面)に対し、ポルノ、違法・不正検出を行います。
    品質審査はライブストリーミング、オンデマンドビデオの画面フレームおよび音声品質の検査をサポートします。画面のちらつき、黒枠、モザイク、ノイズなどの全方位的な13項目の検査タイプのほか、キャスターのビデオ全体品質の検査とスコア評価も行うことができます。

    審査タイプ 検査タイプ 検査項目の説明
    セキュリティ審査 ビデオ画面審査 ビデオ画面のポルノ、不正検出を行います。具体的な検査項目は次のとおりです。
    • ポルノ検出
      • porn:ポルノ
      • vulgar:低俗
      • intimacy:親密な行為
      • sexy:セクシー
    • 違法・不正検出
      • guns:武器・銃
      • bloody:血生臭い画面
      • explosion:爆発
      • violation_photo:違法な画像
    音声審査 音声の中の文字に対して検査を行います。具体的な検査項目は次のとおりです。
    • ポルノ検出:音声の中の文字に対してポルノ関係の検査を行い、疑わしいキーワードを認識します
    • 違法・不正検出:音声の中の文字に対して違法・不正の検査を行い、疑わしいキーワードを認識します
    文字審査 画面の中の文字に対して検査を行います。具体的な検査項目は次のとおりです。
    • ポルノ検出:画面の中の文字に対してポルノ関係の検査を行い、疑わしいキーワードを認識します
    • 違法・不正検出:画面の中の文字に対して違法・不正の検査を行い、疑わしいキーワードを認識します
    品質審査 画面品質 ビデオの画面品質に対する検査をサポートします。具体的な検査項目は次のとおりです。
  • JitterResults:画面ジッター
  • JitterResults:画面のぼやけ
  • AbnormalLightingResults:低照度、白飛び
  • CrashScreenResults:画面のちらつき
  • BlackWhiteEdgeResults:画面の黒枠、白枠、ブラックスクリーン、ホワイトスクリーン、画面が一定時間一色になる
  • NoiseResults:画面のノイズ
  • MosaicResults:画面のモザイク
  • QRCodeResults:画面に2次元コードが表示される
  • 音声品質 ビデオの音声品質に対する検査をサポートします。具体的な検査項目は次のとおりです。
  • VoiceResults:ミュート、低音、音割れなどの音声異常
  • インテリジェント編集

    インテリジェント編集はAIおよびTencentの長年のオーディオビデオ技術をベースにしたもので、多次元かつ全方位的なビデオコンテンツ理解、インテリジェントコレクションおよびインテリジェントセグメンテーション機能をサポートし、ビデオコンテンツの制作を支援します。

    機能タイプ 機能説明
    セグメンテーション ビデオコンテンツに対する構造化分析を行い、ビデオのシーン情報、音声情報および文字情報に基づいて、ビデオのインテリジェントセグメンテーションを生成します。ニューストピックセグメンテーション、広告セグメンテーションをサポートしています。
    インテリジェントコレクション ビデオの時間領域/空間領域特徴マッチング、シーン認識、ターゲット検出などの技術をベースに、ビデオのハイライトを自動生成します。サッカー、バスケットボール、PUBG: BATTLEGROUNDS、王者栄耀などのビデオシーンをサポートしています(有料でのオーダーメイドにも対応します)。
    トリミング制作 ビデオのトリミング、スプライシング、画像のビデオへの変換、ロール画像、ロール文字、ピクチャーインピクチャー、オーディオ編集などの操作をサポートします
    お問い合わせ

    カスタマーサービスをご提供できるため、ぜひお気軽にお問い合わせくださいませ。

    テクニカルサポート

    さらにサポートが必要な場合は、サポートチケットを送信して弊社サポートチームにお問い合わせください。24時間365日のサポートをご提供します。

    電話サポート(24 時間365日対応)