インテリジェント字幕は、ユーザーのメディアファイル内の音声について自動的に字幕ファイルを生成できる機能です。eラーニングカリキュラムのレコーディング再生、オーディオビデオミーティングの議事録の整理、音声品質検査などに用いることができます。VODインテリジェント字幕は最先端の音声認識アルゴリズムをベースに、大量のトレーニングデータを組み合わせることで、業界トップレベルの音声認識機能を備えています。音声に環境ノイズ、背景音などの様々な干渉が含まれる条件下でも、高い認識適合率を実現できます。
シーン | 説明 |
---|---|
オンライン授業 | eラーニングカリキュラムのレコーディング時に字幕を自動生成し、学習に役立てます。 |
ソーシャルプラットフォーム | 一般ユーザーがVlogに字幕を追加して共有することなどが可能です。 |
映画・ドラマ | オーディオビデオの中には制作時期が古いなどの理由で字幕がなく、配信に向かないものがあります。インテリジェント字幕によって字幕を自動生成することで、すべて手作業で字幕を制作する場合に比べて大幅に効率をアップすることができます。 |
オーディオビデオミーティング | 重要なミーティングはレコーディングして保存し、字幕を自動生成すると、議事録の整理に便利です。また、字幕を追加すると視聴に便利なうえに、字幕によって早送り再生や倍速再生が可能になり、効率がアップします。 |
音声品質検査 | 電話の場面で、録音ファイルを文字に起こして字幕を生成します。カスタマーサービスの内容を速やかに把握して評価し、音声品質検査を効率よく行うことができます。 |
インテリジェント字幕はオーディオビデオコンテンツ認識の中の音声全文認識機能によって実装できます。具体的な使用手順は次のとおりです。
AsrFullTextConfigure
)のスイッチをオンにして字幕生成を指定します。{
"AsrFullTextConfigure": {
"Switch": "ON",
"SubtitleFormats": ["vtt", "srt"]
}
}
レスポンスによってテンプレートIDを取得します。
2. インテリジェント字幕タスクを開始し、ステップ1. のテンプレートIDを使用します。具体的にはタスクの開始をご参照ください。
3. インテリジェント字幕タスクの結果を取得します。具体的には結果の取得をご参照ください。
この記事はお役に立ちましたか?