A highly cost-effective speech recognition service with a high recognition accuracy and wide applicability

Automatic Speech Recognition

NewBanner

https://www.tencentcloud.com/document/product/1118

Overview

ProductIntroduction

Low Prices

More Languages Supported

Good Effect

Powerful Algorithms

Self-Service Accuracy Improvement

Wide Scenario Support

Features

IconText

Call quality inspection at call centers is traditionally conducted through random spot checks due to labor efficiency and costs, making it difficult to assess the performance of customer service reps. ASR can recognize call recordings, convert them to text, and then analyze the text in real time to identify non-compliant calls. This greatly enhances the performance management of call centers, completes large-scale call recording quality inspection that cannot be accomplished by human, and eventually improves the service quality of call center staff.

Call Quality Inspection 

In UGSV scenarios, users talk while shooting videos and generally need to edit the videos and manually add subtitles before posting them. The real-time speech recognition feature of ASR can directly generate subtitles when users are talking, which significantly reduces the post-processing costs and enables users to post videos immediately after creating them.

Short Video Subtitling

Live streaming and audio sharing platforms have high numbers of audios/videos that need to be understood for quality inspection, tagging, and recommendation purposes, which is difficult to be achieved by human. The real-time speech recognition feature of ASR can transcribe audios and audio streams in videos based on the audio/video transcription model. It well satisfies the different latency requirements of different input sources and helps platform staff quickly understand high numbers of audios/videos, which remarkably reduces the labor costs and quickly implement quality inspection, tagging, and recommendation.

Video Understanding

Scenarios

Architecture

After the number of calls to the real-time speech recognition and reaches a certain tier, all calls will be billed at the unit price in the tier. The higher the tier, the lower the unit price. The bill for calls made on a day will be generated and settled on the next day. For pricing details, see <a href="https://www.tencentcloud.com/document/product/1118/43352" target="">Billing Overview</a>.

Pricing

TextUrl

業界にコストパフォーマンスが非常に優れた音声認識サービスを提供し、非常に高い認識精度を様々なシーンに使用します

概要

価格が低い

言語が多い

効果が良好

アルゴリズムが強力

精度のセルフ向上

豊富なシーンをサポート

特徴

従来の音声電話品質検査は人の業務効率と人件費の制限を大きく受けており、ランダム検査のみで全件検査はできず、カスタマーサービスの実際の業務品質を評価することが困難でした。音声認識では電話音声を認識してテキストにしてからそのままリアルタイムなテキスト分析を行い、規範に合わないサービス通話記録を識別します。そのため、コールセンターの業務品質管理能力が大幅に向上し、人力では達成できない超大規模な電話録音品質検査業務が可能になり、コールセンタースタッフのサービス品質が向上します。

コールセンター 

Vlogの撮影シーンにおいて、ユーザーはビデオ撮影しながら話し、撮影完了後に編集で字幕を手動入力してからビデオを公開しています。リアルタイム音声認識により、ユーザーが撮影しながら話した音声内容のビデオへの直接表示を実現しました。ユーザーの続きの作業コストを大幅に削減し、撮影後の即時公開が可能になります。

ショートビデオの字幕

ライブストリーミング、オーディオシェアなどのプラットフォームにおいて、品質検査チェックまたはタグのおすすめを行うのに用いる大量のオーディオビデオを理解する必要があり、人力での実現は非常に困難です。リアルタイム音声認識はビデオ内のオーディオ（ストリーム）をオーディオビデオ専用モデルによって転写でき、様々な入力、それぞれのディレイのニーズを満たすことができます。プラットフォームの大量のオーディオビデオの迅速な理解をサポートして人力コストを大幅に削減し、品質検査チェックまたは正確なおすすめを迅速に実現します。

ビデオの理解

ユースケース

リアルタイム音声認識のコール合計量があるフェーズになると、すべてのコール量は該当フェーズの単価に応じて課金されます。フェーズが高いほど単価は低く、前日の使用量に対して毎日請求書を出力して引き落とします。更なる定価の説明については、<a href="https://www.tencentcloud.com/document/product/1118/43352" target="">課金概要</a>をご参照ください。

料金

높은 인식 정확도, 폭넓은 활용성, 높은 가성비를 갖춘 음성 인식 서비스

개요

낮은 가격

다양한 언어 지원

뛰어난 효과

강력한 알고리즘

셀프 서비스 정확도 향상

다양한 시나리오 지원

특징

기존의 콜 센터 서비스 품질 검사는 노동력과 비용 문제로 인해 무작위 현장 점검으로 진행되어 고객 서비스 담당자의 성과를 평가하기 어려웠습니다. ASR은 통화 음성을 텍스트로 변환한 다음 텍스트를 실시간 분석하여 규정에 어긋난 통화를 식별할 수 있습니다. 이는 콜 센터의 품질 관리를 대폭 강화하고, 인력으로 수행할 수 없는 대량의 통화 품질 검사를 완료하여 콜 센터 직원의 서비스 품질을 궁극적으로 향상시킵니다.

콜 센터 

Vlog 촬영 시나리오에서 사용자는 일반적으로 동영상을 촬영하는 동시에 대화하기 때문에, 2차 편집을 거쳐 자막을 수동 추가해야 합니다. ASR의 실시간 음성 인식 기능은 사용자가 말하는 동시에 바로 자막을 생성하여, 후처리 비용을 크게 절감하고 동영상 촬영 완료 즉시 게시할 수 있도록 합니다.

쇼트 비디오 자막

라이브 스트리밍 및 오디오 공유 플랫폼에는 품질 검사, 태깅 및 추천을 위해 이해를 필요로 하는 수많은 오디오/비디오가 있으며, 이는 인력으로 구현하기 어렵습니다. ASR의 실시간 음성 인식 기능은 오디오/비디오 문자 변환 모델을 기반으로 비디오의 오디오(스트림)을 문자로 변환할 수 있습니다. 다양한 입력 소스의 다양한 딜레이 요구 사항을 충족하고, 대량의 오디오/비디오를 빠르게 이해할 수 있도록 하여, 인건비를 크게 줄이고 품질 검사, 정확한 태깅 및 추천을 신속하게 구현합니다.

비디오 이해

시나리오

실시간 음성 인식 및 서비스 총 호출 횟수가 일정 구간에 도달하면, 해당 구간의 단가를 기준으로 청구됩니다. 높은 구간에 속할수록 단가가 낮아집니다. 당일 사용량에 대한 청구서는 익일에 생성되어 정산됩니다. 자세한 가격 정보는 <a href="https://www.tencentcloud.com/document/product/1118/43352" target="">과금 개요를</a> 참고하세요.

가격

提供业界非常具有性价比的语音识别服务，超高识别准确率，适用多场景

语音识别

简介

价格低

语种多

效果好

算法强大

自助提升准确率

支持场景丰富

特性

传统语音电话质检严重受限于人的工作效率和人力成本，只能抽检不能全检，难以评估客服的真实工作质量。语音识别将电话语音识别为文本，再实时对文本进行分析，识别不符合规范的服务通话记录。大幅提升呼叫中心工作质量管控能力，完成人力不可能完成的超大规模电话质检工作，提升呼叫中心人员的服务质量。

呼叫中心

在拍摄 Vlog 的场景中，用户会边拍视频边说话；拍完视频还需要二次编辑，手动输入字幕才能将视频发布。通过实时语音识别，实现了用户边拍边说，将语音内容直接显示在视频上。大大减少了用户后期处理的成本，让用户拍摄后即可发布。

短视频字幕

在直播、音频分享等平台，有海量音视频需要理解，用来做质检审核或者标签推荐，基于人力很难实现。实时语音识别可将视频中的音频（流）通过音视频专属模型进行转写，可满足多种输入、不同时延的需求。助力快速对平台海量音视频进行理解，极大降低人力成本，快速实现质检审核或精准推荐。

视频理解

应用场景

使用实时语音识别产品调用总量达到某个阶梯后，所有调用量按该阶梯的单价进行计费，阶梯越高，单价越低。每日会对上一日用量输出账单并扣费。更多定价描述详见<a href="https://www.tencentcloud.com/document/product/1118/43352" target="">计费概述</a>。

定价

Tencent Cloud Automatic Speech Recognition (ASR) provides highly cost-effective speech recognition services. It has been widely used by many Tencent businesses such as WeChat, Honor of Kings, and Tencent Video and has implemented multiple use cases, including recording quality inspection, real-time meeting transcription, and voice input method.

Automatic Speech Recognition | Tencent Cloud

Tencent Cloud Automatic Speech Recognition（ASR）は、企業にコストパフォーマンスが非常に優れた音声認識サービスです。WeChat、王者栄耀、Tencent Videoなどの大量の内部ビジネスに使用しており、外部では録音の品質検査、会議でのリアルタイム転写、音声インプットメソッドなど様々なシーンで使用されています。

Automatic Speech Recognition(ASR)은 가성비 높은 음성 인식 서비스를 제공합니다. WeChat, Honor of Kings, Tencent Video 등 많은 Tencent 서비스에서 널리 사용되어 왔으며, 녹음 품질 검사, 실시간 회의 문자 변환, 음성 입력기 등 다양한 사용 사례를 구현했습니다.

腾讯云语音识别（Automatic Speech Recognition） 为企业提供极具性价比的语音识别服务。被微信、王者荣耀、腾讯视频等大量内部业务使用，外部落地录音质检、会议实时转写、语音输入法等多个场景。

tencent cloud

简介

简介

特性

应用场景

定价