tencent cloud

文档反馈

产品简介

最后更新时间:2024-12-11 18:02:56
    腾讯云语音识别(Automatic Speech Recognition,ASR) 为企业提供极具性价比的语音识别服务。被微信、王者荣耀、腾讯视频等大量内部业务使用,外部落地录音质检、会议实时转写、语音输入法等多个场景。

    产品功能

    实时语音识别

    对实时音频流进行识别,达到“边说边出文字”的效果,可应用于语音输入、电话机器人等实时音频流场景。

    录音文件识别

    对录音文件进行识别,能够针对较长的录音音频进行异步处理,可应用于客服质检、字幕生成等长音频场景。

    产品优势

    海量数据积累

    立足于腾讯庞大的社交数据平台,积累了数十万小时的语音标注数据,拥有丰富多样的语料库,为高识别率奠定数据基础。

    算法业界领先

    基于多种序列神经网络结构(LSTM、Attention Model、DeepCNN),采用 Multitask 训练方法,结合T/S方式,在通用以及垂直领域有业内领先的识别精度。

    支持多平台设备

    提供 REST API 和 SDK,支持智能硬件、移动应用、网站、桌面客户端和物联网等多种设备终端。

    支持语种丰富

    已经支持中文、英文,后续将持续开放其他语种和语言的识别能力。

    噪声环境识别佳

    语音识别模型鲁棒性佳,识别精度高,抗噪声的干扰能力强,能够识别来自嘈杂环境的音频信息,不需要客户进行降噪处理。

    海量内外部业务验证

    经过微信、腾讯视频、王者荣耀等内部业务充分验证,也在大量互联网、金融、教育等领域的外部客户业务场景成功落地,日服务亿级用户,性能稳定。

    应用场景

    语音输入法

    智能语音输入,由实时语音识别实现,为用户节省输入时间、提升输入体验。

    会议纪要

    将会议、庭审、采访等场景的音频信息转换为文字,由实时语音识别服务实现,降低人工记录成本、提升效率。

    呼叫中心

    将坐席通话转成文字,由实时语音识别服务实现,全面覆盖质检内容、提升质检效率。
    联系我们

    联系我们,为您的业务提供专属服务。

    技术支持

    如果你想寻求进一步的帮助,通过工单与我们进行联络。我们提供7x24的工单服务。

    7x24 电话支持