tencent cloud

文档反馈

功能相关

最后更新时间:2022-08-29 09:34:07

    不同使用场景对应的是语音识别哪种服务?

    • 实时语音识别适用于有实时性要求的场景,例如语音输入法、语音机器人、会议现场记录等场景。

    支持远场和离线的语音识别吗?

    不支持。目前仅实时语音识别支持移动端离线语音识别,如有需要请 提交工单 咨询。

    语音识别支持中英文混合场景和地方方言吗?

    • 普通话引擎支持单词级别的中英文混合识别,且支持带口音的中文普通话语音识别。
    • 实时语音识别支持中文普通话和英文。
    说明:

    若有马来语 越南语 印地语 土耳其和阿拉伯语等更多语种需求,可提交工单

    语音识别支持的输入音频时长是多少?

    • 实时语音音频流中每个数据包的音频分片为200ms。

    语音识别支持什么样的音频属性?

    语音识别服务的对于音频属性的详细规定请参见 语音识别服务详细信息页

    实时语音识别中,如果一段音频包含多句话该如何提高准确率?

    建议开启 VAD 功能,VAD(Voice Activity Detection)是指对音频进行分段的技术,如果一段音频中包含了多句话,VAD 可以检测多句话之间的停顿进行自动断句,从而达到更高的识别准确度。

    语音识别是否支持同步的结果调用形式?

    • 实时语音识别支持同步返回识别结果。

    语音识别是否支持评测?

    不支持。

    语音识别识别出来的文字能否复制?

    语音识别识别出来的文字无法复制,复制功能需要接入之后自己前端开发实现。

    实时语音识别能否设置识别的最长时间?

    不能设置识别最长时间。如果不需要,直接断开即可。

    语音识别是否支持 MRCP 协议?

    MRCP 暂未对外开放,如有需要,可提交工单

    有没有 SaaS 化的可以直接提供给客户用?

    语音识别支持私有化部署,需要商务对接跟进,可提交工单

    联系我们

    联系我们,为您的业务提供专属服务。

    技术支持

    如果你想寻求进一步的帮助,通过工单与我们进行联络。我们提供7x24的工单服务。

    7x24 电话支持