参见 应用程序编程接口
语音识别技术(ASR),也被称为自动语音识别(Automatic Speech Recognition),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。与“说话人识别”及“说话人确认”不同,后者尝试识别/确认的对象是发出语音的人而非语音中所包含的词汇、句子等内容。
采样位数即将采样样本振幅量化。并支持待识别音频的采样位数为16Bit。
QPS/并发指每秒请求的并发数,1QPS 即每秒同时支持请求接口1次,50QPS 即每秒同时支持请求接口50次。
SDK(Software Development Kit)是软件工程师为特定的软件包、软件框架、硬件平台、操作系统等建立应用软件时的开发工具的集合。
通道数指声音的通道数目,常有单声道和立体声(双声道)。我们的一句话语音识别服务和实时语音识别服务暂时只支持单声道音频识别,录音文件识别既支持单声道音频,也支持立体声音频识别。
应用程序编程接口(Application Programming Interface,API)指软件系统提供给应用程序调用的代码。
开发人员可以通过调用一组功能接口,而无需考虑底层源代码或理解内部工作机制。
API 包含 Windows API 和 Linux API,腾讯云 OCR 提供的 API 一般指 Linux API。
本页内容是否解决了您的问题?