参数 | 类型 | 必须 | 说明 |
VirtualmanKey | string | 是 | 定义播报的角色、服装、姿态、分辨率等信息,参数为枚举值。 说明: |
InputSsml | string | 是 | 播报的文本内容,支持ssml标签,支持的标签类型参照 数智人 SSML 标记语言规范,标签写法参照示例,内容不能换行,符号需转义。上限2万字(字数按 unicode 字符数计算)。DriverType为空、或 Text 时,该字段必填 |
SpeechParam | object | 是 | 定义音频的详细参数 |
SpeechParam.Speed | float | 是 | 语速(1.0为正常语速,范围[0.5-1.5],值为0.5时播报语速最慢,值为1.5时播报语速最快,DriverType为音频驱动类型时,语速控制不生效) |
SpeechParam.TimbreKey | string | 否 | 音色key,默认使用形象自有音色 |
SpeechParam.Volume | int | 否 | 音量大小,范围[0,10],对应音量大小。默认为0,代表正常音量,值越大音量越高。 |
SpeechParam.EmotionCategory | string | 否 | |
SpeechParam.EmotionIntensity | int | 否 | 控制合成音频情感程度,取值范围为 [50,200],只有 EmotionCategory 不为空时生效。 |
VideoParam | object | 否 | 定义合成视频的详细参数, |
VideoParam.Format | string | 否 | 视频输出格式,默认 TransparentWebm TransparentWebm:透明背景 webm 格式视频 GreenScreenMp4:绿幕 mp4 格式视频 |
CallbackUrl | string | 否 | 1、限制CallbackUrl长度小于1000 2、只发送一次请求,无论是哪种问题导致的请求失败,都不会再进行发送。 |
DriverType | string | 否 | 驱动类型,默认Text 1. Text:文本驱动,要求InputSsml字段必填 2. OriginalVoice:原声音频驱动,要求InputAudioUrl字段必填 3. ModulatedVoice:变声音频驱动,可通过Speech.TimbreKey指定音色,未填写时使用主播默认音色 |
InputAudioUrl | string | 否 | 驱动数智人的音频url,当DriverType为OriginalVoice、ModulatedVoice时,该字段必填。 音频格式要求: 1. 小样本形象时长不超过60分钟,不少于0.5秒;非小样本形象时长不超过10分钟,不少于0.5秒 2. 支持格式:wav、mp3、wma、m4a、aac |
VideoStorageS3Url | string | 否 | 可传入含鉴权 s3 协议存储 url,视频成品会上传至该 url |
SubtitleStorageS3Url | string | 否 | 可传入含鉴权 s3 协议存储 url,字幕成品会上传至该 url |
ConcurrencyType | string | 否 | 视频制作任务使用的并发类型,默认采用优先使用独享,其次使用共享的策略 1. Exclusive:独享并发,若无独享并发,任务提交失败 2. Shared: 共享并发 |
参数 | 类型 | 必须 | 说明 |
TaskId | string | 是 |
{"Header": {},"Payload": {"VirtualmanKey": "123","InputSsml": "你好,我是虚拟<phoneme alphabet=\\"py\\" ph=\\"fu4\\">主</phoneme>播","SpeechParam": {"Speed": 1.0},"VideoParam": {"Format": "GreenScreenMp4"}}}
{"Header": {"Code": 0,"DialogID": "","Message": "","RequestID": "123",},"Payload": {"TaskId": "123"}}
本页内容是否解决了您的问题?