tencent cloud

文档反馈

定制接口

最后更新时间:2024-07-18 17:49:40
    使⽤该接⼝提交定制的请求,通过进度查询接口查询定制的各个阶段以及各阶段的相关信息。

    调用协议

    HTTPS + JSON
    POST /v2/ivh/assetmanager/customservice/make
    Header Content-Type: application/json;charset=utf-8

    请求参数

    参数
    类型
    必须
    说明
    AnchorName
    string
    主播名称:
    1. 该名称主要用于标识该定制形象/声音,可以根据实际情况自定义
    2. 命名参考:如果该主播定制的数量只有1个,可以直接以主播名称命名,例如“张三”;也可加上衣服名称来更好的标识,例如“张三蓝西服”等
    3. 不超过50个字符,不少于2个字符,只允许有汉字、字母、数字、下划线、横线
    4. 不能重名
    MakeType
    string
    定制类别: IMAGE:2D小样本-标准版(专属口型)形象定制
    IMAGE_GENERAL:2D小样本-标准版(通用口型)形象定制
    IMAGE_4K:2D小样本-高精版(专属口型)形象定制
    IMAGE_PHOTO:2D小样本(照片数智人)形象定制
    VOICE:声音复刻(基础版) ZERO_SHOT_VOICE:声音复刻(极速版)
    IdentityCosUrl
    string
    除 IMAGE_PHOTO、ZERO_SHOT_VOICE 定制类型无需填写外,其他定制类型与IdentityCosUrl 二选一或二者都填
    视频格式授权书 URL,要求:
    1. url 地址为通过上传素材到腾讯云 COS上传到指定路径的资源 url 地址后增加 idcard 路径,例如:域名/customer-pipline/{数字}/{uuid}/idcard/a.mp4
    2. 该格式主要适用于“口述版授权书”,也可将“书面版授权书”拍成完整清晰的视频形式提交
    IdentityWrittenCosUrl
    string
    除 IMAGE_PHOTO、ZERO_SHOT_VOICE 定制类型无需填写外,其他定制类型与IdentityCosUrl 二选一或二者都填
    pdf 格式授权书 URL,要求:
    1. url 地址为通过上传素材到腾讯云 COS上传到指定路径的资源url地址后增加 idcard 路径,例如:域名/customer-pipline/{数字}/{uuid}/idcard/b.pdf
    2. 该格式主要适用于“书面版授权书”,以完整清晰的扫描件形式提交
    MaterialCosUrl
    string
    除 ZERO_SHOT_VOICE 定制类型无需填写外,其他定制类型必填
    形象定制素材 url 地址要求:
    1. url 地址为通过上传素材到腾讯云 COS上传到指定路径的资源url地址后增加 video 路径,例如/customer-pipline/{数字}/{uuid}/video/c.mp4
    2. 视频大小,不超过5GB,4K不超过10G
    3. 视频时长:专属口型版本定制时长为2-10分钟;通用口型版本定制时长为1-10分钟;高精版本定制时长为2-10分钟
    4. 视频分辨率:1080P、4K(3840*2160),如定制高精版,则必须为4K
    5. 视频长宽比:16:9 (9:16)
    6. 视频帧率:不低于25fps,不超过60fps
    7. 视频格式:mp4,mov
    
    声音定制素材 url 地址要求: 1. url 地址为通过上传素材到腾讯云 COS上传到指定路径的资源 url 地址后增加 audio 路径,例如/customer-pipline/{数字}/{uuid}/audio/c.zip 2. 压缩包格式:.zip 格式的压缩包,单个 zip 包用于定制1个音色;压缩时不要新建文件夹,直接选中所有 wav 压缩 3. 对于单个 zip 包里的音频注意事项: ①音频数量:每个 zip 包里可以包含1条或多条 wav 格式音频,总量不超过10条 ②音频大小:每个 zip 包里的音频大小总和不超过1G ③音频格式:每条音频需为 wav 格式,其他格式的音频请先转码为 wav 格式后再压缩成 zip 包 ④音频采样率:采样率大于等于24k即可,建议24k、36k ⑤音频命名:名称不要有空格或者特殊字符,后缀名需要为小写“.wav”
    
    照片数智人定制素材 url 地址要求: 1. url地址为通过上传素材到腾讯云 COS上传到指定路径的资源 url 地址后增加 photo 路径,例如/customer-pipline/{数字}/{uuid}/photo/example.png 2. 图片名称:不少于2个字符,只允许有汉字、字母、数字、下划、横线;图片格式:支持jpg、jpeg、png、webp;图片大小:不超过16M;图片宽高比:支持 1:1 9:16 16:9 4:3 3. 人物清晰正面照,脸部居中,表情自然,嘴部闭合
    IsHaveBackground
    bool
    形象定制类型,训练出来的形象是否带原始背景。默认“否”,即不带原始背景,在应用过程中可以按需更换背景
    SexType
    string
    性别:
    MALE:男
    FEMALE:女
    Notes
    string
    定制备注信息,100字以内
    TextDriver
    string
    用于生成驱动demo的文本内容,字符长度在4-1000之间(包括ssml标签,单个中文算一个字符)
    VoiceDriverCosFile
    string
    生成驱动 demo 的音频文件路径,要求:
    1. url 地址为通过上传素材到腾讯云 COS上传到指定路径的资源 url 地址后增加 audio 路径,例如:/customer-pipline/{数字}/{uuid}/audio/example.wav
    2. 音频文件大小不超过10M,格式支持wav、mp3、wma、m4a、aac
    AudioId
    string
    ZERO_SHOT_VOICE 定制类型必填:填写查询音质检测任务进度通过后返回的 AudioId
    

    返回参数

    参数
    类型
    必须
    说明
    TaskId
    string
    制作的任务 ID,携带 TaskId 访问进度查询接口,可获得制作进度和制作结果

    请求示例

    {
    "Header": {},
    "Payload": {
    "AnchorName": "静萱绿裙子坐姿",
    "MakeType": "IMAGE",
    "IdentityCosUrl": "XXXX",
    "MaterialCosUrl": "YYYY",
    "IsRemoveBackground": true
    }
    }

    返回示例

    {
    "Header": {
    "Code": 0,
    "DialogID": "",
    "Message": "",
    "RequestID": "123"
    },
    "Payload": {
    "TaskId": "666"
    }
    }
     
    
    联系我们

    联系我们,为您的业务提供专属服务。

    技术支持

    如果你想寻求进一步的帮助,通过工单与我们进行联络。我们提供7x24的工单服务。

    7x24 电话支持