可实现功能 | 说明 |
适配更多终端 | 将原始视频转码成拥有更强的终端适配能力的格式(如 MP4),使视频资源能够在更多设备上播放。 |
适配不同带宽 | 将视频转换成流畅、标清、高清及超清等输出,用户可以根据当前网络环境选择合适码率的视频播放。 |
改善播放效率 | 转码可以将 MP4 位于尾部的元信息 MOOV 提前到头部,播放器无需下载完整视频即可立即播放。 |
节省带宽 | 采用更先进的编码方式(如 H.265)转码,在不损失原始画质的情况下显著降低码率,节省播放带宽。 |
参数 | 类型 | 详细说明 |
输入格式 | 封装格式 | 3GP、AVI、FLV、MP4、M3U8、MPG、ASF、WMV、MKV、MOV、TS、WebM、MXF。 |
| 视频编码格式 | AV1、AVS2、H.264/AVC、H.263、 H.263+、H.265、MPEG-1、MPEG-2、MPEG-4、MJPEG、VP8、VP9、RealVideo、Windows Media Video、Quicktime。 |
| 音频编码格式 | AAC、ADPCM、AMR、DSD、MP1、MP2、MP3、PCM、RealAudio、Windows Media Audio、VORBIS、AC-3。 |
输出格式 | 封装格式 | 视频:FLV、MP4、HLS(m3u8+ts)、MXF。 |
| | 音频:MP3、MP4、OGG、FLAC、m4a。 |
| | 图片:GIF、WEBP。 |
| 视频编码格式 | H.264/AVC、 H.265/HEVC、AV1。 |
| 音频编码格式 | MP3、AAC、FLAC、MP2、VORBIS。 |
封装 | 删除视频流 | 如果开启“删除视频流”,转码出来的视频将不包含视频流(仅保留音频流)。 |
| 删除音频流 | 如果开启“删除音频流”,转码出来的视频将不包含音频流(仅保留视频流)。 |
增强类型 | 能力 | 说明 |
视频增强 | 超分辨率 | 超分辨率可以识别视频的内容与轮廓,高清重建视频的细节与局部特征,将低分辨率的视频转换为高分辨率的视频,适用于老片修复等场景。 |
| 低光照增强 | 因环境状况及拍摄摄像头的硬件限制,在某些场景下拍摄的画面存在亮度和对比度缺失问题,导致画面较暗或细节缺失。通过开启低光照增强,可以大幅提升暗区的细节和对比度,提升人眼主观质量。 |
| HDR | 支持 HDR10、HLG,能够获得更宽的色域,展现更多色彩细节,以提供更高品质的视频内容。 |
| 综合增强 | 通过 AI 的综合分析能力,自动平衡画面中的纹理内容,在去除压缩伪影和毛刺的同时增强关键细节,从而提高整个画面的总体主观感受。 |
| 色彩增强 | 色彩增强可以使画面更接近真实色彩,并在一定程度上进行增强满足人眼的喜好。 |
| 细节增强 | 细节增强对视频中需要关注的细节(例如赛场草地)进行增强,使画面内容更清晰,内容更丰富。 |
| 人脸增强 | 通过人脸检测针对视频中人眼视觉特别关注的人脸部分进行增强,使该区域的细节更加清晰,提高主观感受。 |
| 去划痕 | 去划痕可以修复视频中的划痕和雪花点等破坏的内容。 |
| 去毛刺(去伪影) | 由于影片在转码或多次转码过程中对视频进行了多次压缩,会引入块效应、振铃效应、色度渗透和蚊噪等,使得视频画面出现一些影响视觉效果的失真,去压缩失真能有效修复编码引入的失真。 |
| 视频降噪 | 由于影片拍摄中会因为相机和环境引入随机噪点,这里提供降噪服务,在保持细节不损失的情况下,消除画面中的随机噪声。 |
音频增强 | 音频降噪 | 音频智能降噪,去除设备底噪、环境噪声等,适用于录制课程、户外拍摄后期等场景。 |
| 音频分离 | 分离音视频文件中人声与背景声,或者演唱声和伴奏声,生成独立音频素材,便于后期实现其他风格艺术加工。 |
| 音量均衡 | 1. 响度标准化:使整体响度水平保持一致,播放时听起来具有相似的音量,避免出现过于响亮或过于安静的问题,提供更好的听觉体验。 2. 音量突变抑制:平滑过于响亮的音频片段,避免出现音量突变的问题,提供更平稳的听觉体验。 |
| 音频美化 | 1. 杂音去除:减少音频中包含的不需要的杂音或干扰声,提高音频的质量和清晰度。 2. 齿音压制:齿音是指音频中尖锐的、刺耳的声音,通常可能由声音源接近麦克风时产生。压制齿音旨在减少或消除这种不自然的声音,从而改善音频质量。 |
参数 | 说明 |
水印类型(Type) | 支持静态图片水印和动态图片水印 |
水印位置(Position) | 水印在视频画面中的相对位置 |
图片大小(ImageSize) | 图片水印占视频画面的大小 |
图片内容(ImageContent) | 图片水印中图片的二进制内容 |
参数 | 说明 |
格式(Format) | 截图文件的输出格式,目前仅支持 JPG |
宽度(Width) | 截图宽度,范围是128px - 4096px |
高度(Height) | 截图高度,范围是128px - 4096px |
填充方式(FillType) | 当截图的宽高比与原始视频的宽高比不一致时,对截图的处理方式,即为“填充”。一般有以下几种填充方式: 拉伸:对图片进行拉伸,填满整个图片,可能导致图片被“压扁”或者“拉长” 留黑:保持图片宽高比不变,边缘剩余部分使用黑色填充 留白:保持图片宽高比不变,边缘剩余部分使用白色填充 高斯模糊:保持图片宽高比不变,边缘剩余部分使用高斯模糊化后填充 |
参数 | 说明 |
格式(Format) | 截图文件的输出格式,目前仅支持 JPG |
宽度(Width) | 截图宽度,范围是128px - 4096px |
高度(Height) | 截图高度,范围是128px - 4096px |
采样方式(SampleType) | 采样方式分为两种: 按百分比采样:例如按照5%为间隔采样,生成截图张数将为20张 按时间间隔采样:例如按照10s为间隔采样,截图张数取决于视频的时长 |
采样间隔(Interval) | 采样的间隔长度: 如果按百分比采样,间隔是百分比 如果按时间间隔采样,间隔是多少秒 |
填充方式(FillType) | 当截图的宽高比与原始视频的宽高比不一致时,对截图的处理方式,即为“填充”。一般有以下几种填充方式: 拉伸:对图片进行拉伸,填满整个图片,可能导致图片被“压扁”或者“拉长” 留黑:保持图片宽高比不变,边缘剩余部分使用黑色填充 留白:保持图片宽高比不变,边缘剩余部分使用白色填充 高斯模糊:保持图片宽高比不变,边缘剩余部分使用高斯模糊化后填充 |
参数 | 说明 |
格式(Format) | 雪碧图文件的输出格式,目前仅支持 JPG |
小图宽度(Width) | 雪碧图中小图的宽度 |
小图高度(Height) | 雪碧图中小图的高度 |
小图行数(Rows) | 一张大图中有多少行小图 |
小图列数(Columns) | 一张大图中有多少列小图 |
采样方式(SampleType) | 小图采样方式,目前仅支持按照时间间隔采样 |
采样间隔(Interval) | 小图采样的间隔,即隔多久采样一张小图 |
参数 | 说明 |
格式(Format) | 动图文件的输出格式,目前仅支持 GIF 和 WEBP |
宽度(Width) | 动图宽度,范围是128px - 4096px |
高度(Height) | 动图高度,范围是128px - 4096px |
帧率(FPS) | 支持的帧率范围是1fps - 60fps |
识别类型 | 功能说明 |
人脸识别 | 基于深度学习方案,帮助客户快速识别视频中的人脸信息并快速定位出视频中的人物所在帧画面,以及人脸所在区域。客户可自定义人物库或调用视频 AI 公共人物库进行人脸识别。 |
语音识别 | 基于深度学习方案,帮助客户快速识别视频中的声音并转化成文字,支持客户自定义关键词且定位出关键词所在视频的时间点。 |
文字识别 | 帮助客户识别视频中出现的文字信息,可用于视频内自定义关键词的提取,也支持竖版文字的识别。 |
帧标签识别 | 基于深度学习方案,支持根据客户自定义视频截帧间隔,自动识别截帧画面内的标签,并定位标签所在的视频位置,帧标签涵盖人物、风景、人造物、建筑、动植物、食物等9个大类,包含日常生活的各个信息维度,并且支持在标签体系基础上使用自定义标签,具备迁移学习能力,只需提供原始用户数据便可定制分类器,满足不同类型的用户需求,使标签分类更具灵活性。 |
片头片尾识别 | 根据视频画面特征、文字、语音等信息自动识别定位电影/电视剧片头片尾时间点。 |
分析类型 | 能力说明 |
分类识别 | 通过分析视频内容,给视频推荐一个类别。目前支持美食、旅游、动漫、音乐等19大类(支持定制,需支付定制费)。 |
视频标签识别 | 基于腾讯深度学习方案,智能识别出最符合视频内容的前五项标签摘要,用于视频推荐、检索等场景,用户可在接口中自行选择返回的标签个数。 |
智能封面 | 结合视频画面纹理、场景识别等特征信息自动生成文件封面,支持静态封面输出,提升视频封面体验和点击转化率。 |
审核类型 | 检测类型 | 检测项说明 |
安全审核 | 视频画面审核 | 对视频画面做涉黄、违规检测,具体检测项如下: 涉黄检测 porn:色情 vulgar:低俗 intimacy:亲密行为 sexy:性感 违法违规检测 guns:武器枪支 bloody:血腥画面 explosion:爆炸火灾 violation_photo:违规图标 |
| 音频审核 | 对音频中的文字进行检测,具体检测项如下: 涉黄检测:对音频中的文字做涉黄检查,识别出嫌疑关键词。 违法违规检测:对音频中的文字做违法违规检查,识别出嫌疑关键词。 |
| 文字审核 | 对画面中的文字进行检测,具体检测项如下: 涉黄检测:对画面中的文字做涉黄检查,识别出嫌疑关键词。 违法违规检测:对画面中的文字做违法违规检查,识别出嫌疑关键词。 |
质量审核 | 画面质量 | 支持对视频的画面质量做出检测,具体检测项如下: JitterResults:画面抖动。 BlurResults:画面模糊。 AbnormalLightingResults:低光、过曝。 CrashScreenResults:花屏 BlackWhiteEdgeResults:画面黑边、白边、黑屏、白屏、纯色屏时间段。 NoiseResults:画面有噪点。 MosaicResults:画面有马赛克。 QRCodeResults:画面有二维码。 |
| 声音质量 | 支持对视频的声音质量做出检测,具体检测项如下: VoiceResults:音频异常,包括静音、低音、爆音。 |
本页内容是否解决了您的问题?