你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Bicep 资源定义
可以使用目标作部署 mediaServices/transforms 资源类型:
- 资源组 - 请参阅 资源组部署命令
有关每个 API 版本中已更改属性的列表,请参阅 更改日志。
资源格式
若要创建 Microsoft.Media/mediaServices/transforms 资源,请将以下 Bicep 添加到模板。
resource symbolicname 'Microsoft.Media/mediaServices/transforms@2022-07-01' = {
parent: resourceSymbolicName
name: 'string'
properties: {
description: 'string'
outputs: [
{
onError: 'string'
preset: {
@odata.type: 'string'
// For remaining properties, see Preset objects
}
relativePriority: 'string'
}
]
}
}
预设对象
设置 @odata.type 属性以指定对象的类型。
对于 #Microsoft.Media.VideoAnalyzerPreset,请使用:
{
@odata.type: '#Microsoft.Media.VideoAnalyzerPreset'
audioLanguage: 'string'
experimentalOptions: {
{customized property}: 'string'
}
insightsToExtract: 'string'
mode: 'string'
}
对于 #Microsoft.Media.BuiltInStandardEncoderPreset,请使用:
{
@odata.type: '#Microsoft.Media.BuiltInStandardEncoderPreset'
configurations: {
complexity: 'string'
interleaveOutput: 'string'
keyFrameIntervalInSeconds: int
maxBitrateBps: int
maxHeight: int
maxLayers: int
minBitrateBps: int
minHeight: int
}
presetName: 'string'
}
对于 #Microsoft.Media.FaceDetectorPreset,请使用:
{
@odata.type: '#Microsoft.Media.FaceDetectorPreset'
blurType: 'string'
experimentalOptions: {
{customized property}: 'string'
}
mode: 'string'
resolution: 'string'
}
对于 #Microsoft.Media.StandardEncoderPreset,请使用:
{
@odata.type: '#Microsoft.Media.StandardEncoderPreset'
codecs: [
{
label: 'string'
@odata.type: 'string'
// For remaining properties, see Codec objects
}
]
experimentalOptions: {
{customized property}: 'string'
}
filters: {
crop: {
height: 'string'
left: 'string'
top: 'string'
width: 'string'
}
deinterlace: {
mode: 'string'
parity: 'string'
}
fadeIn: {
duration: 'string'
fadeColor: 'string'
start: 'string'
}
fadeOut: {
duration: 'string'
fadeColor: 'string'
start: 'string'
}
overlays: [
{
audioGainLevel: int
end: 'string'
fadeInDuration: 'string'
fadeOutDuration: 'string'
inputLabel: 'string'
start: 'string'
@odata.type: 'string'
// For remaining properties, see Overlay objects
}
]
rotation: 'string'
}
formats: [
{
filenamePattern: 'string'
@odata.type: 'string'
// For remaining properties, see Format objects
}
]
}
设置对象格式
设置 @odata.type 属性以指定对象的类型。
对于 #Microsoft.Media.JpgFormat,请使用:
{
@odata.type: '#Microsoft.Media.JpgFormat'
}
对于 #Microsoft.Media.PngFormat,请使用:
{
@odata.type: '#Microsoft.Media.PngFormat'
}
对于 #Microsoft.Media.Mp4Format,请使用:
{
@odata.type: '#Microsoft.Media.Mp4Format'
outputFiles: [
{
labels: [
'string'
]
}
]
}
对于 #Microsoft.Media.TransportStreamFormat,请使用:
{
@odata.type: '#Microsoft.Media.TransportStreamFormat'
outputFiles: [
{
labels: [
'string'
]
}
]
}
编解码器对象
设置 @odata.type 属性以指定对象的类型。
对于 #Microsoft.Media.AacAudio,请使用:
{
@odata.type: '#Microsoft.Media.AacAudio'
bitrate: int
channels: int
profile: 'string'
samplingRate: int
}
对于 #Microsoft.Media.DDAudio,请使用:
{
@odata.type: '#Microsoft.Media.DDAudio'
bitrate: int
channels: int
samplingRate: int
}
对于 #Microsoft.Media.CopyAudio,请使用:
{
@odata.type: '#Microsoft.Media.CopyAudio'
}
对于 #Microsoft.Media.CopyVideo,请使用:
{
@odata.type: '#Microsoft.Media.CopyVideo'
}
对于 #Microsoft.Media.H264Video,请使用:
{
@odata.type: '#Microsoft.Media.H264Video'
complexity: 'string'
keyFrameInterval: 'string'
layers: [
{
adaptiveBFrame: bool
bFrames: int
bitrate: int
bufferWindow: 'string'
crf: int
entropyMode: 'string'
frameRate: 'string'
height: 'string'
label: 'string'
level: 'string'
maxBitrate: int
profile: 'string'
referenceFrames: int
slices: int
width: 'string'
}
]
rateControlMode: 'string'
sceneChangeDetection: bool
stretchMode: 'string'
syncMode: 'string'
}
对于 #Microsoft.Media.H265Video,请使用:
{
@odata.type: '#Microsoft.Media.H265Video'
complexity: 'string'
keyFrameInterval: 'string'
layers: [
{
adaptiveBFrame: bool
bFrames: int
bitrate: int
bufferWindow: 'string'
crf: int
frameRate: 'string'
height: 'string'
label: 'string'
level: 'string'
maxBitrate: int
profile: 'string'
referenceFrames: int
slices: int
width: 'string'
}
]
sceneChangeDetection: bool
stretchMode: 'string'
syncMode: 'string'
}
对于 #Microsoft.Media.JpgImage,请使用:
{
@odata.type: '#Microsoft.Media.JpgImage'
keyFrameInterval: 'string'
layers: [
{
height: 'string'
label: 'string'
quality: int
width: 'string'
}
]
range: 'string'
spriteColumn: int
start: 'string'
step: 'string'
stretchMode: 'string'
syncMode: 'string'
}
对于 #Microsoft.Media.PngImage,请使用:
{
@odata.type: '#Microsoft.Media.PngImage'
keyFrameInterval: 'string'
layers: [
{
height: 'string'
label: 'string'
width: 'string'
}
]
range: 'string'
start: 'string'
step: 'string'
stretchMode: 'string'
syncMode: 'string'
}
覆盖对象
设置 @odata.type 属性以指定对象的类型。
对于 #Microsoft.Media.AudioOverlay,请使用:
{
@odata.type: '#Microsoft.Media.AudioOverlay'
}
对于 #Microsoft.Media.VideoOverlay,请使用:
{
@odata.type: '#Microsoft.Media.VideoOverlay'
cropRectangle: {
height: 'string'
left: 'string'
top: 'string'
width: 'string'
}
opacity: int
position: {
height: 'string'
left: 'string'
top: 'string'
width: 'string'
}
}
属性值
音频
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.AacAudio”(必需) |
比特率 | 输出编码音频的比特率(以位/秒为单位)。 | 整数 (int) |
渠道 | 音频中的声道数。 | 整数 (int) |
简介 | 使用 AAC 编码音频时使用的编码配置文件。 | “AacLc” “HeaacV1” “HeaacV2” |
采样率 | 用于以赫茨编码的采样率。 | 整数 (int) |
AudioAnalyzerPresetExperimentalOptions
名称 | DESCRIPTION | 价值 |
---|
音频叠加
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.AudioOverlay”(必需) |
BuiltInStandardEncoderPreset
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.BuiltInStandardEncoderPreset”(必需) |
配置 | 编码器的可选配置设置。 仅 ContentAwareEncoding 和 H265ContentAwareEncoding BuiltInStandardEncoderPreset 支持配置。 | PresetConfigurations |
预设名称 | 用于编码视频的内置预设。 | “AACGoodQualityAudio” “AdaptiveStreaming” “ContentAwareEncoding” “ContentAwareEncodingExperimental” “CopyAllBitrateNonInterleaved” “DDGoodQualityAudio” 'H264MultipleBitrate1080p' 'H264MultipleBitrate720p' 'H264MultipleBitrateSD' 'H264SingleBitrate1080p' 'H264SingleBitrate720p' 'H264SingleBitrateSD' “H265AdaptiveStreaming” “H265ContentAwareEncoding” 'H265SingleBitrate1080p' “H265SingleBitrate4K” “H265SingleBitrate720p”(必需) |
编 解码 器
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 对于 AacAudio 类型,设置为“#Microsoft.Media.AacAudio”。 对于 类型 DDAudio,设置为“#Microsoft.Media.DDAudio”。 对于 Type CopyAudio,设置为“#Microsoft.Media.CopyAudio”。 对于 CopyVideo 类型,设置为“#Microsoft.Media.CopyVideo”。 对于 H264Video,设置为“#Microsoft.Media.H264Video”。 对于 H265Video 类型,设置为“#Microsoft.Media.H265Video”。 对于 JpgImage 类型,设置为“#Microsoft.Media.JpgImage”。 对于 PngImage 类型,设置为“#Microsoft.Media.PngImage”。 | '#Microsoft.Media.AacAudio' “#Microsoft.Media.CopyAudio” “#Microsoft.Media.CopyVideo” '#Microsoft.Media.DDAudio' “#Microsoft.Media.H264视频” “#Microsoft.Media.H265视频” '#Microsoft.Media.JpgImage' “#Microsoft.Media.PngImage”(必需) |
标签 | 编解码器的可选标签。 该标签可用于控制复用行为。 | 字符串 |
复制音频
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.CopyAudio”(必需) |
复制视频
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.CopyVideo”(必需) |
DDAudio
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | '#Microsoft.Media.DDAudio' (必需) |
比特率 | 输出编码音频的比特率(以位/秒为单位)。 | 整数 (int) |
渠道 | 音频中的声道数。 | 整数 (int) |
采样率 | 用于以赫茨编码的采样率。 | 整数 (int) |
Deinterlace (取消交错)
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | 反交错模式。 默认为 AutoPixelAdaptive。 | “AutoPixelAdaptive” “关闭” |
平价 | 取消交错的字段奇偶校验默认为“自动”。 | “Auto” “BottomFieldFirst” “TopFieldFirst” |
FaceDetector预设
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.FaceDetectorPreset”(必需) |
blurType | 模糊类型 | “Black” “Box” “High” “Low” “Med” |
experimental选项 | 包含预设本身中未公开的参数的键值对的字典 | FaceDetectorPresetExperimentalOptions |
模式 | 此模式提供在以下设置之间进行选择的功能:1) 分析 - 仅用于检测。此模式生成元数据 JSON 文件,用于标记整个视频中人脸的外观。如果可能,同一人的外观将分配相同的 ID。2) 组合 - 此外,检测到人脸的编辑(模糊)。 3) 修订 - 这可实现 2 次传递过程,允许选择性地编辑检测到的人脸子集。它采用先前分析传递中的元数据文件以及源视频,以及需要修订的用户选择的 ID 子集。 | “分析” “Combined” “Redact” |
解决方法 | 指定分析视频的最大分辨率。 默认行为为“SourceResolution”,在分析时将输入视频保留为其原始分辨率。 使用“StandardDefinition”会将输入视频调整为标准定义,同时保留适当的纵横比。 仅当视频分辨率较高时,它才会调整大小。 例如,在处理之前,1920x1080 输入将缩放为 640x360。 切换到“StandardDefinition”可以减少处理高分辨率视频所需的时间。 它还可能会降低使用此组件的成本(有关详细信息 https://azure.microsoft.com/en-us/pricing/details/media-services/#analytics )。 但是,可能无法检测到在调整大小的视频中最终太小的人脸。 | “SourceResolution” “StandardDefinition” |
FaceDetectorPresetExperimentalOptions
名称 | DESCRIPTION | 价值 |
---|
褪色
名称 | DESCRIPTION | 价值 |
---|---|---|
持续时间 | 视频中淡出效果的持续时间。 该值可以采用 ISO 8601 格式(例如,PT05S 在 5 秒内淡入/淡出颜色),或帧计数(例如,10 到从开始时间淡化 10 帧),或流持续时间的相对值(例如,10% 淡化 10% 流持续时间) | string (必需) |
淡化颜色 | 淡入/淡出的颜色。它可以位于 CSS Level1 颜色 https://developer.mozilla.org/en-US/docs/Web/CSS/color_value/color_keywords 或 RGB/十六进制值上:例如 rgb(255,0,0),0xFF0000或 #FF0000 | string (必需) |
开始 | 输入视频中开始淡出的位置。 该值可以采用 ISO 8601 格式(例如 PT05S 以 5 秒开始),或帧计数(例如,从第 10 帧开始)或流持续时间的相对值(例如,10% 从流持续时间的 10% 开始)。 默认值为 0 | 字符串 |
过滤 器
名称 | DESCRIPTION | 价值 |
---|---|---|
作物 | 用于裁剪输入视频的矩形窗口的参数。 | 矩形 |
取消交错 | 反交错设置。 | Deinterlace (取消交错) |
淡入 | 描述应用于输入媒体的淡化效果的属性。 | 褪色 |
淡出 | 描述应用于输入媒体的淡化效果的属性。 | 褪色 |
覆盖 | 要应用于输入视频的覆盖层的属性。 这些可能是音频、图像或视频覆盖层。 | 覆盖层[] |
旋转 | 在对输入视频进行编码之前,要应用于输入视频的旋转(如果有)。 默认值为“自动” | “Auto” “None” “Rotate0” “Rotate180” “Rotate270” “Rotate90” |
格式
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 对于 JpgFormat 类型,设置为“#Microsoft.Media.JpgFormat”。 设置为类型 为 PngFormat 的“#Microsoft.Media.PngFormat”。 对于 Mp4Format 类型,设置为“#Microsoft.Media.Mp4Format”。 对于 TransportStreamFormat,设置为“#Microsoft.Media.TransportStreamFormat”。 | '#Microsoft.Media.JpgFormat' '#Microsoft.Media.Mp4Format' '#Microsoft.Media.PngFormat' “#Microsoft.Media.TransportStreamFormat”(必需) |
filenamePattern | 用于创建输出文件的文件命名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件名称的扩展宏。 如果输入视频文件的基名称(不包括文件后缀)长度小于 32 个字符,将使用输入视频文件的基名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号(从 1 开始)。 {Bitrate} - 以 kbps 为单位的音频/视频比特率。 不适用于缩略图。 {编解码器} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未提交的宏都将折叠并从文件名中删除。 | string (必需) |
H264层
名称 | DESCRIPTION | 价值 |
---|---|---|
adaptiveBFrame | 是否在编码此层时使用自适应 B 帧。 如果未指定,则每当视频配置文件允许其使用时,编码器都会打开它。 | 布尔 |
b帧 | 编码此层时要使用的 B 帧数。 如果未指定,编码器将根据视频配置文件和级别选择适当的数字。 | 整数 (int) |
比特率 | 生成此层时,每秒要对输入视频进行编码的平均比特率(以比特/秒为单位)。 这是必填字段。 | int (必需) |
缓冲窗口 | VBV 缓冲区窗口长度。 该值应采用 ISO 8601 格式。 该值应位于 [0.1-100] 秒范围内。 默认值为 5 秒(例如 PT5S)。 | 字符串 |
CRF | 编码此层时要使用的 CRF 值。 当在 CRF 模式下设置视频编解码器的 RateControlMode 时,此设置生效。 CRF 值的范围介于 0 和 51 之间,其中较低的值会导致质量更好,代价是文件大小较高。 较高的值意味着更多的压缩,但在某些时候会注意到质量下降。 默认值为 23。 | 整数 (int) |
熵模式 | 要用于此层的萎缩模式。 如果未指定,编码器将选择适合配置文件和级别的模式。 | “Cabac” “Cavlc” |
帧率 | 要对此层进行编码的帧速率(以每秒帧为单位)。 该值可以采用 M/N 的形式,其中 M 和 N 是整数(例如,30000/1001),也可以以数字的形式(例如,30 或 29.97)。 编码器根据配置文件和级别对允许的帧速率强制实施约束。 如果未指定,编码器将使用与输入视频相同的帧速率。 | 字符串 |
身高 | 此层的输出视频的高度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的高度为一半的像素(与输入相同)。 | 字符串 |
标签 | 此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 | 字符串 |
水平 | 我们目前支持高达 6.2 的级别。 该值可以是“自动”,也可以是与 H.264 配置文件匹配的数字。 如果未指定,则默认值为“自动”,允许编码器选择适合此层的级别。 | 字符串 |
最大比特率 | 最大比特率(以比特/秒为单位),其中应假定 VBV 缓冲区重新填充。 如果未指定,则默认为与比特率相同的值。 | 整数 (int) |
简介 | 我们目前支持基线、Main、High、High422、High444。 默认值为“自动”。 | “Auto” “Baseline” “High” “High422” “High444” “Main” |
referenceFrames | 编码此层时要使用的引用帧数。 如果未指定,编码器会根据编码器复杂性设置确定适当的数字。 | 整数 (int) |
片 | 编码此层时要使用的切片数。 如果未指定,则默认值为零,这意味着编码器将为每个帧使用单个切片。 | 整数 (int) |
宽度 | 此层的输出视频的宽度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的宽度与输入的宽度相等一半。 | 字符串 |
H264视频
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.H264Video”(必需) |
复杂性 | 告知编码器如何选择其编码设置。 默认值为“平衡”。 | “平衡” “质量” “速度” |
keyFrameInterval 键帧间隔 | 两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒(PT2S)。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 | 字符串 |
层 | 要由编码器生成的输出 H.264 层的集合。 | H264层[] |
rateControlMode | 视频速率控制模式 | “ABR” “CBR” “CRF” |
sceneChangeDetection | 编码器是否应在场景更改时插入关键帧。 如果未指定,则默认值为 false。 仅当编码器配置为生成单个输出视频时,才应将此标志设置为 true。 | 布尔 |
stretchMode (拉伸模式) | 调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率。 默认值为 AutoSize | “AutoFit” “AutoSize” “None” |
syncMode 同步模式 | 视频同步模式 | “Auto” 'Cfr' “直通” “Vfr” |
H265层
名称 | DESCRIPTION | 价值 |
---|---|---|
adaptiveBFrame | 指定是否在编码此层时使用自适应 B 帧。 如果未指定,则每当视频配置文件允许其使用时,编码器都会打开它。 | 布尔 |
b帧 | 编码此层时要使用的 B 帧数。 如果未指定,编码器将根据视频配置文件和级别选择适当的数字。 | 整数 (int) |
比特率 | 生成此层时,每秒要对输入视频进行编码的平均比特率(以比特/秒为单位)。 例如:目标比特率为 3000Kbps 或 3Mbps 表示此值应为 3000000。这是必填字段。 | int (必需) |
缓冲窗口 | VBV 缓冲区窗口长度。 该值应采用 ISO 8601 格式。 该值应位于 [0.1-100] 秒范围内。 默认值为 5 秒(例如 PT5S)。 | 字符串 |
CRF | 编码此层时要使用的 CRF 值。 当在 CRF 模式下设置视频编解码器的 RateControlMode 时,此设置生效。 CRF 值的范围介于 0 和 51 之间,其中较低的值会导致质量更好,代价是文件大小较高。 较高的值意味着更多的压缩,但在某些时候会注意到质量下降。 默认值为 28。 | 整数 (int) |
帧率 | 要对此层进行编码的帧速率(以每秒帧为单位)。 该值可以采用 M/N 的形式,其中 M 和 N 是整数(例如,30000/1001),也可以以数字的形式(例如,30 或 29.97)。 编码器根据配置文件和级别对允许的帧速率强制实施约束。 如果未指定,编码器将使用与输入视频相同的帧速率。 | 字符串 |
身高 | 此层的输出视频的高度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的高度为一半的像素(与输入相同)。 | 字符串 |
标签 | 此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 | 字符串 |
水平 | 我们目前支持高达 6.2 的级别。 该值可以是“自动”,也可以是与 H.265 配置文件匹配的数字。 如果未指定,则默认值为“自动”,允许编码器选择适合此层的级别。 | 字符串 |
最大比特率 | 最大比特率(以比特/秒为单位),其中应假定 VBV 缓冲区重新填充。 如果未指定,则默认为与比特率相同的值。 | 整数 (int) |
简介 | 我们目前支持 Main。 默认值为“自动”。 | “Auto” “Main” “Main10” |
referenceFrames | 编码此层时要使用的引用帧数。 如果未指定,编码器会根据编码器复杂性设置确定适当的数字。 | 整数 (int) |
片 | 编码此层时要使用的切片数。 如果未指定,则默认值为零,这意味着编码器将为每个帧使用单个切片。 | 整数 (int) |
宽度 | 此层的输出视频的宽度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的宽度与输入的宽度相等一半。 | 字符串 |
H265视频
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.H265Video”(必需) |
复杂性 | 告知编码器如何选择其编码设置。 质量将提供更高的压缩率,但成本更高,计算时间更长。 速度将产生一个相对较大的文件,但速度更快且更经济。 默认值为“平衡”。 | “平衡” “质量” “速度” |
keyFrameInterval 键帧间隔 | 两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒(PT2S)。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 | 字符串 |
层 | 要由编码器生成的输出 H.265 层的集合。 | H265层[] |
sceneChangeDetection | 指定编码器是否应在场景更改时插入关键帧。 如果未指定,则默认值为 false。 仅当编码器配置为生成单个输出视频时,才应将此标志设置为 true。 | 布尔 |
stretchMode (拉伸模式) | 调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率。 默认值为 AutoSize | “AutoFit” “AutoSize” “None” |
syncMode 同步模式 | 视频同步模式 | “Auto” 'Cfr' “直通” “Vfr” |
JPG 格式
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.JpgFormat”(必需) |
Jpg图片
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.JpgImage”(必需) |
keyFrameInterval 键帧间隔 | 两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒(PT2S)。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 | 字符串 |
层 | 要由编码器生成的输出 JPEG 图像层的集合。 | JpgLayer[] |
范围 | 相对于在输入视频中转换预设开始时间的位置,在该视频中停止生成缩略图。 该值可以采用 ISO 8601 格式(例如,PT5M30S从开始时间停止 5 分 30 秒)或帧计数(例如,从开始时从帧的第 300 帧停止的 300 个帧)。如果此值为 1,则表示仅在开始时间生成一个缩略图,或流持续时间的相对值(例如,50% 从开始时间停止流持续时间的一半)。 默认值为 100%,这意味着在流末尾停止。 | 字符串 |
spriteColumn | 设置缩略图子画面图像中使用的列数。 自动计算行数,并使用子画面中每个缩略图的坐标映射生成 VTT 文件。 注意:此值应为正整数,建议使用适当的值,以便输出图像分辨率不会超出 JPEG 最大像素分辨率限制 65535x65535。 | 整数 (int) |
开始 | 输入视频中开始生成缩略图的位置。 该值可以采用 ISO 8601 格式(例如 PT05S 以 5 秒开始),或帧计数(例如,从第 10 帧开始)或流持续时间的相对值(例如,10% 从流持续时间的 10% 开始)。 此外还支持宏 {Best},该宏告知编码器从视频的前几秒钟中选择最佳缩略图,并且无论步骤和范围的其他设置如何,都将仅生成一个缩略图。 默认值为宏 {Best}。 | string (必需) |
步 | 生成缩略图的间隔。 该值可以采用 ISO 8601 格式(例如,每 5 秒一张图像的 PT05S)或帧计数(例如,每 30 帧一张图像 30 张)或流持续时间的相对值(例如,每 10 个流持续时间每 10% 一张图像的 10%)。 注意:步骤值将影响第一个生成的缩略图,这可能不是在转换预设开始时间指定的缩略图。 这是由于编码器,它尝试从开始时间和步骤位置之间选择最佳缩略图作为第一个输出。 由于默认值为 10%,这意味着如果流具有较长的持续时间,则第一个生成的缩略图可能远离在开始时间指定的缩略图。 如果第一个缩略图预期接近开始时间,请尝试为 Step 选择合理的值,或者在开始时仅需要一个缩略图时将 Range 值设置为 1。 | 字符串 |
stretchMode (拉伸模式) | 调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率。 默认值为 AutoSize | “AutoFit” “AutoSize” “None” |
syncMode 同步模式 | 视频同步模式 | “Auto” 'Cfr' “直通” “Vfr” |
Jpg 图层
名称 | DESCRIPTION | 价值 |
---|---|---|
身高 | 此层的输出视频的高度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的高度为一半的像素(与输入相同)。 | 字符串 |
标签 | 此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 | 字符串 |
质量 | JPEG 输出的压缩质量。 范围为 0-100,默认值为 70。 | 整数 (int) |
宽度 | 此层的输出视频的宽度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的宽度与输入的宽度相等一半。 | 字符串 |
Microsoft.Media/mediaServices/transforms
名称 | DESCRIPTION | 价值 |
---|---|---|
姓名 | 资源名称 | string (必需) |
家长 | 在 Bicep 中,可以为子资源指定父资源。 仅当子资源在父资源外部声明时,才需要添加此属性。 有关详细信息,请参阅 父资源外部的子资源。 |
类型资源的符号名称: mediaServices |
属性 | 资源属性。 | TransformProperties (变换属性) |
Mp4格式
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.Mp4Format”(必需) |
outputFiles (输出文件) | 要生成的输出文件的列表。 列表中的每个条目都是一组要一起复用的音频和视频层标签。 | 输出文件[] |
输出文件
名称 | DESCRIPTION | 价值 |
---|---|---|
标签 | 描述编码器如何将视频和音频多路复用到输出文件中的标签列表。 例如,如果编码器正在生成带有标签 v1 和 v2 的两个视频层,以及一个带有标签 a1 的音频层,则“[v1, a1]”等数组会告知编码器生成一个输出文件,其中包含 v1 表示的视频轨迹和 a1 表示的音频轨迹。 | string[] (必需) |
覆盖
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 对于 Type AudioOverlay,设置为“#Microsoft.Media.AudioOverlay”。 对于 VideoOverlay 类型,设置为“#Microsoft.Media.VideoOverlay”。 | “#Microsoft.Media.AudioOverlay” “#Microsoft.Media.VideoOverlay”(必需) |
audioGainLevel 音频增益级别 | 覆盖中的音频增益级别。 该值应位于 [0, 1.0] 范围内。 默认值为 1.0。 | 整数 (int) |
结束 | 结束位置,引用输入视频,覆盖结束。 该值应采用 ISO 8601 格式。 例如,PT30S 在输入视频中以 30 秒结束覆盖。 如果未指定或值大于输入视频持续时间,则在覆盖媒体持续时间大于输入视频持续时间时,将应用覆盖层,直到输入视频结束,否则覆盖将持续到覆盖媒体持续时间。 | 字符串 |
淡化持续时间 | 覆盖逐渐淡入输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定默认行为,则不会淡入(与 PT0S 相同)。 | 字符串 |
淡出持续时间 | 覆盖逐渐淡出输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定默认行为,则不会淡出(与 PT0S 相同)。 | 字符串 |
inputLabel (输入标签) | 要用作覆盖的作业输入的标签。 输入必须指定一个文件。 可以使用 JPG、PNG、GIF 或 BMP 格式或音频文件(如 WAV、MP3、WMA 或 M4A 文件)或视频文件指定图像文件。 请参阅 https://aka.ms/mesformats 支持的音频和视频文件格式的完整列表。 | string (必需) |
开始 | 开始位置,引用输入视频,覆盖开始。 该值应采用 ISO 8601 格式。 例如,PT05S 在输入视频中的 5 秒处启动覆盖。 如果未指定覆盖层,则从输入视频的开头开始。 | 字符串 |
Png格式
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.PngFormat”(必需) |
Png图像
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.PngImage”(必需) |
keyFrameInterval 键帧间隔 | 两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒(PT2S)。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 | 字符串 |
层 | 要由编码器生成的输出 PNG 图像层的集合。 | PngLayer[] |
范围 | 相对于在输入视频中转换预设开始时间的位置,在该视频中停止生成缩略图。 该值可以采用 ISO 8601 格式(例如,PT5M30S从开始时间停止 5 分 30 秒)或帧计数(例如,从开始时从帧的第 300 帧停止的 300 个帧)。如果此值为 1,则表示仅在开始时间生成一个缩略图,或流持续时间的相对值(例如,50% 从开始时间停止流持续时间的一半)。 默认值为 100%,这意味着在流末尾停止。 | 字符串 |
开始 | 输入视频中开始生成缩略图的位置。 该值可以采用 ISO 8601 格式(例如 PT05S 以 5 秒开始),或帧计数(例如,从第 10 帧开始)或流持续时间的相对值(例如,10% 从流持续时间的 10% 开始)。 此外还支持宏 {Best},该宏告知编码器从视频的前几秒钟中选择最佳缩略图,并且无论步骤和范围的其他设置如何,都将仅生成一个缩略图。 默认值为宏 {Best}。 | string (必需) |
步 | 生成缩略图的间隔。 该值可以采用 ISO 8601 格式(例如,每 5 秒一张图像的 PT05S)或帧计数(例如,每 30 帧一张图像 30 张)或流持续时间的相对值(例如,每 10 个流持续时间每 10% 一张图像的 10%)。 注意:步骤值将影响第一个生成的缩略图,这可能不是在转换预设开始时间指定的缩略图。 这是由于编码器,它尝试从开始时间和步骤位置之间选择最佳缩略图作为第一个输出。 由于默认值为 10%,这意味着如果流具有较长的持续时间,则第一个生成的缩略图可能远离在开始时间指定的缩略图。 如果第一个缩略图预期接近开始时间,请尝试为 Step 选择合理的值,或者在开始时仅需要一个缩略图时将 Range 值设置为 1。 | 字符串 |
stretchMode (拉伸模式) | 调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率。 默认值为 AutoSize | “AutoFit” “AutoSize” “None” |
syncMode 同步模式 | 视频同步模式 | “Auto” 'Cfr' “直通” “Vfr” |
Png图层
名称 | DESCRIPTION | 价值 |
---|---|---|
身高 | 此层的输出视频的高度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的高度为一半的像素(与输入相同)。 | 字符串 |
标签 | 此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 | 字符串 |
宽度 | 此层的输出视频的宽度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的宽度与输入的宽度相等一半。 | 字符串 |
预设
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 对于 VideoAnalyzerPreset 类型,设置为“#Microsoft.Media.VideoAnalyzerPreset”。 对于 BuiltInStandardEncoderPreset,设置为“#Microsoft.Media.BuiltInStandardEncoderPreset”。 对于 FaceDetectorPreset 类型,设置为“#Microsoft.Media.FaceDetectorPreset”。 对于 StandardEncoderPreset 类型,设置为“#Microsoft.Media.StandardEncoderPreset”。 | “#Microsoft.Media.BuiltInStandardEncoderPreset” “#Microsoft.Media.FaceDetectorPreset” “#Microsoft.Media.StandardEncoderPreset” “#Microsoft.Media.VideoAnalyzerPreset”(必需) |
PresetConfigurations
名称 | DESCRIPTION | 价值 |
---|---|---|
复杂性 | 允许配置编码器设置,以控制速度和质量之间的平衡。 示例:将复杂性设置为“速度”,以提高编码速度,但压缩效率较低。 | “平衡” “质量” “速度” |
interleaveOutput (交错输出) | 设置输出的交错模式,以控制音频和视频如何以容器格式存储。 示例:将 InterleavedOutput 设置为 NonInterleavedOutput,以在单独的 MP4 文件中生成仅音频和仅视频输出。 | “InterleavedOutput” “NonInterleavedOutput” |
keyFrameIntervalInSeconds | 关键帧间隔(以秒为单位)。 示例:将 KeyFrameIntervalInSeconds 设置为 2 以减少某些玩家的播放缓冲。 | 整数 (int) |
最大比特率 Bps | 最大比特率(每秒位数)(最高视频层的阈值)。 示例:将 MaxBitrateBps 设置为 6000000,以避免为具有较高复杂性的内容生成非常高的比特率输出。 | 整数 (int) |
最大高度 | 输出视频层的最大高度。 示例:将 MaxHeight 设置为 720 以生成高达 720P 的输出层,即使输入为 4K 也是如此。 | 整数 (int) |
最大层数 | 输出视频层的最大数目。 示例:将 MaxLayers 设置为 4,以确保生成最多 4 个输出层,以控制编码作业的总体成本。 | 整数 (int) |
最小比特率 Bps | 最小比特率(每秒位数)(底层视频层的阈值)。 示例:将 MinBitrateBps 设置为 200000,其底层覆盖网络带宽较低的用户。 | 整数 (int) |
minHeight | 输出视频层的最小高度。 示例:将 MinHeight 设置为 360,以避免输出层较小的分辨率,例如 180P。 | 整数 (int) |
矩形
名称 | DESCRIPTION | 价值 |
---|---|---|
身高 | 矩形区域的高度(以像素为单位)。 这可以是绝对像素值(例如 100),也可以相对于视频的大小(例如,50%)。 | 字符串 |
左 | 左边距中的像素数。 这可以是绝对像素值(例如 100),也可以相对于视频的大小(例如,50%)。 | 字符串 |
顶部 | 上边距中的像素数。 这可以是绝对像素值(例如 100),也可以相对于视频的大小(例如,50%)。 | 字符串 |
宽度 | 矩形区域的宽度(以像素为单位)。 这可以是绝对像素值(例如 100),也可以相对于视频的大小(例如,50%)。 | 字符串 |
StandardEncoderPreset
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.StandardEncoderPreset”(必需) |
编 解码 器 | 编码输入视频时要使用的编解码器列表。 | 编解码器[] (必需) |
experimental选项 | 包含预设本身中未公开的参数的键值对的字典 | StandardEncoderPresetExperimentalOptions |
筛选器 | 编码前应用于输入媒体的一个或多个筛选作。 | 过滤 器 |
格式 | 要由编码器生成的输出列表。 | Format[] (必需) |
StandardEncoderPresetExperimentalOptions
名称 | DESCRIPTION | 价值 |
---|
TransformOutput (变换输出)
名称 | DESCRIPTION | 价值 |
---|---|---|
onError 错误 | 转换可以定义多个输出。 此属性定义服务在一个输出失败时应执行的作 - 继续生成其他输出,或者停止其他输出。 总体作业状态不会反映使用“ContinueJob”指定的输出失败。 默认值为“StopProcessingJob”。 | “ContinueJob” “StopProcessingJob” |
预设 | 描述将用于修改、转码或从源文件中提取见解以生成输出的作的预设。 | 预设 (必需) |
relativePriority | 设置 Transform 中的 TransformOutputs 的相对优先级。 这会设置服务用于处理 TransformOutputs 的优先级。 默认优先级为 Normal。 | “High” “Low” “Normal” |
TransformProperties (变换属性)
名称 | DESCRIPTION | 价值 |
---|---|---|
描述 | 转换的可选详细描述。 | 字符串 |
输出 | 转换应生成的一个或多个 TransformOutput 的数组。 | TransformOutput[] (必需) |
TransportStreamFormat 格式
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.TransportStreamFormat”(必需) |
outputFiles (输出文件) | 要生成的输出文件的列表。 列表中的每个条目都是一组要一起复用的音频和视频层标签。 | 输出文件[] |
VideoAnalyzer预设
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.VideoAnalyzerPreset”(必需) |
音频语言 | 使用“语言标记区域”的 BCP-47 格式(例如“en-US”)输入中的音频有效负载的语言。 如果知道内容的语言,建议指定它。 必须为 AudioAnalysisMode::Basic 显式指定语言,因为基本模式下不包括自动语言检测。 如果未指定语言或设置为 null,则自动语言检测将选择检测到的第一种语言,并在文件的持续时间内使用所选语言进行处理。 它目前不支持在检测到第一种语言后动态切换语言。 自动检测最适用于具有清晰辨别语音的录音。 如果自动检测找不到语言,则听录将回退到“en-US”。”此处提供了支持的语言列表: https://go.microsoft.com/fwlink/?linkid=2109463 | 字符串 |
experimental选项 | 包含预设本身中未公开的参数的键值对的字典 | AudioAnalyzerPresetExperimentalOptions |
insightsToExtract | 定义希望服务生成的见解类型。 允许的值为“AudioInsightsOnly”、“VideoInsightsOnly”和“AllInsights”。 默认值为 AllInsights。 如果将此项设置为 AllInsights,并且输入仅为音频,则仅生成音频见解。 同样,如果输入仅是视频,则仅生成视频见解。 如果希望某些输入仅成为视频,建议不要使用 AudioInsightsOnly;如果希望某些输入仅音频,请使用 VideoInsightsOnly。 处于此类条件的作业将出错。 | “AllInsights” “AudioInsightsOnly” “VideoInsightsOnly” |
模式 | 确定要执行的音频分析作集。 如果未指定,则会选择标准 AudioAnalysisMode。 | “Basic” “Standard” |
视频叠加
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.VideoOverlay”(必需) |
cropRectangle 的 | 用于裁剪覆盖图像或视频的可选矩形窗口。 | 矩形 |
不透明度 | 覆盖的不透明度。 这是 [0 - 1.0] 范围内的值。 默认值为 1.0,表示覆盖不透明。 | 整数 (int) |
职位 | 应用覆盖层的输入视频中的位置。 | 矩形 |
ARM 模板资源定义
可以使用目标作部署 mediaServices/transforms 资源类型:
- 资源组 - 请参阅 资源组部署命令
有关每个 API 版本中已更改属性的列表,请参阅 更改日志。
资源格式
若要创建 Microsoft.Media/mediaServices/transforms 资源,请将以下 JSON 添加到模板。
{
"type": "Microsoft.Media/mediaServices/transforms",
"apiVersion": "2022-07-01",
"name": "string",
"properties": {
"description": "string",
"outputs": [
{
"onError": "string",
"preset": {
"@odata.type": "string"
// For remaining properties, see Preset objects
},
"relativePriority": "string"
}
]
}
}
预设对象
设置 @odata.type 属性以指定对象的类型。
对于 #Microsoft.Media.VideoAnalyzerPreset,请使用:
{
"@odata.type": "#Microsoft.Media.VideoAnalyzerPreset",
"audioLanguage": "string",
"experimentalOptions": {
"{customized property}": "string"
},
"insightsToExtract": "string",
"mode": "string"
}
对于 #Microsoft.Media.BuiltInStandardEncoderPreset,请使用:
{
"@odata.type": "#Microsoft.Media.BuiltInStandardEncoderPreset",
"configurations": {
"complexity": "string",
"interleaveOutput": "string",
"keyFrameIntervalInSeconds": "int",
"maxBitrateBps": "int",
"maxHeight": "int",
"maxLayers": "int",
"minBitrateBps": "int",
"minHeight": "int"
},
"presetName": "string"
}
对于 #Microsoft.Media.FaceDetectorPreset,请使用:
{
"@odata.type": "#Microsoft.Media.FaceDetectorPreset",
"blurType": "string",
"experimentalOptions": {
"{customized property}": "string"
},
"mode": "string",
"resolution": "string"
}
对于 #Microsoft.Media.StandardEncoderPreset,请使用:
{
"@odata.type": "#Microsoft.Media.StandardEncoderPreset",
"codecs": [ {
"label": "string",
"@odata.type": "string"
// For remaining properties, see Codec objects
} ],
"experimentalOptions": {
"{customized property}": "string"
},
"filters": {
"crop": {
"height": "string",
"left": "string",
"top": "string",
"width": "string"
},
"deinterlace": {
"mode": "string",
"parity": "string"
},
"fadeIn": {
"duration": "string",
"fadeColor": "string",
"start": "string"
},
"fadeOut": {
"duration": "string",
"fadeColor": "string",
"start": "string"
},
"overlays": [ {
"audioGainLevel": "int",
"end": "string",
"fadeInDuration": "string",
"fadeOutDuration": "string",
"inputLabel": "string",
"start": "string",
"@odata.type": "string"
// For remaining properties, see Overlay objects
} ],
"rotation": "string"
},
"formats": [ {
"filenamePattern": "string",
"@odata.type": "string"
// For remaining properties, see Format objects
} ]
}
设置对象格式
设置 @odata.type 属性以指定对象的类型。
对于 #Microsoft.Media.JpgFormat,请使用:
{
"@odata.type": "#Microsoft.Media.JpgFormat"
}
对于 #Microsoft.Media.PngFormat,请使用:
{
"@odata.type": "#Microsoft.Media.PngFormat"
}
对于 #Microsoft.Media.Mp4Format,请使用:
{
"@odata.type": "#Microsoft.Media.Mp4Format",
"outputFiles": [
{
"labels": [ "string" ]
}
]
}
对于 #Microsoft.Media.TransportStreamFormat,请使用:
{
"@odata.type": "#Microsoft.Media.TransportStreamFormat",
"outputFiles": [
{
"labels": [ "string" ]
}
]
}
编解码器对象
设置 @odata.type 属性以指定对象的类型。
对于 #Microsoft.Media.AacAudio,请使用:
{
"@odata.type": "#Microsoft.Media.AacAudio",
"bitrate": "int",
"channels": "int",
"profile": "string",
"samplingRate": "int"
}
对于 #Microsoft.Media.DDAudio,请使用:
{
"@odata.type": "#Microsoft.Media.DDAudio",
"bitrate": "int",
"channels": "int",
"samplingRate": "int"
}
对于 #Microsoft.Media.CopyAudio,请使用:
{
"@odata.type": "#Microsoft.Media.CopyAudio"
}
对于 #Microsoft.Media.CopyVideo,请使用:
{
"@odata.type": "#Microsoft.Media.CopyVideo"
}
对于 #Microsoft.Media.H264Video,请使用:
{
"@odata.type": "#Microsoft.Media.H264Video",
"complexity": "string",
"keyFrameInterval": "string",
"layers": [
{
"adaptiveBFrame": "bool",
"bFrames": "int",
"bitrate": "int",
"bufferWindow": "string",
"crf": "int",
"entropyMode": "string",
"frameRate": "string",
"height": "string",
"label": "string",
"level": "string",
"maxBitrate": "int",
"profile": "string",
"referenceFrames": "int",
"slices": "int",
"width": "string"
}
],
"rateControlMode": "string",
"sceneChangeDetection": "bool",
"stretchMode": "string",
"syncMode": "string"
}
对于 #Microsoft.Media.H265Video,请使用:
{
"@odata.type": "#Microsoft.Media.H265Video",
"complexity": "string",
"keyFrameInterval": "string",
"layers": [
{
"adaptiveBFrame": "bool",
"bFrames": "int",
"bitrate": "int",
"bufferWindow": "string",
"crf": "int",
"frameRate": "string",
"height": "string",
"label": "string",
"level": "string",
"maxBitrate": "int",
"profile": "string",
"referenceFrames": "int",
"slices": "int",
"width": "string"
}
],
"sceneChangeDetection": "bool",
"stretchMode": "string",
"syncMode": "string"
}
对于 #Microsoft.Media.JpgImage,请使用:
{
"@odata.type": "#Microsoft.Media.JpgImage",
"keyFrameInterval": "string",
"layers": [
{
"height": "string",
"label": "string",
"quality": "int",
"width": "string"
}
],
"range": "string",
"spriteColumn": "int",
"start": "string",
"step": "string",
"stretchMode": "string",
"syncMode": "string"
}
对于 #Microsoft.Media.PngImage,请使用:
{
"@odata.type": "#Microsoft.Media.PngImage",
"keyFrameInterval": "string",
"layers": [
{
"height": "string",
"label": "string",
"width": "string"
}
],
"range": "string",
"start": "string",
"step": "string",
"stretchMode": "string",
"syncMode": "string"
}
覆盖对象
设置 @odata.type 属性以指定对象的类型。
对于 #Microsoft.Media.AudioOverlay,请使用:
{
"@odata.type": "#Microsoft.Media.AudioOverlay"
}
对于 #Microsoft.Media.VideoOverlay,请使用:
{
"@odata.type": "#Microsoft.Media.VideoOverlay",
"cropRectangle": {
"height": "string",
"left": "string",
"top": "string",
"width": "string"
},
"opacity": "int",
"position": {
"height": "string",
"left": "string",
"top": "string",
"width": "string"
}
}
属性值
音频
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.AacAudio”(必需) |
比特率 | 输出编码音频的比特率(以位/秒为单位)。 | 整数 (int) |
渠道 | 音频中的声道数。 | 整数 (int) |
简介 | 使用 AAC 编码音频时使用的编码配置文件。 | “AacLc” “HeaacV1” “HeaacV2” |
采样率 | 用于以赫茨编码的采样率。 | 整数 (int) |
AudioAnalyzerPresetExperimentalOptions
名称 | DESCRIPTION | 价值 |
---|
音频叠加
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.AudioOverlay”(必需) |
BuiltInStandardEncoderPreset
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.BuiltInStandardEncoderPreset”(必需) |
配置 | 编码器的可选配置设置。 仅 ContentAwareEncoding 和 H265ContentAwareEncoding BuiltInStandardEncoderPreset 支持配置。 | PresetConfigurations |
预设名称 | 用于编码视频的内置预设。 | “AACGoodQualityAudio” “AdaptiveStreaming” “ContentAwareEncoding” “ContentAwareEncodingExperimental” “CopyAllBitrateNonInterleaved” “DDGoodQualityAudio” 'H264MultipleBitrate1080p' 'H264MultipleBitrate720p' 'H264MultipleBitrateSD' 'H264SingleBitrate1080p' 'H264SingleBitrate720p' 'H264SingleBitrateSD' “H265AdaptiveStreaming” “H265ContentAwareEncoding” 'H265SingleBitrate1080p' “H265SingleBitrate4K” “H265SingleBitrate720p”(必需) |
编 解码 器
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 对于 AacAudio 类型,设置为“#Microsoft.Media.AacAudio”。 对于 类型 DDAudio,设置为“#Microsoft.Media.DDAudio”。 对于 Type CopyAudio,设置为“#Microsoft.Media.CopyAudio”。 对于 CopyVideo 类型,设置为“#Microsoft.Media.CopyVideo”。 对于 H264Video,设置为“#Microsoft.Media.H264Video”。 对于 H265Video 类型,设置为“#Microsoft.Media.H265Video”。 对于 JpgImage 类型,设置为“#Microsoft.Media.JpgImage”。 对于 PngImage 类型,设置为“#Microsoft.Media.PngImage”。 | '#Microsoft.Media.AacAudio' “#Microsoft.Media.CopyAudio” “#Microsoft.Media.CopyVideo” '#Microsoft.Media.DDAudio' “#Microsoft.Media.H264视频” “#Microsoft.Media.H265视频” '#Microsoft.Media.JpgImage' “#Microsoft.Media.PngImage”(必需) |
标签 | 编解码器的可选标签。 该标签可用于控制复用行为。 | 字符串 |
复制音频
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.CopyAudio”(必需) |
复制视频
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.CopyVideo”(必需) |
DDAudio
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | '#Microsoft.Media.DDAudio' (必需) |
比特率 | 输出编码音频的比特率(以位/秒为单位)。 | 整数 (int) |
渠道 | 音频中的声道数。 | 整数 (int) |
采样率 | 用于以赫茨编码的采样率。 | 整数 (int) |
Deinterlace (取消交错)
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | 反交错模式。 默认为 AutoPixelAdaptive。 | “AutoPixelAdaptive” “关闭” |
平价 | 取消交错的字段奇偶校验默认为“自动”。 | “Auto” “BottomFieldFirst” “TopFieldFirst” |
FaceDetector预设
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.FaceDetectorPreset”(必需) |
blurType | 模糊类型 | “Black” “Box” “High” “Low” “Med” |
experimental选项 | 包含预设本身中未公开的参数的键值对的字典 | FaceDetectorPresetExperimentalOptions |
模式 | 此模式提供在以下设置之间进行选择的功能:1) 分析 - 仅用于检测。此模式生成元数据 JSON 文件,用于标记整个视频中人脸的外观。如果可能,同一人的外观将分配相同的 ID。2) 组合 - 此外,检测到人脸的编辑(模糊)。 3) 修订 - 这可实现 2 次传递过程,允许选择性地编辑检测到的人脸子集。它采用先前分析传递中的元数据文件以及源视频,以及需要修订的用户选择的 ID 子集。 | “分析” “Combined” “Redact” |
解决方法 | 指定分析视频的最大分辨率。 默认行为为“SourceResolution”,在分析时将输入视频保留为其原始分辨率。 使用“StandardDefinition”会将输入视频调整为标准定义,同时保留适当的纵横比。 仅当视频分辨率较高时,它才会调整大小。 例如,在处理之前,1920x1080 输入将缩放为 640x360。 切换到“StandardDefinition”可以减少处理高分辨率视频所需的时间。 它还可能会降低使用此组件的成本(有关详细信息 https://azure.microsoft.com/en-us/pricing/details/media-services/#analytics )。 但是,可能无法检测到在调整大小的视频中最终太小的人脸。 | “SourceResolution” “StandardDefinition” |
FaceDetectorPresetExperimentalOptions
名称 | DESCRIPTION | 价值 |
---|
褪色
名称 | DESCRIPTION | 价值 |
---|---|---|
持续时间 | 视频中淡出效果的持续时间。 该值可以采用 ISO 8601 格式(例如,PT05S 在 5 秒内淡入/淡出颜色),或帧计数(例如,10 到从开始时间淡化 10 帧),或流持续时间的相对值(例如,10% 淡化 10% 流持续时间) | string (必需) |
淡化颜色 | 淡入/淡出的颜色。它可以位于 CSS Level1 颜色 https://developer.mozilla.org/en-US/docs/Web/CSS/color_value/color_keywords 或 RGB/十六进制值上:例如 rgb(255,0,0),0xFF0000或 #FF0000 | string (必需) |
开始 | 输入视频中开始淡出的位置。 该值可以采用 ISO 8601 格式(例如 PT05S 以 5 秒开始),或帧计数(例如,从第 10 帧开始)或流持续时间的相对值(例如,10% 从流持续时间的 10% 开始)。 默认值为 0 | 字符串 |
过滤 器
名称 | DESCRIPTION | 价值 |
---|---|---|
作物 | 用于裁剪输入视频的矩形窗口的参数。 | 矩形 |
取消交错 | 反交错设置。 | Deinterlace (取消交错) |
淡入 | 描述应用于输入媒体的淡化效果的属性。 | 褪色 |
淡出 | 描述应用于输入媒体的淡化效果的属性。 | 褪色 |
覆盖 | 要应用于输入视频的覆盖层的属性。 这些可能是音频、图像或视频覆盖层。 | 覆盖层[] |
旋转 | 在对输入视频进行编码之前,要应用于输入视频的旋转(如果有)。 默认值为“自动” | “Auto” “None” “Rotate0” “Rotate180” “Rotate270” “Rotate90” |
格式
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 对于 JpgFormat 类型,设置为“#Microsoft.Media.JpgFormat”。 设置为类型 为 PngFormat 的“#Microsoft.Media.PngFormat”。 对于 Mp4Format 类型,设置为“#Microsoft.Media.Mp4Format”。 对于 TransportStreamFormat,设置为“#Microsoft.Media.TransportStreamFormat”。 | '#Microsoft.Media.JpgFormat' '#Microsoft.Media.Mp4Format' '#Microsoft.Media.PngFormat' “#Microsoft.Media.TransportStreamFormat”(必需) |
filenamePattern | 用于创建输出文件的文件命名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件名称的扩展宏。 如果输入视频文件的基名称(不包括文件后缀)长度小于 32 个字符,将使用输入视频文件的基名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号(从 1 开始)。 {Bitrate} - 以 kbps 为单位的音频/视频比特率。 不适用于缩略图。 {编解码器} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未提交的宏都将折叠并从文件名中删除。 | string (必需) |
H264层
名称 | DESCRIPTION | 价值 |
---|---|---|
adaptiveBFrame | 是否在编码此层时使用自适应 B 帧。 如果未指定,则每当视频配置文件允许其使用时,编码器都会打开它。 | 布尔 |
b帧 | 编码此层时要使用的 B 帧数。 如果未指定,编码器将根据视频配置文件和级别选择适当的数字。 | 整数 (int) |
比特率 | 生成此层时,每秒要对输入视频进行编码的平均比特率(以比特/秒为单位)。 这是必填字段。 | int (必需) |
缓冲窗口 | VBV 缓冲区窗口长度。 该值应采用 ISO 8601 格式。 该值应位于 [0.1-100] 秒范围内。 默认值为 5 秒(例如 PT5S)。 | 字符串 |
CRF | 编码此层时要使用的 CRF 值。 当在 CRF 模式下设置视频编解码器的 RateControlMode 时,此设置生效。 CRF 值的范围介于 0 和 51 之间,其中较低的值会导致质量更好,代价是文件大小较高。 较高的值意味着更多的压缩,但在某些时候会注意到质量下降。 默认值为 23。 | 整数 (int) |
熵模式 | 要用于此层的萎缩模式。 如果未指定,编码器将选择适合配置文件和级别的模式。 | “Cabac” “Cavlc” |
帧率 | 要对此层进行编码的帧速率(以每秒帧为单位)。 该值可以采用 M/N 的形式,其中 M 和 N 是整数(例如,30000/1001),也可以以数字的形式(例如,30 或 29.97)。 编码器根据配置文件和级别对允许的帧速率强制实施约束。 如果未指定,编码器将使用与输入视频相同的帧速率。 | 字符串 |
身高 | 此层的输出视频的高度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的高度为一半的像素(与输入相同)。 | 字符串 |
标签 | 此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 | 字符串 |
水平 | 我们目前支持高达 6.2 的级别。 该值可以是“自动”,也可以是与 H.264 配置文件匹配的数字。 如果未指定,则默认值为“自动”,允许编码器选择适合此层的级别。 | 字符串 |
最大比特率 | 最大比特率(以比特/秒为单位),其中应假定 VBV 缓冲区重新填充。 如果未指定,则默认为与比特率相同的值。 | 整数 (int) |
简介 | 我们目前支持基线、Main、High、High422、High444。 默认值为“自动”。 | “Auto” “Baseline” “High” “High422” “High444” “Main” |
referenceFrames | 编码此层时要使用的引用帧数。 如果未指定,编码器会根据编码器复杂性设置确定适当的数字。 | 整数 (int) |
片 | 编码此层时要使用的切片数。 如果未指定,则默认值为零,这意味着编码器将为每个帧使用单个切片。 | 整数 (int) |
宽度 | 此层的输出视频的宽度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的宽度与输入的宽度相等一半。 | 字符串 |
H264视频
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.H264Video”(必需) |
复杂性 | 告知编码器如何选择其编码设置。 默认值为“平衡”。 | “平衡” “质量” “速度” |
keyFrameInterval 键帧间隔 | 两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒(PT2S)。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 | 字符串 |
层 | 要由编码器生成的输出 H.264 层的集合。 | H264层[] |
rateControlMode | 视频速率控制模式 | “ABR” “CBR” “CRF” |
sceneChangeDetection | 编码器是否应在场景更改时插入关键帧。 如果未指定,则默认值为 false。 仅当编码器配置为生成单个输出视频时,才应将此标志设置为 true。 | 布尔 |
stretchMode (拉伸模式) | 调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率。 默认值为 AutoSize | “AutoFit” “AutoSize” “None” |
syncMode 同步模式 | 视频同步模式 | “Auto” 'Cfr' “直通” “Vfr” |
H265层
名称 | DESCRIPTION | 价值 |
---|---|---|
adaptiveBFrame | 指定是否在编码此层时使用自适应 B 帧。 如果未指定,则每当视频配置文件允许其使用时,编码器都会打开它。 | 布尔 |
b帧 | 编码此层时要使用的 B 帧数。 如果未指定,编码器将根据视频配置文件和级别选择适当的数字。 | 整数 (int) |
比特率 | 生成此层时,每秒要对输入视频进行编码的平均比特率(以比特/秒为单位)。 例如:目标比特率为 3000Kbps 或 3Mbps 表示此值应为 3000000。这是必填字段。 | int (必需) |
缓冲窗口 | VBV 缓冲区窗口长度。 该值应采用 ISO 8601 格式。 该值应位于 [0.1-100] 秒范围内。 默认值为 5 秒(例如 PT5S)。 | 字符串 |
CRF | 编码此层时要使用的 CRF 值。 当在 CRF 模式下设置视频编解码器的 RateControlMode 时,此设置生效。 CRF 值的范围介于 0 和 51 之间,其中较低的值会导致质量更好,代价是文件大小较高。 较高的值意味着更多的压缩,但在某些时候会注意到质量下降。 默认值为 28。 | 整数 (int) |
帧率 | 要对此层进行编码的帧速率(以每秒帧为单位)。 该值可以采用 M/N 的形式,其中 M 和 N 是整数(例如,30000/1001),也可以以数字的形式(例如,30 或 29.97)。 编码器根据配置文件和级别对允许的帧速率强制实施约束。 如果未指定,编码器将使用与输入视频相同的帧速率。 | 字符串 |
身高 | 此层的输出视频的高度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的高度为一半的像素(与输入相同)。 | 字符串 |
标签 | 此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 | 字符串 |
水平 | 我们目前支持高达 6.2 的级别。 该值可以是“自动”,也可以是与 H.265 配置文件匹配的数字。 如果未指定,则默认值为“自动”,允许编码器选择适合此层的级别。 | 字符串 |
最大比特率 | 最大比特率(以比特/秒为单位),其中应假定 VBV 缓冲区重新填充。 如果未指定,则默认为与比特率相同的值。 | 整数 (int) |
简介 | 我们目前支持 Main。 默认值为“自动”。 | “Auto” “Main” “Main10” |
referenceFrames | 编码此层时要使用的引用帧数。 如果未指定,编码器会根据编码器复杂性设置确定适当的数字。 | 整数 (int) |
片 | 编码此层时要使用的切片数。 如果未指定,则默认值为零,这意味着编码器将为每个帧使用单个切片。 | 整数 (int) |
宽度 | 此层的输出视频的宽度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的宽度与输入的宽度相等一半。 | 字符串 |
H265视频
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.H265Video”(必需) |
复杂性 | 告知编码器如何选择其编码设置。 质量将提供更高的压缩率,但成本更高,计算时间更长。 速度将产生一个相对较大的文件,但速度更快且更经济。 默认值为“平衡”。 | “平衡” “质量” “速度” |
keyFrameInterval 键帧间隔 | 两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒(PT2S)。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 | 字符串 |
层 | 要由编码器生成的输出 H.265 层的集合。 | H265层[] |
sceneChangeDetection | 指定编码器是否应在场景更改时插入关键帧。 如果未指定,则默认值为 false。 仅当编码器配置为生成单个输出视频时,才应将此标志设置为 true。 | 布尔 |
stretchMode (拉伸模式) | 调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率。 默认值为 AutoSize | “AutoFit” “AutoSize” “None” |
syncMode 同步模式 | 视频同步模式 | “Auto” 'Cfr' “直通” “Vfr” |
JPG 格式
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.JpgFormat”(必需) |
Jpg图片
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.JpgImage”(必需) |
keyFrameInterval 键帧间隔 | 两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒(PT2S)。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 | 字符串 |
层 | 要由编码器生成的输出 JPEG 图像层的集合。 | JpgLayer[] |
范围 | 相对于在输入视频中转换预设开始时间的位置,在该视频中停止生成缩略图。 该值可以采用 ISO 8601 格式(例如,PT5M30S从开始时间停止 5 分 30 秒)或帧计数(例如,从开始时从帧的第 300 帧停止的 300 个帧)。如果此值为 1,则表示仅在开始时间生成一个缩略图,或流持续时间的相对值(例如,50% 从开始时间停止流持续时间的一半)。 默认值为 100%,这意味着在流末尾停止。 | 字符串 |
spriteColumn | 设置缩略图子画面图像中使用的列数。 自动计算行数,并使用子画面中每个缩略图的坐标映射生成 VTT 文件。 注意:此值应为正整数,建议使用适当的值,以便输出图像分辨率不会超出 JPEG 最大像素分辨率限制 65535x65535。 | 整数 (int) |
开始 | 输入视频中开始生成缩略图的位置。 该值可以采用 ISO 8601 格式(例如 PT05S 以 5 秒开始),或帧计数(例如,从第 10 帧开始)或流持续时间的相对值(例如,10% 从流持续时间的 10% 开始)。 此外还支持宏 {Best},该宏告知编码器从视频的前几秒钟中选择最佳缩略图,并且无论步骤和范围的其他设置如何,都将仅生成一个缩略图。 默认值为宏 {Best}。 | string (必需) |
步 | 生成缩略图的间隔。 该值可以采用 ISO 8601 格式(例如,每 5 秒一张图像的 PT05S)或帧计数(例如,每 30 帧一张图像 30 张)或流持续时间的相对值(例如,每 10 个流持续时间每 10% 一张图像的 10%)。 注意:步骤值将影响第一个生成的缩略图,这可能不是在转换预设开始时间指定的缩略图。 这是由于编码器,它尝试从开始时间和步骤位置之间选择最佳缩略图作为第一个输出。 由于默认值为 10%,这意味着如果流具有较长的持续时间,则第一个生成的缩略图可能远离在开始时间指定的缩略图。 如果第一个缩略图预期接近开始时间,请尝试为 Step 选择合理的值,或者在开始时仅需要一个缩略图时将 Range 值设置为 1。 | 字符串 |
stretchMode (拉伸模式) | 调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率。 默认值为 AutoSize | “AutoFit” “AutoSize” “None” |
syncMode 同步模式 | 视频同步模式 | “Auto” 'Cfr' “直通” “Vfr” |
Jpg 图层
名称 | DESCRIPTION | 价值 |
---|---|---|
身高 | 此层的输出视频的高度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的高度为一半的像素(与输入相同)。 | 字符串 |
标签 | 此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 | 字符串 |
质量 | JPEG 输出的压缩质量。 范围为 0-100,默认值为 70。 | 整数 (int) |
宽度 | 此层的输出视频的宽度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的宽度与输入的宽度相等一半。 | 字符串 |
Microsoft.Media/mediaServices/transforms
名称 | DESCRIPTION | 价值 |
---|---|---|
apiVersion | API 版本 | '2022-07-01' |
姓名 | 资源名称 | string (必需) |
属性 | 资源属性。 | TransformProperties (变换属性) |
类型 | 资源类型 | “Microsoft.Media/mediaServices/transforms” |
Mp4格式
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.Mp4Format”(必需) |
outputFiles (输出文件) | 要生成的输出文件的列表。 列表中的每个条目都是一组要一起复用的音频和视频层标签。 | 输出文件[] |
输出文件
名称 | DESCRIPTION | 价值 |
---|---|---|
标签 | 描述编码器如何将视频和音频多路复用到输出文件中的标签列表。 例如,如果编码器正在生成带有标签 v1 和 v2 的两个视频层,以及一个带有标签 a1 的音频层,则“[v1, a1]”等数组会告知编码器生成一个输出文件,其中包含 v1 表示的视频轨迹和 a1 表示的音频轨迹。 | string[] (必需) |
覆盖
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 对于 Type AudioOverlay,设置为“#Microsoft.Media.AudioOverlay”。 对于 VideoOverlay 类型,设置为“#Microsoft.Media.VideoOverlay”。 | “#Microsoft.Media.AudioOverlay” “#Microsoft.Media.VideoOverlay”(必需) |
audioGainLevel 音频增益级别 | 覆盖中的音频增益级别。 该值应位于 [0, 1.0] 范围内。 默认值为 1.0。 | 整数 (int) |
结束 | 结束位置,引用输入视频,覆盖结束。 该值应采用 ISO 8601 格式。 例如,PT30S 在输入视频中以 30 秒结束覆盖。 如果未指定或值大于输入视频持续时间,则在覆盖媒体持续时间大于输入视频持续时间时,将应用覆盖层,直到输入视频结束,否则覆盖将持续到覆盖媒体持续时间。 | 字符串 |
淡化持续时间 | 覆盖逐渐淡入输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定默认行为,则不会淡入(与 PT0S 相同)。 | 字符串 |
淡出持续时间 | 覆盖逐渐淡出输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定默认行为,则不会淡出(与 PT0S 相同)。 | 字符串 |
inputLabel (输入标签) | 要用作覆盖的作业输入的标签。 输入必须指定一个文件。 可以使用 JPG、PNG、GIF 或 BMP 格式或音频文件(如 WAV、MP3、WMA 或 M4A 文件)或视频文件指定图像文件。 请参阅 https://aka.ms/mesformats 支持的音频和视频文件格式的完整列表。 | string (必需) |
开始 | 开始位置,引用输入视频,覆盖开始。 该值应采用 ISO 8601 格式。 例如,PT05S 在输入视频中的 5 秒处启动覆盖。 如果未指定覆盖层,则从输入视频的开头开始。 | 字符串 |
Png格式
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.PngFormat”(必需) |
Png图像
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.PngImage”(必需) |
keyFrameInterval 键帧间隔 | 两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒(PT2S)。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 | 字符串 |
层 | 要由编码器生成的输出 PNG 图像层的集合。 | PngLayer[] |
范围 | 相对于在输入视频中转换预设开始时间的位置,在该视频中停止生成缩略图。 该值可以采用 ISO 8601 格式(例如,PT5M30S从开始时间停止 5 分 30 秒)或帧计数(例如,从开始时从帧的第 300 帧停止的 300 个帧)。如果此值为 1,则表示仅在开始时间生成一个缩略图,或流持续时间的相对值(例如,50% 从开始时间停止流持续时间的一半)。 默认值为 100%,这意味着在流末尾停止。 | 字符串 |
开始 | 输入视频中开始生成缩略图的位置。 该值可以采用 ISO 8601 格式(例如 PT05S 以 5 秒开始),或帧计数(例如,从第 10 帧开始)或流持续时间的相对值(例如,10% 从流持续时间的 10% 开始)。 此外还支持宏 {Best},该宏告知编码器从视频的前几秒钟中选择最佳缩略图,并且无论步骤和范围的其他设置如何,都将仅生成一个缩略图。 默认值为宏 {Best}。 | string (必需) |
步 | 生成缩略图的间隔。 该值可以采用 ISO 8601 格式(例如,每 5 秒一张图像的 PT05S)或帧计数(例如,每 30 帧一张图像 30 张)或流持续时间的相对值(例如,每 10 个流持续时间每 10% 一张图像的 10%)。 注意:步骤值将影响第一个生成的缩略图,这可能不是在转换预设开始时间指定的缩略图。 这是由于编码器,它尝试从开始时间和步骤位置之间选择最佳缩略图作为第一个输出。 由于默认值为 10%,这意味着如果流具有较长的持续时间,则第一个生成的缩略图可能远离在开始时间指定的缩略图。 如果第一个缩略图预期接近开始时间,请尝试为 Step 选择合理的值,或者在开始时仅需要一个缩略图时将 Range 值设置为 1。 | 字符串 |
stretchMode (拉伸模式) | 调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率。 默认值为 AutoSize | “AutoFit” “AutoSize” “None” |
syncMode 同步模式 | 视频同步模式 | “Auto” 'Cfr' “直通” “Vfr” |
Png图层
名称 | DESCRIPTION | 价值 |
---|---|---|
身高 | 此层的输出视频的高度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的高度为一半的像素(与输入相同)。 | 字符串 |
标签 | 此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 | 字符串 |
宽度 | 此层的输出视频的宽度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的宽度与输入的宽度相等一半。 | 字符串 |
预设
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 对于 VideoAnalyzerPreset 类型,设置为“#Microsoft.Media.VideoAnalyzerPreset”。 对于 BuiltInStandardEncoderPreset,设置为“#Microsoft.Media.BuiltInStandardEncoderPreset”。 对于 FaceDetectorPreset 类型,设置为“#Microsoft.Media.FaceDetectorPreset”。 对于 StandardEncoderPreset 类型,设置为“#Microsoft.Media.StandardEncoderPreset”。 | “#Microsoft.Media.BuiltInStandardEncoderPreset” “#Microsoft.Media.FaceDetectorPreset” “#Microsoft.Media.StandardEncoderPreset” “#Microsoft.Media.VideoAnalyzerPreset”(必需) |
PresetConfigurations
名称 | DESCRIPTION | 价值 |
---|---|---|
复杂性 | 允许配置编码器设置,以控制速度和质量之间的平衡。 示例:将复杂性设置为“速度”,以提高编码速度,但压缩效率较低。 | “平衡” “质量” “速度” |
interleaveOutput (交错输出) | 设置输出的交错模式,以控制音频和视频如何以容器格式存储。 示例:将 InterleavedOutput 设置为 NonInterleavedOutput,以在单独的 MP4 文件中生成仅音频和仅视频输出。 | “InterleavedOutput” “NonInterleavedOutput” |
keyFrameIntervalInSeconds | 关键帧间隔(以秒为单位)。 示例:将 KeyFrameIntervalInSeconds 设置为 2 以减少某些玩家的播放缓冲。 | 整数 (int) |
最大比特率 Bps | 最大比特率(每秒位数)(最高视频层的阈值)。 示例:将 MaxBitrateBps 设置为 6000000,以避免为具有较高复杂性的内容生成非常高的比特率输出。 | 整数 (int) |
最大高度 | 输出视频层的最大高度。 示例:将 MaxHeight 设置为 720 以生成高达 720P 的输出层,即使输入为 4K 也是如此。 | 整数 (int) |
最大层数 | 输出视频层的最大数目。 示例:将 MaxLayers 设置为 4,以确保生成最多 4 个输出层,以控制编码作业的总体成本。 | 整数 (int) |
最小比特率 Bps | 最小比特率(每秒位数)(底层视频层的阈值)。 示例:将 MinBitrateBps 设置为 200000,其底层覆盖网络带宽较低的用户。 | 整数 (int) |
minHeight | 输出视频层的最小高度。 示例:将 MinHeight 设置为 360,以避免输出层较小的分辨率,例如 180P。 | 整数 (int) |
矩形
名称 | DESCRIPTION | 价值 |
---|---|---|
身高 | 矩形区域的高度(以像素为单位)。 这可以是绝对像素值(例如 100),也可以相对于视频的大小(例如,50%)。 | 字符串 |
左 | 左边距中的像素数。 这可以是绝对像素值(例如 100),也可以相对于视频的大小(例如,50%)。 | 字符串 |
顶部 | 上边距中的像素数。 这可以是绝对像素值(例如 100),也可以相对于视频的大小(例如,50%)。 | 字符串 |
宽度 | 矩形区域的宽度(以像素为单位)。 这可以是绝对像素值(例如 100),也可以相对于视频的大小(例如,50%)。 | 字符串 |
StandardEncoderPreset
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.StandardEncoderPreset”(必需) |
编 解码 器 | 编码输入视频时要使用的编解码器列表。 | 编解码器[] (必需) |
experimental选项 | 包含预设本身中未公开的参数的键值对的字典 | StandardEncoderPresetExperimentalOptions |
筛选器 | 编码前应用于输入媒体的一个或多个筛选作。 | 过滤 器 |
格式 | 要由编码器生成的输出列表。 | Format[] (必需) |
StandardEncoderPresetExperimentalOptions
名称 | DESCRIPTION | 价值 |
---|
TransformOutput (变换输出)
名称 | DESCRIPTION | 价值 |
---|---|---|
onError 错误 | 转换可以定义多个输出。 此属性定义服务在一个输出失败时应执行的作 - 继续生成其他输出,或者停止其他输出。 总体作业状态不会反映使用“ContinueJob”指定的输出失败。 默认值为“StopProcessingJob”。 | “ContinueJob” “StopProcessingJob” |
预设 | 描述将用于修改、转码或从源文件中提取见解以生成输出的作的预设。 | 预设 (必需) |
relativePriority | 设置 Transform 中的 TransformOutputs 的相对优先级。 这会设置服务用于处理 TransformOutputs 的优先级。 默认优先级为 Normal。 | “High” “Low” “Normal” |
TransformProperties (变换属性)
名称 | DESCRIPTION | 价值 |
---|---|---|
描述 | 转换的可选详细描述。 | 字符串 |
输出 | 转换应生成的一个或多个 TransformOutput 的数组。 | TransformOutput[] (必需) |
TransportStreamFormat 格式
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.TransportStreamFormat”(必需) |
outputFiles (输出文件) | 要生成的输出文件的列表。 列表中的每个条目都是一组要一起复用的音频和视频层标签。 | 输出文件[] |
VideoAnalyzer预设
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.VideoAnalyzerPreset”(必需) |
音频语言 | 使用“语言标记区域”的 BCP-47 格式(例如“en-US”)输入中的音频有效负载的语言。 如果知道内容的语言,建议指定它。 必须为 AudioAnalysisMode::Basic 显式指定语言,因为基本模式下不包括自动语言检测。 如果未指定语言或设置为 null,则自动语言检测将选择检测到的第一种语言,并在文件的持续时间内使用所选语言进行处理。 它目前不支持在检测到第一种语言后动态切换语言。 自动检测最适用于具有清晰辨别语音的录音。 如果自动检测找不到语言,则听录将回退到“en-US”。”此处提供了支持的语言列表: https://go.microsoft.com/fwlink/?linkid=2109463 | 字符串 |
experimental选项 | 包含预设本身中未公开的参数的键值对的字典 | AudioAnalyzerPresetExperimentalOptions |
insightsToExtract | 定义希望服务生成的见解类型。 允许的值为“AudioInsightsOnly”、“VideoInsightsOnly”和“AllInsights”。 默认值为 AllInsights。 如果将此项设置为 AllInsights,并且输入仅为音频,则仅生成音频见解。 同样,如果输入仅是视频,则仅生成视频见解。 如果希望某些输入仅成为视频,建议不要使用 AudioInsightsOnly;如果希望某些输入仅音频,请使用 VideoInsightsOnly。 处于此类条件的作业将出错。 | “AllInsights” “AudioInsightsOnly” “VideoInsightsOnly” |
模式 | 确定要执行的音频分析作集。 如果未指定,则会选择标准 AudioAnalysisMode。 | “Basic” “Standard” |
视频叠加
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.VideoOverlay”(必需) |
cropRectangle 的 | 用于裁剪覆盖图像或视频的可选矩形窗口。 | 矩形 |
不透明度 | 覆盖的不透明度。 这是 [0 - 1.0] 范围内的值。 默认值为 1.0,表示覆盖不透明。 | 整数 (int) |
职位 | 应用覆盖层的输入视频中的位置。 | 矩形 |
用法示例
Terraform (AzAPI 提供程序)资源定义
可以使用目标作部署 mediaServices/transforms 资源类型:
- 资源组
有关每个 API 版本中已更改属性的列表,请参阅 更改日志。
资源格式
若要创建 Microsoft.Media/mediaServices/transforms 资源,请将以下 Terraform 添加到模板。
resource "azapi_resource" "symbolicname" {
type = "Microsoft.Media/mediaServices/transforms@2022-07-01"
name = "string"
parent_id = "string"
body = {
properties = {
description = "string"
outputs = [
{
onError = "string"
preset = {
@odata.type = "string"
// For remaining properties, see Preset objects
}
relativePriority = "string"
}
]
}
}
}
预设对象
设置 @odata.type 属性以指定对象的类型。
对于 #Microsoft.Media.VideoAnalyzerPreset,请使用:
{
@odata.type = "#Microsoft.Media.VideoAnalyzerPreset"
audioLanguage = "string"
experimentalOptions = {
{customized property} = "string"
}
insightsToExtract = "string"
mode = "string"
}
对于 #Microsoft.Media.BuiltInStandardEncoderPreset,请使用:
{
@odata.type = "#Microsoft.Media.BuiltInStandardEncoderPreset"
configurations = {
complexity = "string"
interleaveOutput = "string"
keyFrameIntervalInSeconds = int
maxBitrateBps = int
maxHeight = int
maxLayers = int
minBitrateBps = int
minHeight = int
}
presetName = "string"
}
对于 #Microsoft.Media.FaceDetectorPreset,请使用:
{
@odata.type = "#Microsoft.Media.FaceDetectorPreset"
blurType = "string"
experimentalOptions = {
{customized property} = "string"
}
mode = "string"
resolution = "string"
}
对于 #Microsoft.Media.StandardEncoderPreset,请使用:
{
@odata.type = "#Microsoft.Media.StandardEncoderPreset"
codecs = [
{
label = "string"
@odata.type = "string"
// For remaining properties, see Codec objects
}
]
experimentalOptions = {
{customized property} = "string"
}
filters = {
crop = {
height = "string"
left = "string"
top = "string"
width = "string"
}
deinterlace = {
mode = "string"
parity = "string"
}
fadeIn = {
duration = "string"
fadeColor = "string"
start = "string"
}
fadeOut = {
duration = "string"
fadeColor = "string"
start = "string"
}
overlays = [
{
audioGainLevel = int
end = "string"
fadeInDuration = "string"
fadeOutDuration = "string"
inputLabel = "string"
start = "string"
@odata.type = "string"
// For remaining properties, see Overlay objects
}
]
rotation = "string"
}
formats = [
{
filenamePattern = "string"
@odata.type = "string"
// For remaining properties, see Format objects
}
]
}
设置对象格式
设置 @odata.type 属性以指定对象的类型。
对于 #Microsoft.Media.JpgFormat,请使用:
{
@odata.type = "#Microsoft.Media.JpgFormat"
}
对于 #Microsoft.Media.PngFormat,请使用:
{
@odata.type = "#Microsoft.Media.PngFormat"
}
对于 #Microsoft.Media.Mp4Format,请使用:
{
@odata.type = "#Microsoft.Media.Mp4Format"
outputFiles = [
{
labels = [
"string"
]
}
]
}
对于 #Microsoft.Media.TransportStreamFormat,请使用:
{
@odata.type = "#Microsoft.Media.TransportStreamFormat"
outputFiles = [
{
labels = [
"string"
]
}
]
}
编解码器对象
设置 @odata.type 属性以指定对象的类型。
对于 #Microsoft.Media.AacAudio,请使用:
{
@odata.type = "#Microsoft.Media.AacAudio"
bitrate = int
channels = int
profile = "string"
samplingRate = int
}
对于 #Microsoft.Media.DDAudio,请使用:
{
@odata.type = "#Microsoft.Media.DDAudio"
bitrate = int
channels = int
samplingRate = int
}
对于 #Microsoft.Media.CopyAudio,请使用:
{
@odata.type = "#Microsoft.Media.CopyAudio"
}
对于 #Microsoft.Media.CopyVideo,请使用:
{
@odata.type = "#Microsoft.Media.CopyVideo"
}
对于 #Microsoft.Media.H264Video,请使用:
{
@odata.type = "#Microsoft.Media.H264Video"
complexity = "string"
keyFrameInterval = "string"
layers = [
{
adaptiveBFrame = bool
bFrames = int
bitrate = int
bufferWindow = "string"
crf = int
entropyMode = "string"
frameRate = "string"
height = "string"
label = "string"
level = "string"
maxBitrate = int
profile = "string"
referenceFrames = int
slices = int
width = "string"
}
]
rateControlMode = "string"
sceneChangeDetection = bool
stretchMode = "string"
syncMode = "string"
}
对于 #Microsoft.Media.H265Video,请使用:
{
@odata.type = "#Microsoft.Media.H265Video"
complexity = "string"
keyFrameInterval = "string"
layers = [
{
adaptiveBFrame = bool
bFrames = int
bitrate = int
bufferWindow = "string"
crf = int
frameRate = "string"
height = "string"
label = "string"
level = "string"
maxBitrate = int
profile = "string"
referenceFrames = int
slices = int
width = "string"
}
]
sceneChangeDetection = bool
stretchMode = "string"
syncMode = "string"
}
对于 #Microsoft.Media.JpgImage,请使用:
{
@odata.type = "#Microsoft.Media.JpgImage"
keyFrameInterval = "string"
layers = [
{
height = "string"
label = "string"
quality = int
width = "string"
}
]
range = "string"
spriteColumn = int
start = "string"
step = "string"
stretchMode = "string"
syncMode = "string"
}
对于 #Microsoft.Media.PngImage,请使用:
{
@odata.type = "#Microsoft.Media.PngImage"
keyFrameInterval = "string"
layers = [
{
height = "string"
label = "string"
width = "string"
}
]
range = "string"
start = "string"
step = "string"
stretchMode = "string"
syncMode = "string"
}
覆盖对象
设置 @odata.type 属性以指定对象的类型。
对于 #Microsoft.Media.AudioOverlay,请使用:
{
@odata.type = "#Microsoft.Media.AudioOverlay"
}
对于 #Microsoft.Media.VideoOverlay,请使用:
{
@odata.type = "#Microsoft.Media.VideoOverlay"
cropRectangle = {
height = "string"
left = "string"
top = "string"
width = "string"
}
opacity = int
position = {
height = "string"
left = "string"
top = "string"
width = "string"
}
}
属性值
音频
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.AacAudio”(必需) |
比特率 | 输出编码音频的比特率(以位/秒为单位)。 | 整数 (int) |
渠道 | 音频中的声道数。 | 整数 (int) |
简介 | 使用 AAC 编码音频时使用的编码配置文件。 | “AacLc” “HeaacV1” “HeaacV2” |
采样率 | 用于以赫茨编码的采样率。 | 整数 (int) |
AudioAnalyzerPresetExperimentalOptions
名称 | DESCRIPTION | 价值 |
---|
音频叠加
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.AudioOverlay”(必需) |
BuiltInStandardEncoderPreset
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.BuiltInStandardEncoderPreset”(必需) |
配置 | 编码器的可选配置设置。 仅 ContentAwareEncoding 和 H265ContentAwareEncoding BuiltInStandardEncoderPreset 支持配置。 | PresetConfigurations |
预设名称 | 用于编码视频的内置预设。 | “AACGoodQualityAudio” “AdaptiveStreaming” “ContentAwareEncoding” “ContentAwareEncodingExperimental” “CopyAllBitrateNonInterleaved” “DDGoodQualityAudio” 'H264MultipleBitrate1080p' 'H264MultipleBitrate720p' 'H264MultipleBitrateSD' 'H264SingleBitrate1080p' 'H264SingleBitrate720p' 'H264SingleBitrateSD' “H265AdaptiveStreaming” “H265ContentAwareEncoding” 'H265SingleBitrate1080p' “H265SingleBitrate4K” “H265SingleBitrate720p”(必需) |
编 解码 器
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 对于 AacAudio 类型,设置为“#Microsoft.Media.AacAudio”。 对于 类型 DDAudio,设置为“#Microsoft.Media.DDAudio”。 对于 Type CopyAudio,设置为“#Microsoft.Media.CopyAudio”。 对于 CopyVideo 类型,设置为“#Microsoft.Media.CopyVideo”。 对于 H264Video,设置为“#Microsoft.Media.H264Video”。 对于 H265Video 类型,设置为“#Microsoft.Media.H265Video”。 对于 JpgImage 类型,设置为“#Microsoft.Media.JpgImage”。 对于 PngImage 类型,设置为“#Microsoft.Media.PngImage”。 | '#Microsoft.Media.AacAudio' “#Microsoft.Media.CopyAudio” “#Microsoft.Media.CopyVideo” '#Microsoft.Media.DDAudio' “#Microsoft.Media.H264视频” “#Microsoft.Media.H265视频” '#Microsoft.Media.JpgImage' “#Microsoft.Media.PngImage”(必需) |
标签 | 编解码器的可选标签。 该标签可用于控制复用行为。 | 字符串 |
复制音频
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.CopyAudio”(必需) |
复制视频
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.CopyVideo”(必需) |
DDAudio
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | '#Microsoft.Media.DDAudio' (必需) |
比特率 | 输出编码音频的比特率(以位/秒为单位)。 | 整数 (int) |
渠道 | 音频中的声道数。 | 整数 (int) |
采样率 | 用于以赫茨编码的采样率。 | 整数 (int) |
Deinterlace (取消交错)
名称 | DESCRIPTION | 价值 |
---|---|---|
模式 | 反交错模式。 默认为 AutoPixelAdaptive。 | “AutoPixelAdaptive” “关闭” |
平价 | 取消交错的字段奇偶校验默认为“自动”。 | “Auto” “BottomFieldFirst” “TopFieldFirst” |
FaceDetector预设
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.FaceDetectorPreset”(必需) |
blurType | 模糊类型 | “Black” “Box” “High” “Low” “Med” |
experimental选项 | 包含预设本身中未公开的参数的键值对的字典 | FaceDetectorPresetExperimentalOptions |
模式 | 此模式提供在以下设置之间进行选择的功能:1) 分析 - 仅用于检测。此模式生成元数据 JSON 文件,用于标记整个视频中人脸的外观。如果可能,同一人的外观将分配相同的 ID。2) 组合 - 此外,检测到人脸的编辑(模糊)。 3) 修订 - 这可实现 2 次传递过程,允许选择性地编辑检测到的人脸子集。它采用先前分析传递中的元数据文件以及源视频,以及需要修订的用户选择的 ID 子集。 | “分析” “Combined” “Redact” |
解决方法 | 指定分析视频的最大分辨率。 默认行为为“SourceResolution”,在分析时将输入视频保留为其原始分辨率。 使用“StandardDefinition”会将输入视频调整为标准定义,同时保留适当的纵横比。 仅当视频分辨率较高时,它才会调整大小。 例如,在处理之前,1920x1080 输入将缩放为 640x360。 切换到“StandardDefinition”可以减少处理高分辨率视频所需的时间。 它还可能会降低使用此组件的成本(有关详细信息 https://azure.microsoft.com/en-us/pricing/details/media-services/#analytics )。 但是,可能无法检测到在调整大小的视频中最终太小的人脸。 | “SourceResolution” “StandardDefinition” |
FaceDetectorPresetExperimentalOptions
名称 | DESCRIPTION | 价值 |
---|
褪色
名称 | DESCRIPTION | 价值 |
---|---|---|
持续时间 | 视频中淡出效果的持续时间。 该值可以采用 ISO 8601 格式(例如,PT05S 在 5 秒内淡入/淡出颜色),或帧计数(例如,10 到从开始时间淡化 10 帧),或流持续时间的相对值(例如,10% 淡化 10% 流持续时间) | string (必需) |
淡化颜色 | 淡入/淡出的颜色。它可以位于 CSS Level1 颜色 https://developer.mozilla.org/en-US/docs/Web/CSS/color_value/color_keywords 或 RGB/十六进制值上:例如 rgb(255,0,0),0xFF0000或 #FF0000 | string (必需) |
开始 | 输入视频中开始淡出的位置。 该值可以采用 ISO 8601 格式(例如 PT05S 以 5 秒开始),或帧计数(例如,从第 10 帧开始)或流持续时间的相对值(例如,10% 从流持续时间的 10% 开始)。 默认值为 0 | 字符串 |
过滤 器
名称 | DESCRIPTION | 价值 |
---|---|---|
作物 | 用于裁剪输入视频的矩形窗口的参数。 | 矩形 |
取消交错 | 反交错设置。 | Deinterlace (取消交错) |
淡入 | 描述应用于输入媒体的淡化效果的属性。 | 褪色 |
淡出 | 描述应用于输入媒体的淡化效果的属性。 | 褪色 |
覆盖 | 要应用于输入视频的覆盖层的属性。 这些可能是音频、图像或视频覆盖层。 | 覆盖层[] |
旋转 | 在对输入视频进行编码之前,要应用于输入视频的旋转(如果有)。 默认值为“自动” | “Auto” “None” “Rotate0” “Rotate180” “Rotate270” “Rotate90” |
格式
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 对于 JpgFormat 类型,设置为“#Microsoft.Media.JpgFormat”。 设置为类型 为 PngFormat 的“#Microsoft.Media.PngFormat”。 对于 Mp4Format 类型,设置为“#Microsoft.Media.Mp4Format”。 对于 TransportStreamFormat,设置为“#Microsoft.Media.TransportStreamFormat”。 | '#Microsoft.Media.JpgFormat' '#Microsoft.Media.Mp4Format' '#Microsoft.Media.PngFormat' “#Microsoft.Media.TransportStreamFormat”(必需) |
filenamePattern | 用于创建输出文件的文件命名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件名称的扩展宏。 如果输入视频文件的基名称(不包括文件后缀)长度小于 32 个字符,将使用输入视频文件的基名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号(从 1 开始)。 {Bitrate} - 以 kbps 为单位的音频/视频比特率。 不适用于缩略图。 {编解码器} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未提交的宏都将折叠并从文件名中删除。 | string (必需) |
H264层
名称 | DESCRIPTION | 价值 |
---|---|---|
adaptiveBFrame | 是否在编码此层时使用自适应 B 帧。 如果未指定,则每当视频配置文件允许其使用时,编码器都会打开它。 | 布尔 |
b帧 | 编码此层时要使用的 B 帧数。 如果未指定,编码器将根据视频配置文件和级别选择适当的数字。 | 整数 (int) |
比特率 | 生成此层时,每秒要对输入视频进行编码的平均比特率(以比特/秒为单位)。 这是必填字段。 | int (必需) |
缓冲窗口 | VBV 缓冲区窗口长度。 该值应采用 ISO 8601 格式。 该值应位于 [0.1-100] 秒范围内。 默认值为 5 秒(例如 PT5S)。 | 字符串 |
CRF | 编码此层时要使用的 CRF 值。 当在 CRF 模式下设置视频编解码器的 RateControlMode 时,此设置生效。 CRF 值的范围介于 0 和 51 之间,其中较低的值会导致质量更好,代价是文件大小较高。 较高的值意味着更多的压缩,但在某些时候会注意到质量下降。 默认值为 23。 | 整数 (int) |
熵模式 | 要用于此层的萎缩模式。 如果未指定,编码器将选择适合配置文件和级别的模式。 | “Cabac” “Cavlc” |
帧率 | 要对此层进行编码的帧速率(以每秒帧为单位)。 该值可以采用 M/N 的形式,其中 M 和 N 是整数(例如,30000/1001),也可以以数字的形式(例如,30 或 29.97)。 编码器根据配置文件和级别对允许的帧速率强制实施约束。 如果未指定,编码器将使用与输入视频相同的帧速率。 | 字符串 |
身高 | 此层的输出视频的高度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的高度为一半的像素(与输入相同)。 | 字符串 |
标签 | 此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 | 字符串 |
水平 | 我们目前支持高达 6.2 的级别。 该值可以是“自动”,也可以是与 H.264 配置文件匹配的数字。 如果未指定,则默认值为“自动”,允许编码器选择适合此层的级别。 | 字符串 |
最大比特率 | 最大比特率(以比特/秒为单位),其中应假定 VBV 缓冲区重新填充。 如果未指定,则默认为与比特率相同的值。 | 整数 (int) |
简介 | 我们目前支持基线、Main、High、High422、High444。 默认值为“自动”。 | “Auto” “Baseline” “High” “High422” “High444” “Main” |
referenceFrames | 编码此层时要使用的引用帧数。 如果未指定,编码器会根据编码器复杂性设置确定适当的数字。 | 整数 (int) |
片 | 编码此层时要使用的切片数。 如果未指定,则默认值为零,这意味着编码器将为每个帧使用单个切片。 | 整数 (int) |
宽度 | 此层的输出视频的宽度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的宽度与输入的宽度相等一半。 | 字符串 |
H264视频
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.H264Video”(必需) |
复杂性 | 告知编码器如何选择其编码设置。 默认值为“平衡”。 | “平衡” “质量” “速度” |
keyFrameInterval 键帧间隔 | 两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒(PT2S)。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 | 字符串 |
层 | 要由编码器生成的输出 H.264 层的集合。 | H264层[] |
rateControlMode | 视频速率控制模式 | “ABR” “CBR” “CRF” |
sceneChangeDetection | 编码器是否应在场景更改时插入关键帧。 如果未指定,则默认值为 false。 仅当编码器配置为生成单个输出视频时,才应将此标志设置为 true。 | 布尔 |
stretchMode (拉伸模式) | 调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率。 默认值为 AutoSize | “AutoFit” “AutoSize” “None” |
syncMode 同步模式 | 视频同步模式 | “Auto” 'Cfr' “直通” “Vfr” |
H265层
名称 | DESCRIPTION | 价值 |
---|---|---|
adaptiveBFrame | 指定是否在编码此层时使用自适应 B 帧。 如果未指定,则每当视频配置文件允许其使用时,编码器都会打开它。 | 布尔 |
b帧 | 编码此层时要使用的 B 帧数。 如果未指定,编码器将根据视频配置文件和级别选择适当的数字。 | 整数 (int) |
比特率 | 生成此层时,每秒要对输入视频进行编码的平均比特率(以比特/秒为单位)。 例如:目标比特率为 3000Kbps 或 3Mbps 表示此值应为 3000000。这是必填字段。 | int (必需) |
缓冲窗口 | VBV 缓冲区窗口长度。 该值应采用 ISO 8601 格式。 该值应位于 [0.1-100] 秒范围内。 默认值为 5 秒(例如 PT5S)。 | 字符串 |
CRF | 编码此层时要使用的 CRF 值。 当在 CRF 模式下设置视频编解码器的 RateControlMode 时,此设置生效。 CRF 值的范围介于 0 和 51 之间,其中较低的值会导致质量更好,代价是文件大小较高。 较高的值意味着更多的压缩,但在某些时候会注意到质量下降。 默认值为 28。 | 整数 (int) |
帧率 | 要对此层进行编码的帧速率(以每秒帧为单位)。 该值可以采用 M/N 的形式,其中 M 和 N 是整数(例如,30000/1001),也可以以数字的形式(例如,30 或 29.97)。 编码器根据配置文件和级别对允许的帧速率强制实施约束。 如果未指定,编码器将使用与输入视频相同的帧速率。 | 字符串 |
身高 | 此层的输出视频的高度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的高度为一半的像素(与输入相同)。 | 字符串 |
标签 | 此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 | 字符串 |
水平 | 我们目前支持高达 6.2 的级别。 该值可以是“自动”,也可以是与 H.265 配置文件匹配的数字。 如果未指定,则默认值为“自动”,允许编码器选择适合此层的级别。 | 字符串 |
最大比特率 | 最大比特率(以比特/秒为单位),其中应假定 VBV 缓冲区重新填充。 如果未指定,则默认为与比特率相同的值。 | 整数 (int) |
简介 | 我们目前支持 Main。 默认值为“自动”。 | “Auto” “Main” “Main10” |
referenceFrames | 编码此层时要使用的引用帧数。 如果未指定,编码器会根据编码器复杂性设置确定适当的数字。 | 整数 (int) |
片 | 编码此层时要使用的切片数。 如果未指定,则默认值为零,这意味着编码器将为每个帧使用单个切片。 | 整数 (int) |
宽度 | 此层的输出视频的宽度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的宽度与输入的宽度相等一半。 | 字符串 |
H265视频
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.H265Video”(必需) |
复杂性 | 告知编码器如何选择其编码设置。 质量将提供更高的压缩率,但成本更高,计算时间更长。 速度将产生一个相对较大的文件,但速度更快且更经济。 默认值为“平衡”。 | “平衡” “质量” “速度” |
keyFrameInterval 键帧间隔 | 两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒(PT2S)。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 | 字符串 |
层 | 要由编码器生成的输出 H.265 层的集合。 | H265层[] |
sceneChangeDetection | 指定编码器是否应在场景更改时插入关键帧。 如果未指定,则默认值为 false。 仅当编码器配置为生成单个输出视频时,才应将此标志设置为 true。 | 布尔 |
stretchMode (拉伸模式) | 调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率。 默认值为 AutoSize | “AutoFit” “AutoSize” “None” |
syncMode 同步模式 | 视频同步模式 | “Auto” 'Cfr' “直通” “Vfr” |
JPG 格式
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.JpgFormat”(必需) |
Jpg图片
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.JpgImage”(必需) |
keyFrameInterval 键帧间隔 | 两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒(PT2S)。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 | 字符串 |
层 | 要由编码器生成的输出 JPEG 图像层的集合。 | JpgLayer[] |
范围 | 相对于在输入视频中转换预设开始时间的位置,在该视频中停止生成缩略图。 该值可以采用 ISO 8601 格式(例如,PT5M30S从开始时间停止 5 分 30 秒)或帧计数(例如,从开始时从帧的第 300 帧停止的 300 个帧)。如果此值为 1,则表示仅在开始时间生成一个缩略图,或流持续时间的相对值(例如,50% 从开始时间停止流持续时间的一半)。 默认值为 100%,这意味着在流末尾停止。 | 字符串 |
spriteColumn | 设置缩略图子画面图像中使用的列数。 自动计算行数,并使用子画面中每个缩略图的坐标映射生成 VTT 文件。 注意:此值应为正整数,建议使用适当的值,以便输出图像分辨率不会超出 JPEG 最大像素分辨率限制 65535x65535。 | 整数 (int) |
开始 | 输入视频中开始生成缩略图的位置。 该值可以采用 ISO 8601 格式(例如 PT05S 以 5 秒开始),或帧计数(例如,从第 10 帧开始)或流持续时间的相对值(例如,10% 从流持续时间的 10% 开始)。 此外还支持宏 {Best},该宏告知编码器从视频的前几秒钟中选择最佳缩略图,并且无论步骤和范围的其他设置如何,都将仅生成一个缩略图。 默认值为宏 {Best}。 | string (必需) |
步 | 生成缩略图的间隔。 该值可以采用 ISO 8601 格式(例如,每 5 秒一张图像的 PT05S)或帧计数(例如,每 30 帧一张图像 30 张)或流持续时间的相对值(例如,每 10 个流持续时间每 10% 一张图像的 10%)。 注意:步骤值将影响第一个生成的缩略图,这可能不是在转换预设开始时间指定的缩略图。 这是由于编码器,它尝试从开始时间和步骤位置之间选择最佳缩略图作为第一个输出。 由于默认值为 10%,这意味着如果流具有较长的持续时间,则第一个生成的缩略图可能远离在开始时间指定的缩略图。 如果第一个缩略图预期接近开始时间,请尝试为 Step 选择合理的值,或者在开始时仅需要一个缩略图时将 Range 值设置为 1。 | 字符串 |
stretchMode (拉伸模式) | 调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率。 默认值为 AutoSize | “AutoFit” “AutoSize” “None” |
syncMode 同步模式 | 视频同步模式 | “Auto” 'Cfr' “直通” “Vfr” |
Jpg 图层
名称 | DESCRIPTION | 价值 |
---|---|---|
身高 | 此层的输出视频的高度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的高度为一半的像素(与输入相同)。 | 字符串 |
标签 | 此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 | 字符串 |
质量 | JPEG 输出的压缩质量。 范围为 0-100,默认值为 70。 | 整数 (int) |
宽度 | 此层的输出视频的宽度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的宽度与输入的宽度相等一半。 | 字符串 |
Microsoft.Media/mediaServices/transforms
名称 | DESCRIPTION | 价值 |
---|---|---|
姓名 | 资源名称 | string (必需) |
parent_id | 此资源的父资源的 ID。 | 类型资源的 ID: mediaServices |
属性 | 资源属性。 | TransformProperties (变换属性) |
类型 | 资源类型 | “Microsoft.Media/mediaServices/transforms@2022-07-01” |
Mp4格式
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.Mp4Format”(必需) |
outputFiles (输出文件) | 要生成的输出文件的列表。 列表中的每个条目都是一组要一起复用的音频和视频层标签。 | 输出文件[] |
输出文件
名称 | DESCRIPTION | 价值 |
---|---|---|
标签 | 描述编码器如何将视频和音频多路复用到输出文件中的标签列表。 例如,如果编码器正在生成带有标签 v1 和 v2 的两个视频层,以及一个带有标签 a1 的音频层,则“[v1, a1]”等数组会告知编码器生成一个输出文件,其中包含 v1 表示的视频轨迹和 a1 表示的音频轨迹。 | string[] (必需) |
覆盖
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 对于 Type AudioOverlay,设置为“#Microsoft.Media.AudioOverlay”。 对于 VideoOverlay 类型,设置为“#Microsoft.Media.VideoOverlay”。 | “#Microsoft.Media.AudioOverlay” “#Microsoft.Media.VideoOverlay”(必需) |
audioGainLevel 音频增益级别 | 覆盖中的音频增益级别。 该值应位于 [0, 1.0] 范围内。 默认值为 1.0。 | 整数 (int) |
结束 | 结束位置,引用输入视频,覆盖结束。 该值应采用 ISO 8601 格式。 例如,PT30S 在输入视频中以 30 秒结束覆盖。 如果未指定或值大于输入视频持续时间,则在覆盖媒体持续时间大于输入视频持续时间时,将应用覆盖层,直到输入视频结束,否则覆盖将持续到覆盖媒体持续时间。 | 字符串 |
淡化持续时间 | 覆盖逐渐淡入输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定默认行为,则不会淡入(与 PT0S 相同)。 | 字符串 |
淡出持续时间 | 覆盖逐渐淡出输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定默认行为,则不会淡出(与 PT0S 相同)。 | 字符串 |
inputLabel (输入标签) | 要用作覆盖的作业输入的标签。 输入必须指定一个文件。 可以使用 JPG、PNG、GIF 或 BMP 格式或音频文件(如 WAV、MP3、WMA 或 M4A 文件)或视频文件指定图像文件。 请参阅 https://aka.ms/mesformats 支持的音频和视频文件格式的完整列表。 | string (必需) |
开始 | 开始位置,引用输入视频,覆盖开始。 该值应采用 ISO 8601 格式。 例如,PT05S 在输入视频中的 5 秒处启动覆盖。 如果未指定覆盖层,则从输入视频的开头开始。 | 字符串 |
Png格式
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.PngFormat”(必需) |
Png图像
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.PngImage”(必需) |
keyFrameInterval 键帧间隔 | 两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒(PT2S)。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 | 字符串 |
层 | 要由编码器生成的输出 PNG 图像层的集合。 | PngLayer[] |
范围 | 相对于在输入视频中转换预设开始时间的位置,在该视频中停止生成缩略图。 该值可以采用 ISO 8601 格式(例如,PT5M30S从开始时间停止 5 分 30 秒)或帧计数(例如,从开始时从帧的第 300 帧停止的 300 个帧)。如果此值为 1,则表示仅在开始时间生成一个缩略图,或流持续时间的相对值(例如,50% 从开始时间停止流持续时间的一半)。 默认值为 100%,这意味着在流末尾停止。 | 字符串 |
开始 | 输入视频中开始生成缩略图的位置。 该值可以采用 ISO 8601 格式(例如 PT05S 以 5 秒开始),或帧计数(例如,从第 10 帧开始)或流持续时间的相对值(例如,10% 从流持续时间的 10% 开始)。 此外还支持宏 {Best},该宏告知编码器从视频的前几秒钟中选择最佳缩略图,并且无论步骤和范围的其他设置如何,都将仅生成一个缩略图。 默认值为宏 {Best}。 | string (必需) |
步 | 生成缩略图的间隔。 该值可以采用 ISO 8601 格式(例如,每 5 秒一张图像的 PT05S)或帧计数(例如,每 30 帧一张图像 30 张)或流持续时间的相对值(例如,每 10 个流持续时间每 10% 一张图像的 10%)。 注意:步骤值将影响第一个生成的缩略图,这可能不是在转换预设开始时间指定的缩略图。 这是由于编码器,它尝试从开始时间和步骤位置之间选择最佳缩略图作为第一个输出。 由于默认值为 10%,这意味着如果流具有较长的持续时间,则第一个生成的缩略图可能远离在开始时间指定的缩略图。 如果第一个缩略图预期接近开始时间,请尝试为 Step 选择合理的值,或者在开始时仅需要一个缩略图时将 Range 值设置为 1。 | 字符串 |
stretchMode (拉伸模式) | 调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率。 默认值为 AutoSize | “AutoFit” “AutoSize” “None” |
syncMode 同步模式 | 视频同步模式 | “Auto” 'Cfr' “直通” “Vfr” |
Png图层
名称 | DESCRIPTION | 价值 |
---|---|---|
身高 | 此层的输出视频的高度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的高度为一半的像素(与输入相同)。 | 字符串 |
标签 | 此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 | 字符串 |
宽度 | 此层的输出视频的宽度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的宽度与输入的宽度相等一半。 | 字符串 |
预设
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 对于 VideoAnalyzerPreset 类型,设置为“#Microsoft.Media.VideoAnalyzerPreset”。 对于 BuiltInStandardEncoderPreset,设置为“#Microsoft.Media.BuiltInStandardEncoderPreset”。 对于 FaceDetectorPreset 类型,设置为“#Microsoft.Media.FaceDetectorPreset”。 对于 StandardEncoderPreset 类型,设置为“#Microsoft.Media.StandardEncoderPreset”。 | “#Microsoft.Media.BuiltInStandardEncoderPreset” “#Microsoft.Media.FaceDetectorPreset” “#Microsoft.Media.StandardEncoderPreset” “#Microsoft.Media.VideoAnalyzerPreset”(必需) |
PresetConfigurations
名称 | DESCRIPTION | 价值 |
---|---|---|
复杂性 | 允许配置编码器设置,以控制速度和质量之间的平衡。 示例:将复杂性设置为“速度”,以提高编码速度,但压缩效率较低。 | “平衡” “质量” “速度” |
interleaveOutput (交错输出) | 设置输出的交错模式,以控制音频和视频如何以容器格式存储。 示例:将 InterleavedOutput 设置为 NonInterleavedOutput,以在单独的 MP4 文件中生成仅音频和仅视频输出。 | “InterleavedOutput” “NonInterleavedOutput” |
keyFrameIntervalInSeconds | 关键帧间隔(以秒为单位)。 示例:将 KeyFrameIntervalInSeconds 设置为 2 以减少某些玩家的播放缓冲。 | 整数 (int) |
最大比特率 Bps | 最大比特率(每秒位数)(最高视频层的阈值)。 示例:将 MaxBitrateBps 设置为 6000000,以避免为具有较高复杂性的内容生成非常高的比特率输出。 | 整数 (int) |
最大高度 | 输出视频层的最大高度。 示例:将 MaxHeight 设置为 720 以生成高达 720P 的输出层,即使输入为 4K 也是如此。 | 整数 (int) |
最大层数 | 输出视频层的最大数目。 示例:将 MaxLayers 设置为 4,以确保生成最多 4 个输出层,以控制编码作业的总体成本。 | 整数 (int) |
最小比特率 Bps | 最小比特率(每秒位数)(底层视频层的阈值)。 示例:将 MinBitrateBps 设置为 200000,其底层覆盖网络带宽较低的用户。 | 整数 (int) |
minHeight | 输出视频层的最小高度。 示例:将 MinHeight 设置为 360,以避免输出层较小的分辨率,例如 180P。 | 整数 (int) |
矩形
名称 | DESCRIPTION | 价值 |
---|---|---|
身高 | 矩形区域的高度(以像素为单位)。 这可以是绝对像素值(例如 100),也可以相对于视频的大小(例如,50%)。 | 字符串 |
左 | 左边距中的像素数。 这可以是绝对像素值(例如 100),也可以相对于视频的大小(例如,50%)。 | 字符串 |
顶部 | 上边距中的像素数。 这可以是绝对像素值(例如 100),也可以相对于视频的大小(例如,50%)。 | 字符串 |
宽度 | 矩形区域的宽度(以像素为单位)。 这可以是绝对像素值(例如 100),也可以相对于视频的大小(例如,50%)。 | 字符串 |
StandardEncoderPreset
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.StandardEncoderPreset”(必需) |
编 解码 器 | 编码输入视频时要使用的编解码器列表。 | 编解码器[] (必需) |
experimental选项 | 包含预设本身中未公开的参数的键值对的字典 | StandardEncoderPresetExperimentalOptions |
筛选器 | 编码前应用于输入媒体的一个或多个筛选作。 | 过滤 器 |
格式 | 要由编码器生成的输出列表。 | Format[] (必需) |
StandardEncoderPresetExperimentalOptions
名称 | DESCRIPTION | 价值 |
---|
TransformOutput (变换输出)
名称 | DESCRIPTION | 价值 |
---|---|---|
onError 错误 | 转换可以定义多个输出。 此属性定义服务在一个输出失败时应执行的作 - 继续生成其他输出,或者停止其他输出。 总体作业状态不会反映使用“ContinueJob”指定的输出失败。 默认值为“StopProcessingJob”。 | “ContinueJob” “StopProcessingJob” |
预设 | 描述将用于修改、转码或从源文件中提取见解以生成输出的作的预设。 | 预设 (必需) |
relativePriority | 设置 Transform 中的 TransformOutputs 的相对优先级。 这会设置服务用于处理 TransformOutputs 的优先级。 默认优先级为 Normal。 | “High” “Low” “Normal” |
TransformProperties (变换属性)
名称 | DESCRIPTION | 价值 |
---|---|---|
描述 | 转换的可选详细描述。 | 字符串 |
输出 | 转换应生成的一个或多个 TransformOutput 的数组。 | TransformOutput[] (必需) |
TransportStreamFormat 格式
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.TransportStreamFormat”(必需) |
outputFiles (输出文件) | 要生成的输出文件的列表。 列表中的每个条目都是一组要一起复用的音频和视频层标签。 | 输出文件[] |
VideoAnalyzer预设
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.VideoAnalyzerPreset”(必需) |
音频语言 | 使用“语言标记区域”的 BCP-47 格式(例如“en-US”)输入中的音频有效负载的语言。 如果知道内容的语言,建议指定它。 必须为 AudioAnalysisMode::Basic 显式指定语言,因为基本模式下不包括自动语言检测。 如果未指定语言或设置为 null,则自动语言检测将选择检测到的第一种语言,并在文件的持续时间内使用所选语言进行处理。 它目前不支持在检测到第一种语言后动态切换语言。 自动检测最适用于具有清晰辨别语音的录音。 如果自动检测找不到语言,则听录将回退到“en-US”。”此处提供了支持的语言列表: https://go.microsoft.com/fwlink/?linkid=2109463 | 字符串 |
experimental选项 | 包含预设本身中未公开的参数的键值对的字典 | AudioAnalyzerPresetExperimentalOptions |
insightsToExtract | 定义希望服务生成的见解类型。 允许的值为“AudioInsightsOnly”、“VideoInsightsOnly”和“AllInsights”。 默认值为 AllInsights。 如果将此项设置为 AllInsights,并且输入仅为音频,则仅生成音频见解。 同样,如果输入仅是视频,则仅生成视频见解。 如果希望某些输入仅成为视频,建议不要使用 AudioInsightsOnly;如果希望某些输入仅音频,请使用 VideoInsightsOnly。 处于此类条件的作业将出错。 | “AllInsights” “AudioInsightsOnly” “VideoInsightsOnly” |
模式 | 确定要执行的音频分析作集。 如果未指定,则会选择标准 AudioAnalysisMode。 | “Basic” “Standard” |
视频叠加
名称 | DESCRIPTION | 价值 |
---|---|---|
@odata.type | 派生类型的歧视性。 | “#Microsoft.Media.VideoOverlay”(必需) |
cropRectangle 的 | 用于裁剪覆盖图像或视频的可选矩形窗口。 | 矩形 |
不透明度 | 覆盖的不透明度。 这是 [0 - 1.0] 范围内的值。 默认值为 1.0,表示覆盖不透明。 | 整数 (int) |
职位 | 应用覆盖层的输入视频中的位置。 | 矩形 |