你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Microsoft.Media mediaServices/transforms

Bicep 资源定义

可以使用目标作部署 mediaServices/transforms 资源类型:

有关每个 API 版本中已更改属性的列表,请参阅 更改日志

资源格式

若要创建 Microsoft.Media/mediaServices/transforms 资源,请将以下 Bicep 添加到模板。

resource symbolicname 'Microsoft.Media/mediaServices/transforms@2022-07-01' = {
  parent: resourceSymbolicName
  name: 'string'
  properties: {
    description: 'string'
    outputs: [
      {
        onError: 'string'
        preset: {
          @odata.type: 'string'
          // For remaining properties, see Preset objects
        }
        relativePriority: 'string'
      }
    ]
  }
}

预设对象

设置 @odata.type 属性以指定对象的类型。

对于 #Microsoft.Media.VideoAnalyzerPreset,请使用:

{
  @odata.type: '#Microsoft.Media.VideoAnalyzerPreset'
  audioLanguage: 'string'
  experimentalOptions: {
    {customized property}: 'string'
  }
  insightsToExtract: 'string'
  mode: 'string'
}

对于 #Microsoft.Media.BuiltInStandardEncoderPreset,请使用:

{
  @odata.type: '#Microsoft.Media.BuiltInStandardEncoderPreset'
  configurations: {
    complexity: 'string'
    interleaveOutput: 'string'
    keyFrameIntervalInSeconds: int
    maxBitrateBps: int
    maxHeight: int
    maxLayers: int
    minBitrateBps: int
    minHeight: int
  }
  presetName: 'string'
}

对于 #Microsoft.Media.FaceDetectorPreset,请使用:

{
  @odata.type: '#Microsoft.Media.FaceDetectorPreset'
  blurType: 'string'
  experimentalOptions: {
    {customized property}: 'string'
  }
  mode: 'string'
  resolution: 'string'
}

对于 #Microsoft.Media.StandardEncoderPreset,请使用:

{
  @odata.type: '#Microsoft.Media.StandardEncoderPreset'
  codecs: [
    {
      label: 'string'
      @odata.type: 'string'
      // For remaining properties, see Codec objects
    }
  ]
  experimentalOptions: {
    {customized property}: 'string'
  }
  filters: {
    crop: {
      height: 'string'
      left: 'string'
      top: 'string'
      width: 'string'
    }
    deinterlace: {
      mode: 'string'
      parity: 'string'
    }
    fadeIn: {
      duration: 'string'
      fadeColor: 'string'
      start: 'string'
    }
    fadeOut: {
      duration: 'string'
      fadeColor: 'string'
      start: 'string'
    }
    overlays: [
      {
        audioGainLevel: int
        end: 'string'
        fadeInDuration: 'string'
        fadeOutDuration: 'string'
        inputLabel: 'string'
        start: 'string'
        @odata.type: 'string'
        // For remaining properties, see Overlay objects
      }
    ]
    rotation: 'string'
  }
  formats: [
    {
      filenamePattern: 'string'
      @odata.type: 'string'
      // For remaining properties, see Format objects
    }
  ]
}

设置对象格式

设置 @odata.type 属性以指定对象的类型。

对于 #Microsoft.Media.JpgFormat,请使用:

{
  @odata.type: '#Microsoft.Media.JpgFormat'
}

对于 #Microsoft.Media.PngFormat,请使用:

{
  @odata.type: '#Microsoft.Media.PngFormat'
}

对于 #Microsoft.Media.Mp4Format,请使用:

{
  @odata.type: '#Microsoft.Media.Mp4Format'
  outputFiles: [
    {
      labels: [
        'string'
      ]
    }
  ]
}

对于 #Microsoft.Media.TransportStreamFormat,请使用:

{
  @odata.type: '#Microsoft.Media.TransportStreamFormat'
  outputFiles: [
    {
      labels: [
        'string'
      ]
    }
  ]
}

编解码器对象

设置 @odata.type 属性以指定对象的类型。

对于 #Microsoft.Media.AacAudio,请使用:

{
  @odata.type: '#Microsoft.Media.AacAudio'
  bitrate: int
  channels: int
  profile: 'string'
  samplingRate: int
}

对于 #Microsoft.Media.DDAudio,请使用:

{
  @odata.type: '#Microsoft.Media.DDAudio'
  bitrate: int
  channels: int
  samplingRate: int
}

对于 #Microsoft.Media.CopyAudio,请使用:

{
  @odata.type: '#Microsoft.Media.CopyAudio'
}

对于 #Microsoft.Media.CopyVideo,请使用:

{
  @odata.type: '#Microsoft.Media.CopyVideo'
}

对于 #Microsoft.Media.H264Video,请使用:

{
  @odata.type: '#Microsoft.Media.H264Video'
  complexity: 'string'
  keyFrameInterval: 'string'
  layers: [
    {
      adaptiveBFrame: bool
      bFrames: int
      bitrate: int
      bufferWindow: 'string'
      crf: int
      entropyMode: 'string'
      frameRate: 'string'
      height: 'string'
      label: 'string'
      level: 'string'
      maxBitrate: int
      profile: 'string'
      referenceFrames: int
      slices: int
      width: 'string'
    }
  ]
  rateControlMode: 'string'
  sceneChangeDetection: bool
  stretchMode: 'string'
  syncMode: 'string'
}

对于 #Microsoft.Media.H265Video,请使用:

{
  @odata.type: '#Microsoft.Media.H265Video'
  complexity: 'string'
  keyFrameInterval: 'string'
  layers: [
    {
      adaptiveBFrame: bool
      bFrames: int
      bitrate: int
      bufferWindow: 'string'
      crf: int
      frameRate: 'string'
      height: 'string'
      label: 'string'
      level: 'string'
      maxBitrate: int
      profile: 'string'
      referenceFrames: int
      slices: int
      width: 'string'
    }
  ]
  sceneChangeDetection: bool
  stretchMode: 'string'
  syncMode: 'string'
}

对于 #Microsoft.Media.JpgImage,请使用:

{
  @odata.type: '#Microsoft.Media.JpgImage'
  keyFrameInterval: 'string'
  layers: [
    {
      height: 'string'
      label: 'string'
      quality: int
      width: 'string'
    }
  ]
  range: 'string'
  spriteColumn: int
  start: 'string'
  step: 'string'
  stretchMode: 'string'
  syncMode: 'string'
}

对于 #Microsoft.Media.PngImage,请使用:

{
  @odata.type: '#Microsoft.Media.PngImage'
  keyFrameInterval: 'string'
  layers: [
    {
      height: 'string'
      label: 'string'
      width: 'string'
    }
  ]
  range: 'string'
  start: 'string'
  step: 'string'
  stretchMode: 'string'
  syncMode: 'string'
}

覆盖对象

设置 @odata.type 属性以指定对象的类型。

对于 #Microsoft.Media.AudioOverlay,请使用:

{
  @odata.type: '#Microsoft.Media.AudioOverlay'
}

对于 #Microsoft.Media.VideoOverlay,请使用:

{
  @odata.type: '#Microsoft.Media.VideoOverlay'
  cropRectangle: {
    height: 'string'
    left: 'string'
    top: 'string'
    width: 'string'
  }
  opacity: int
  position: {
    height: 'string'
    left: 'string'
    top: 'string'
    width: 'string'
  }
}

属性值

音频

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.AacAudio”(必需)
比特率 输出编码音频的比特率(以位/秒为单位)。 整数 (int)
渠道 音频中的声道数。 整数 (int)
简介 使用 AAC 编码音频时使用的编码配置文件。 “AacLc”
“HeaacV1”
“HeaacV2”
采样率 用于以赫茨编码的采样率。 整数 (int)

AudioAnalyzerPresetExperimentalOptions

名称 DESCRIPTION 价值

音频叠加

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.AudioOverlay”(必需)

BuiltInStandardEncoderPreset

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.BuiltInStandardEncoderPreset”(必需)
配置 编码器的可选配置设置。 仅 ContentAwareEncoding 和 H265ContentAwareEncoding BuiltInStandardEncoderPreset 支持配置。 PresetConfigurations
预设名称 用于编码视频的内置预设。 “AACGoodQualityAudio”
“AdaptiveStreaming”
“ContentAwareEncoding”
“ContentAwareEncodingExperimental”
“CopyAllBitrateNonInterleaved”
“DDGoodQualityAudio”
'H264MultipleBitrate1080p'
'H264MultipleBitrate720p'
'H264MultipleBitrateSD'
'H264SingleBitrate1080p'
'H264SingleBitrate720p'
'H264SingleBitrateSD'
“H265AdaptiveStreaming”
“H265ContentAwareEncoding”
'H265SingleBitrate1080p'
“H265SingleBitrate4K”
“H265SingleBitrate720p”(必需)

编 解码 器

名称 DESCRIPTION 价值
@odata.type 对于 AacAudio 类型,设置为“#Microsoft.Media.AacAudio”。 对于 类型 DDAudio,设置为“#Microsoft.Media.DDAudio”。 对于 Type CopyAudio,设置为“#Microsoft.Media.CopyAudio”。 对于 CopyVideo 类型,设置为“#Microsoft.Media.CopyVideo”。 对于 H264Video,设置为“#Microsoft.Media.H264Video”。 对于 H265Video 类型,设置为“#Microsoft.Media.H265Video”。 对于 JpgImage 类型,设置为“#Microsoft.Media.JpgImage”。 对于 PngImage 类型,设置为“#Microsoft.Media.PngImage”。 '#Microsoft.Media.AacAudio'
“#Microsoft.Media.CopyAudio”
“#Microsoft.Media.CopyVideo”
'#Microsoft.Media.DDAudio'
“#Microsoft.Media.H264视频”
“#Microsoft.Media.H265视频”
'#Microsoft.Media.JpgImage'
“#Microsoft.Media.PngImage”(必需)
标签 编解码器的可选标签。 该标签可用于控制复用行为。 字符串

复制音频

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.CopyAudio”(必需)

复制视频

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.CopyVideo”(必需)

DDAudio

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 '#Microsoft.Media.DDAudio' (必需)
比特率 输出编码音频的比特率(以位/秒为单位)。 整数 (int)
渠道 音频中的声道数。 整数 (int)
采样率 用于以赫茨编码的采样率。 整数 (int)

Deinterlace (取消交错)

名称 DESCRIPTION 价值
模式 反交错模式。 默认为 AutoPixelAdaptive。 “AutoPixelAdaptive”
“关闭”
平价 取消交错的字段奇偶校验默认为“自动”。 “Auto”
“BottomFieldFirst”
“TopFieldFirst”

FaceDetector预设

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.FaceDetectorPreset”(必需)
blurType 模糊类型 “Black”
“Box”
“High”
“Low”
“Med”
experimental选项 包含预设本身中未公开的参数的键值对的字典 FaceDetectorPresetExperimentalOptions
模式 此模式提供在以下设置之间进行选择的功能:1) 分析 - 仅用于检测。此模式生成元数据 JSON 文件,用于标记整个视频中人脸的外观。如果可能,同一人的外观将分配相同的 ID。2) 组合 - 此外,检测到人脸的编辑(模糊)。 3) 修订 - 这可实现 2 次传递过程,允许选择性地编辑检测到的人脸子集。它采用先前分析传递中的元数据文件以及源视频,以及需要修订的用户选择的 ID 子集。 “分析”
“Combined”
“Redact”
解决方法 指定分析视频的最大分辨率。 默认行为为“SourceResolution”,在分析时将输入视频保留为其原始分辨率。 使用“StandardDefinition”会将输入视频调整为标准定义,同时保留适当的纵横比。 仅当视频分辨率较高时,它才会调整大小。 例如,在处理之前,1920x1080 输入将缩放为 640x360。 切换到“StandardDefinition”可以减少处理高分辨率视频所需的时间。 它还可能会降低使用此组件的成本(有关详细信息 https://azure.microsoft.com/en-us/pricing/details/media-services/#analytics )。 但是,可能无法检测到在调整大小的视频中最终太小的人脸。 “SourceResolution”
“StandardDefinition”

FaceDetectorPresetExperimentalOptions

名称 DESCRIPTION 价值

褪色

名称 DESCRIPTION 价值
持续时间 视频中淡出效果的持续时间。 该值可以采用 ISO 8601 格式(例如,PT05S 在 5 秒内淡入/淡出颜色),或帧计数(例如,10 到从开始时间淡化 10 帧),或流持续时间的相对值(例如,10% 淡化 10% 流持续时间) string (必需)
淡化颜色 淡入/淡出的颜色。它可以位于 CSS Level1 颜色 https://developer.mozilla.org/en-US/docs/Web/CSS/color_value/color_keywords 或 RGB/十六进制值上:例如 rgb(255,0,0),0xFF0000或 #FF0000 string (必需)
开始 输入视频中开始淡出的位置。 该值可以采用 ISO 8601 格式(例如 PT05S 以 5 秒开始),或帧计数(例如,从第 10 帧开始)或流持续时间的相对值(例如,10% 从流持续时间的 10% 开始)。 默认值为 0 字符串

过滤 器

名称 DESCRIPTION 价值
作物 用于裁剪输入视频的矩形窗口的参数。 矩形
取消交错 反交错设置。 Deinterlace (取消交错)
淡入 描述应用于输入媒体的淡化效果的属性。 褪色
淡出 描述应用于输入媒体的淡化效果的属性。 褪色
覆盖 要应用于输入视频的覆盖层的属性。 这些可能是音频、图像或视频覆盖层。 覆盖层[]
旋转 在对输入视频进行编码之前,要应用于输入视频的旋转(如果有)。 默认值为“自动” “Auto”
“None”
“Rotate0”
“Rotate180”
“Rotate270”
“Rotate90”

格式

名称 DESCRIPTION 价值
@odata.type 对于 JpgFormat 类型,设置为“#Microsoft.Media.JpgFormat”。 设置为类型 为 PngFormat 的“#Microsoft.Media.PngFormat”。 对于 Mp4Format 类型,设置为“#Microsoft.Media.Mp4Format”。 对于 TransportStreamFormat,设置为“#Microsoft.Media.TransportStreamFormat”。 '#Microsoft.Media.JpgFormat'
'#Microsoft.Media.Mp4Format'
'#Microsoft.Media.PngFormat'
“#Microsoft.Media.TransportStreamFormat”(必需)
filenamePattern 用于创建输出文件的文件命名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件名称的扩展宏。 如果输入视频文件的基名称(不包括文件后缀)长度小于 32 个字符,将使用输入视频文件的基名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号(从 1 开始)。 {Bitrate} - 以 kbps 为单位的音频/视频比特率。 不适用于缩略图。 {编解码器} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未提交的宏都将折叠并从文件名中删除。 string (必需)

H264层

名称 DESCRIPTION 价值
adaptiveBFrame 是否在编码此层时使用自适应 B 帧。 如果未指定,则每当视频配置文件允许其使用时,编码器都会打开它。 布尔
b帧 编码此层时要使用的 B 帧数。 如果未指定,编码器将根据视频配置文件和级别选择适当的数字。 整数 (int)
比特率 生成此层时,每秒要对输入视频进行编码的平均比特率(以比特/秒为单位)。 这是必填字段。 int (必需)
缓冲窗口 VBV 缓冲区窗口长度。 该值应采用 ISO 8601 格式。 该值应位于 [0.1-100] 秒范围内。 默认值为 5 秒(例如 PT5S)。 字符串
CRF 编码此层时要使用的 CRF 值。 当在 CRF 模式下设置视频编解码器的 RateControlMode 时,此设置生效。 CRF 值的范围介于 0 和 51 之间,其中较低的值会导致质量更好,代价是文件大小较高。 较高的值意味着更多的压缩,但在某些时候会注意到质量下降。 默认值为 23。 整数 (int)
熵模式 要用于此层的萎缩模式。 如果未指定,编码器将选择适合配置文件和级别的模式。 “Cabac”
“Cavlc”
帧率 要对此层进行编码的帧速率(以每秒帧为单位)。 该值可以采用 M/N 的形式,其中 M 和 N 是整数(例如,30000/1001),也可以以数字的形式(例如,30 或 29.97)。 编码器根据配置文件和级别对允许的帧速率强制实施约束。 如果未指定,编码器将使用与输入视频相同的帧速率。 字符串
身高 此层的输出视频的高度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的高度为一半的像素(与输入相同)。 字符串
标签 此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 字符串
水平 我们目前支持高达 6.2 的级别。 该值可以是“自动”,也可以是与 H.264 配置文件匹配的数字。 如果未指定,则默认值为“自动”,允许编码器选择适合此层的级别。 字符串
最大比特率 最大比特率(以比特/秒为单位),其中应假定 VBV 缓冲区重新填充。 如果未指定,则默认为与比特率相同的值。 整数 (int)
简介 我们目前支持基线、Main、High、High422、High444。 默认值为“自动”。 “Auto”
“Baseline”
“High”
“High422”
“High444”
“Main”
referenceFrames 编码此层时要使用的引用帧数。 如果未指定,编码器会根据编码器复杂性设置确定适当的数字。 整数 (int)
编码此层时要使用的切片数。 如果未指定,则默认值为零,这意味着编码器将为每个帧使用单个切片。 整数 (int)
宽度 此层的输出视频的宽度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的宽度与输入的宽度相等一半。 字符串

H264视频

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.H264Video”(必需)
复杂性 告知编码器如何选择其编码设置。 默认值为“平衡”。 “平衡”
“质量”
“速度”
keyFrameInterval 键帧间隔 两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒(PT2S)。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 字符串
要由编码器生成的输出 H.264 层的集合。 H264层[]
rateControlMode 视频速率控制模式 “ABR”
“CBR”
“CRF”
sceneChangeDetection 编码器是否应在场景更改时插入关键帧。 如果未指定,则默认值为 false。 仅当编码器配置为生成单个输出视频时,才应将此标志设置为 true。 布尔
stretchMode (拉伸模式) 调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率。 默认值为 AutoSize “AutoFit”
“AutoSize”
“None”
syncMode 同步模式 视频同步模式 “Auto”
'Cfr'
“直通”
“Vfr”

H265层

名称 DESCRIPTION 价值
adaptiveBFrame 指定是否在编码此层时使用自适应 B 帧。 如果未指定,则每当视频配置文件允许其使用时,编码器都会打开它。 布尔
b帧 编码此层时要使用的 B 帧数。 如果未指定,编码器将根据视频配置文件和级别选择适当的数字。 整数 (int)
比特率 生成此层时,每秒要对输入视频进行编码的平均比特率(以比特/秒为单位)。 例如:目标比特率为 3000Kbps 或 3Mbps 表示此值应为 3000000。这是必填字段。 int (必需)
缓冲窗口 VBV 缓冲区窗口长度。 该值应采用 ISO 8601 格式。 该值应位于 [0.1-100] 秒范围内。 默认值为 5 秒(例如 PT5S)。 字符串
CRF 编码此层时要使用的 CRF 值。 当在 CRF 模式下设置视频编解码器的 RateControlMode 时,此设置生效。 CRF 值的范围介于 0 和 51 之间,其中较低的值会导致质量更好,代价是文件大小较高。 较高的值意味着更多的压缩,但在某些时候会注意到质量下降。 默认值为 28。 整数 (int)
帧率 要对此层进行编码的帧速率(以每秒帧为单位)。 该值可以采用 M/N 的形式,其中 M 和 N 是整数(例如,30000/1001),也可以以数字的形式(例如,30 或 29.97)。 编码器根据配置文件和级别对允许的帧速率强制实施约束。 如果未指定,编码器将使用与输入视频相同的帧速率。 字符串
身高 此层的输出视频的高度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的高度为一半的像素(与输入相同)。 字符串
标签 此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 字符串
水平 我们目前支持高达 6.2 的级别。 该值可以是“自动”,也可以是与 H.265 配置文件匹配的数字。 如果未指定,则默认值为“自动”,允许编码器选择适合此层的级别。 字符串
最大比特率 最大比特率(以比特/秒为单位),其中应假定 VBV 缓冲区重新填充。 如果未指定,则默认为与比特率相同的值。 整数 (int)
简介 我们目前支持 Main。 默认值为“自动”。 “Auto”
“Main”
“Main10”
referenceFrames 编码此层时要使用的引用帧数。 如果未指定,编码器会根据编码器复杂性设置确定适当的数字。 整数 (int)
编码此层时要使用的切片数。 如果未指定,则默认值为零,这意味着编码器将为每个帧使用单个切片。 整数 (int)
宽度 此层的输出视频的宽度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的宽度与输入的宽度相等一半。 字符串

H265视频

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.H265Video”(必需)
复杂性 告知编码器如何选择其编码设置。 质量将提供更高的压缩率,但成本更高,计算时间更长。 速度将产生一个相对较大的文件,但速度更快且更经济。 默认值为“平衡”。 “平衡”
“质量”
“速度”
keyFrameInterval 键帧间隔 两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒(PT2S)。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 字符串
要由编码器生成的输出 H.265 层的集合。 H265层[]
sceneChangeDetection 指定编码器是否应在场景更改时插入关键帧。 如果未指定,则默认值为 false。 仅当编码器配置为生成单个输出视频时,才应将此标志设置为 true。 布尔
stretchMode (拉伸模式) 调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率。 默认值为 AutoSize “AutoFit”
“AutoSize”
“None”
syncMode 同步模式 视频同步模式 “Auto”
'Cfr'
“直通”
“Vfr”

JPG 格式

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.JpgFormat”(必需)

Jpg图片

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.JpgImage”(必需)
keyFrameInterval 键帧间隔 两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒(PT2S)。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 字符串
要由编码器生成的输出 JPEG 图像层的集合。 JpgLayer[]
范围 相对于在输入视频中转换预设开始时间的位置,在该视频中停止生成缩略图。 该值可以采用 ISO 8601 格式(例如,PT5M30S从开始时间停止 5 分 30 秒)或帧计数(例如,从开始时从帧的第 300 帧停止的 300 个帧)。如果此值为 1,则表示仅在开始时间生成一个缩略图,或流持续时间的相对值(例如,50% 从开始时间停止流持续时间的一半)。 默认值为 100%,这意味着在流末尾停止。 字符串
spriteColumn 设置缩略图子画面图像中使用的列数。 自动计算行数,并使用子画面中每个缩略图的坐标映射生成 VTT 文件。 注意:此值应为正整数,建议使用适当的值,以便输出图像分辨率不会超出 JPEG 最大像素分辨率限制 65535x65535。 整数 (int)
开始 输入视频中开始生成缩略图的位置。 该值可以采用 ISO 8601 格式(例如 PT05S 以 5 秒开始),或帧计数(例如,从第 10 帧开始)或流持续时间的相对值(例如,10% 从流持续时间的 10% 开始)。 此外还支持宏 {Best},该宏告知编码器从视频的前几秒钟中选择最佳缩略图,并且无论步骤和范围的其他设置如何,都将仅生成一个缩略图。 默认值为宏 {Best}。 string (必需)
生成缩略图的间隔。 该值可以采用 ISO 8601 格式(例如,每 5 秒一张图像的 PT05S)或帧计数(例如,每 30 帧一张图像 30 张)或流持续时间的相对值(例如,每 10 个流持续时间每 10% 一张图像的 10%)。 注意:步骤值将影响第一个生成的缩略图,这可能不是在转换预设开始时间指定的缩略图。 这是由于编码器,它尝试从开始时间和步骤位置之间选择最佳缩略图作为第一个输出。 由于默认值为 10%,这意味着如果流具有较长的持续时间,则第一个生成的缩略图可能远离在开始时间指定的缩略图。 如果第一个缩略图预期接近开始时间,请尝试为 Step 选择合理的值,或者在开始时仅需要一个缩略图时将 Range 值设置为 1。 字符串
stretchMode (拉伸模式) 调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率。 默认值为 AutoSize “AutoFit”
“AutoSize”
“None”
syncMode 同步模式 视频同步模式 “Auto”
'Cfr'
“直通”
“Vfr”

Jpg 图层

名称 DESCRIPTION 价值
身高 此层的输出视频的高度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的高度为一半的像素(与输入相同)。 字符串
标签 此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 字符串
质量 JPEG 输出的压缩质量。 范围为 0-100,默认值为 70。 整数 (int)
宽度 此层的输出视频的宽度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的宽度与输入的宽度相等一半。 字符串

Microsoft.Media/mediaServices/transforms

名称 DESCRIPTION 价值
姓名 资源名称 string (必需)
家长 在 Bicep 中,可以为子资源指定父资源。 仅当子资源在父资源外部声明时,才需要添加此属性。

有关详细信息,请参阅 父资源外部的子资源
类型资源的符号名称: mediaServices
属性 资源属性。 TransformProperties (变换属性)

Mp4格式

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.Mp4Format”(必需)
outputFiles (输出文件) 要生成的输出文件的列表。 列表中的每个条目都是一组要一起复用的音频和视频层标签。 输出文件[]

输出文件

名称 DESCRIPTION 价值
标签 描述编码器如何将视频和音频多路复用到输出文件中的标签列表。 例如,如果编码器正在生成带有标签 v1 和 v2 的两个视频层,以及一个带有标签 a1 的音频层,则“[v1, a1]”等数组会告知编码器生成一个输出文件,其中包含 v1 表示的视频轨迹和 a1 表示的音频轨迹。 string[] (必需)

覆盖

名称 DESCRIPTION 价值
@odata.type 对于 Type AudioOverlay,设置为“#Microsoft.Media.AudioOverlay”。 对于 VideoOverlay 类型,设置为“#Microsoft.Media.VideoOverlay”。 “#Microsoft.Media.AudioOverlay”
“#Microsoft.Media.VideoOverlay”(必需)
audioGainLevel 音频增益级别 覆盖中的音频增益级别。 该值应位于 [0, 1.0] 范围内。 默认值为 1.0。 整数 (int)
结束 结束位置,引用输入视频,覆盖结束。 该值应采用 ISO 8601 格式。 例如,PT30S 在输入视频中以 30 秒结束覆盖。 如果未指定或值大于输入视频持续时间,则在覆盖媒体持续时间大于输入视频持续时间时,将应用覆盖层,直到输入视频结束,否则覆盖将持续到覆盖媒体持续时间。 字符串
淡化持续时间 覆盖逐渐淡入输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定默认行为,则不会淡入(与 PT0S 相同)。 字符串
淡出持续时间 覆盖逐渐淡出输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定默认行为,则不会淡出(与 PT0S 相同)。 字符串
inputLabel (输入标签) 要用作覆盖的作业输入的标签。 输入必须指定一个文件。 可以使用 JPG、PNG、GIF 或 BMP 格式或音频文件(如 WAV、MP3、WMA 或 M4A 文件)或视频文件指定图像文件。 请参阅 https://aka.ms/mesformats 支持的音频和视频文件格式的完整列表。 string (必需)
开始 开始位置,引用输入视频,覆盖开始。 该值应采用 ISO 8601 格式。 例如,PT05S 在输入视频中的 5 秒处启动覆盖。 如果未指定覆盖层,则从输入视频的开头开始。 字符串

Png格式

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.PngFormat”(必需)

Png图像

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.PngImage”(必需)
keyFrameInterval 键帧间隔 两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒(PT2S)。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 字符串
要由编码器生成的输出 PNG 图像层的集合。 PngLayer[]
范围 相对于在输入视频中转换预设开始时间的位置,在该视频中停止生成缩略图。 该值可以采用 ISO 8601 格式(例如,PT5M30S从开始时间停止 5 分 30 秒)或帧计数(例如,从开始时从帧的第 300 帧停止的 300 个帧)。如果此值为 1,则表示仅在开始时间生成一个缩略图,或流持续时间的相对值(例如,50% 从开始时间停止流持续时间的一半)。 默认值为 100%,这意味着在流末尾停止。 字符串
开始 输入视频中开始生成缩略图的位置。 该值可以采用 ISO 8601 格式(例如 PT05S 以 5 秒开始),或帧计数(例如,从第 10 帧开始)或流持续时间的相对值(例如,10% 从流持续时间的 10% 开始)。 此外还支持宏 {Best},该宏告知编码器从视频的前几秒钟中选择最佳缩略图,并且无论步骤和范围的其他设置如何,都将仅生成一个缩略图。 默认值为宏 {Best}。 string (必需)
生成缩略图的间隔。 该值可以采用 ISO 8601 格式(例如,每 5 秒一张图像的 PT05S)或帧计数(例如,每 30 帧一张图像 30 张)或流持续时间的相对值(例如,每 10 个流持续时间每 10% 一张图像的 10%)。 注意:步骤值将影响第一个生成的缩略图,这可能不是在转换预设开始时间指定的缩略图。 这是由于编码器,它尝试从开始时间和步骤位置之间选择最佳缩略图作为第一个输出。 由于默认值为 10%,这意味着如果流具有较长的持续时间,则第一个生成的缩略图可能远离在开始时间指定的缩略图。 如果第一个缩略图预期接近开始时间,请尝试为 Step 选择合理的值,或者在开始时仅需要一个缩略图时将 Range 值设置为 1。 字符串
stretchMode (拉伸模式) 调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率。 默认值为 AutoSize “AutoFit”
“AutoSize”
“None”
syncMode 同步模式 视频同步模式 “Auto”
'Cfr'
“直通”
“Vfr”

Png图层

名称 DESCRIPTION 价值
身高 此层的输出视频的高度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的高度为一半的像素(与输入相同)。 字符串
标签 此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 字符串
宽度 此层的输出视频的宽度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的宽度与输入的宽度相等一半。 字符串

预设

名称 DESCRIPTION 价值
@odata.type 对于 VideoAnalyzerPreset 类型,设置为“#Microsoft.Media.VideoAnalyzerPreset”。 对于 BuiltInStandardEncoderPreset,设置为“#Microsoft.Media.BuiltInStandardEncoderPreset”。 对于 FaceDetectorPreset 类型,设置为“#Microsoft.Media.FaceDetectorPreset”。 对于 StandardEncoderPreset 类型,设置为“#Microsoft.Media.StandardEncoderPreset”。 “#Microsoft.Media.BuiltInStandardEncoderPreset”
“#Microsoft.Media.FaceDetectorPreset”
“#Microsoft.Media.StandardEncoderPreset”
“#Microsoft.Media.VideoAnalyzerPreset”(必需)

PresetConfigurations

名称 DESCRIPTION 价值
复杂性 允许配置编码器设置,以控制速度和质量之间的平衡。 示例:将复杂性设置为“速度”,以提高编码速度,但压缩效率较低。 “平衡”
“质量”
“速度”
interleaveOutput (交错输出) 设置输出的交错模式,以控制音频和视频如何以容器格式存储。 示例:将 InterleavedOutput 设置为 NonInterleavedOutput,以在单独的 MP4 文件中生成仅音频和仅视频输出。 “InterleavedOutput”
“NonInterleavedOutput”
keyFrameIntervalInSeconds 关键帧间隔(以秒为单位)。 示例:将 KeyFrameIntervalInSeconds 设置为 2 以减少某些玩家的播放缓冲。 整数 (int)
最大比特率 Bps 最大比特率(每秒位数)(最高视频层的阈值)。 示例:将 MaxBitrateBps 设置为 6000000,以避免为具有较高复杂性的内容生成非常高的比特率输出。 整数 (int)
最大高度 输出视频层的最大高度。 示例:将 MaxHeight 设置为 720 以生成高达 720P 的输出层,即使输入为 4K 也是如此。 整数 (int)
最大层数 输出视频层的最大数目。 示例:将 MaxLayers 设置为 4,以确保生成最多 4 个输出层,以控制编码作业的总体成本。 整数 (int)
最小比特率 Bps 最小比特率(每秒位数)(底层视频层的阈值)。 示例:将 MinBitrateBps 设置为 200000,其底层覆盖网络带宽较低的用户。 整数 (int)
minHeight 输出视频层的最小高度。 示例:将 MinHeight 设置为 360,以避免输出层较小的分辨率,例如 180P。 整数 (int)

矩形

名称 DESCRIPTION 价值
身高 矩形区域的高度(以像素为单位)。 这可以是绝对像素值(例如 100),也可以相对于视频的大小(例如,50%)。 字符串
左边距中的像素数。 这可以是绝对像素值(例如 100),也可以相对于视频的大小(例如,50%)。 字符串
顶部 上边距中的像素数。 这可以是绝对像素值(例如 100),也可以相对于视频的大小(例如,50%)。 字符串
宽度 矩形区域的宽度(以像素为单位)。 这可以是绝对像素值(例如 100),也可以相对于视频的大小(例如,50%)。 字符串

StandardEncoderPreset

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.StandardEncoderPreset”(必需)
编 解码 器 编码输入视频时要使用的编解码器列表。 编解码器[] (必需)
experimental选项 包含预设本身中未公开的参数的键值对的字典 StandardEncoderPresetExperimentalOptions
筛选器 编码前应用于输入媒体的一个或多个筛选作。 过滤 器
格式 要由编码器生成的输出列表。 Format[] (必需)

StandardEncoderPresetExperimentalOptions

名称 DESCRIPTION 价值

TransformOutput (变换输出)

名称 DESCRIPTION 价值
onError 错误 转换可以定义多个输出。 此属性定义服务在一个输出失败时应执行的作 - 继续生成其他输出,或者停止其他输出。 总体作业状态不会反映使用“ContinueJob”指定的输出失败。 默认值为“StopProcessingJob”。 “ContinueJob”
“StopProcessingJob”
预设 描述将用于修改、转码或从源文件中提取见解以生成输出的作的预设。 预设 (必需)
relativePriority 设置 Transform 中的 TransformOutputs 的相对优先级。 这会设置服务用于处理 TransformOutputs 的优先级。 默认优先级为 Normal。 “High”
“Low”
“Normal”

TransformProperties (变换属性)

名称 DESCRIPTION 价值
描述 转换的可选详细描述。 字符串
输出 转换应生成的一个或多个 TransformOutput 的数组。 TransformOutput[] (必需)

TransportStreamFormat 格式

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.TransportStreamFormat”(必需)
outputFiles (输出文件) 要生成的输出文件的列表。 列表中的每个条目都是一组要一起复用的音频和视频层标签。 输出文件[]

VideoAnalyzer预设

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.VideoAnalyzerPreset”(必需)
音频语言 使用“语言标记区域”的 BCP-47 格式(例如“en-US”)输入中的音频有效负载的语言。 如果知道内容的语言,建议指定它。 必须为 AudioAnalysisMode::Basic 显式指定语言,因为基本模式下不包括自动语言检测。 如果未指定语言或设置为 null,则自动语言检测将选择检测到的第一种语言,并在文件的持续时间内使用所选语言进行处理。 它目前不支持在检测到第一种语言后动态切换语言。 自动检测最适用于具有清晰辨别语音的录音。 如果自动检测找不到语言,则听录将回退到“en-US”。”此处提供了支持的语言列表: https://go.microsoft.com/fwlink/?linkid=2109463 字符串
experimental选项 包含预设本身中未公开的参数的键值对的字典 AudioAnalyzerPresetExperimentalOptions
insightsToExtract 定义希望服务生成的见解类型。 允许的值为“AudioInsightsOnly”、“VideoInsightsOnly”和“AllInsights”。 默认值为 AllInsights。 如果将此项设置为 AllInsights,并且输入仅为音频,则仅生成音频见解。 同样,如果输入仅是视频,则仅生成视频见解。 如果希望某些输入仅成为视频,建议不要使用 AudioInsightsOnly;如果希望某些输入仅音频,请使用 VideoInsightsOnly。 处于此类条件的作业将出错。 “AllInsights”
“AudioInsightsOnly”
“VideoInsightsOnly”
模式 确定要执行的音频分析作集。 如果未指定,则会选择标准 AudioAnalysisMode。 “Basic”
“Standard”

视频叠加

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.VideoOverlay”(必需)
cropRectangle 的 用于裁剪覆盖图像或视频的可选矩形窗口。 矩形
不透明度 覆盖的不透明度。 这是 [0 - 1.0] 范围内的值。 默认值为 1.0,表示覆盖不透明。 整数 (int)
职位 应用覆盖层的输入视频中的位置。 矩形

ARM 模板资源定义

可以使用目标作部署 mediaServices/transforms 资源类型:

有关每个 API 版本中已更改属性的列表,请参阅 更改日志

资源格式

若要创建 Microsoft.Media/mediaServices/transforms 资源,请将以下 JSON 添加到模板。

{
  "type": "Microsoft.Media/mediaServices/transforms",
  "apiVersion": "2022-07-01",
  "name": "string",
  "properties": {
    "description": "string",
    "outputs": [
      {
        "onError": "string",
        "preset": {
          "@odata.type": "string"
          // For remaining properties, see Preset objects
        },
        "relativePriority": "string"
      }
    ]
  }
}

预设对象

设置 @odata.type 属性以指定对象的类型。

对于 #Microsoft.Media.VideoAnalyzerPreset,请使用:

{
  "@odata.type": "#Microsoft.Media.VideoAnalyzerPreset",
  "audioLanguage": "string",
  "experimentalOptions": {
    "{customized property}": "string"
  },
  "insightsToExtract": "string",
  "mode": "string"
}

对于 #Microsoft.Media.BuiltInStandardEncoderPreset,请使用:

{
  "@odata.type": "#Microsoft.Media.BuiltInStandardEncoderPreset",
  "configurations": {
    "complexity": "string",
    "interleaveOutput": "string",
    "keyFrameIntervalInSeconds": "int",
    "maxBitrateBps": "int",
    "maxHeight": "int",
    "maxLayers": "int",
    "minBitrateBps": "int",
    "minHeight": "int"
  },
  "presetName": "string"
}

对于 #Microsoft.Media.FaceDetectorPreset,请使用:

{
  "@odata.type": "#Microsoft.Media.FaceDetectorPreset",
  "blurType": "string",
  "experimentalOptions": {
    "{customized property}": "string"
  },
  "mode": "string",
  "resolution": "string"
}

对于 #Microsoft.Media.StandardEncoderPreset,请使用:

{
  "@odata.type": "#Microsoft.Media.StandardEncoderPreset",
  "codecs": [ {
    "label": "string",
    "@odata.type": "string"
    // For remaining properties, see Codec objects
  } ],
  "experimentalOptions": {
    "{customized property}": "string"
  },
  "filters": {
    "crop": {
      "height": "string",
      "left": "string",
      "top": "string",
      "width": "string"
    },
    "deinterlace": {
      "mode": "string",
      "parity": "string"
    },
    "fadeIn": {
      "duration": "string",
      "fadeColor": "string",
      "start": "string"
    },
    "fadeOut": {
      "duration": "string",
      "fadeColor": "string",
      "start": "string"
    },
    "overlays": [ {
      "audioGainLevel": "int",
      "end": "string",
      "fadeInDuration": "string",
      "fadeOutDuration": "string",
      "inputLabel": "string",
      "start": "string",
      "@odata.type": "string"
      // For remaining properties, see Overlay objects
    } ],
    "rotation": "string"
  },
  "formats": [ {
    "filenamePattern": "string",
    "@odata.type": "string"
    // For remaining properties, see Format objects
  } ]
}

设置对象格式

设置 @odata.type 属性以指定对象的类型。

对于 #Microsoft.Media.JpgFormat,请使用:

{
  "@odata.type": "#Microsoft.Media.JpgFormat"
}

对于 #Microsoft.Media.PngFormat,请使用:

{
  "@odata.type": "#Microsoft.Media.PngFormat"
}

对于 #Microsoft.Media.Mp4Format,请使用:

{
  "@odata.type": "#Microsoft.Media.Mp4Format",
  "outputFiles": [
    {
      "labels": [ "string" ]
    }
  ]
}

对于 #Microsoft.Media.TransportStreamFormat,请使用:

{
  "@odata.type": "#Microsoft.Media.TransportStreamFormat",
  "outputFiles": [
    {
      "labels": [ "string" ]
    }
  ]
}

编解码器对象

设置 @odata.type 属性以指定对象的类型。

对于 #Microsoft.Media.AacAudio,请使用:

{
  "@odata.type": "#Microsoft.Media.AacAudio",
  "bitrate": "int",
  "channels": "int",
  "profile": "string",
  "samplingRate": "int"
}

对于 #Microsoft.Media.DDAudio,请使用:

{
  "@odata.type": "#Microsoft.Media.DDAudio",
  "bitrate": "int",
  "channels": "int",
  "samplingRate": "int"
}

对于 #Microsoft.Media.CopyAudio,请使用:

{
  "@odata.type": "#Microsoft.Media.CopyAudio"
}

对于 #Microsoft.Media.CopyVideo,请使用:

{
  "@odata.type": "#Microsoft.Media.CopyVideo"
}

对于 #Microsoft.Media.H264Video,请使用:

{
  "@odata.type": "#Microsoft.Media.H264Video",
  "complexity": "string",
  "keyFrameInterval": "string",
  "layers": [
    {
      "adaptiveBFrame": "bool",
      "bFrames": "int",
      "bitrate": "int",
      "bufferWindow": "string",
      "crf": "int",
      "entropyMode": "string",
      "frameRate": "string",
      "height": "string",
      "label": "string",
      "level": "string",
      "maxBitrate": "int",
      "profile": "string",
      "referenceFrames": "int",
      "slices": "int",
      "width": "string"
    }
  ],
  "rateControlMode": "string",
  "sceneChangeDetection": "bool",
  "stretchMode": "string",
  "syncMode": "string"
}

对于 #Microsoft.Media.H265Video,请使用:

{
  "@odata.type": "#Microsoft.Media.H265Video",
  "complexity": "string",
  "keyFrameInterval": "string",
  "layers": [
    {
      "adaptiveBFrame": "bool",
      "bFrames": "int",
      "bitrate": "int",
      "bufferWindow": "string",
      "crf": "int",
      "frameRate": "string",
      "height": "string",
      "label": "string",
      "level": "string",
      "maxBitrate": "int",
      "profile": "string",
      "referenceFrames": "int",
      "slices": "int",
      "width": "string"
    }
  ],
  "sceneChangeDetection": "bool",
  "stretchMode": "string",
  "syncMode": "string"
}

对于 #Microsoft.Media.JpgImage,请使用:

{
  "@odata.type": "#Microsoft.Media.JpgImage",
  "keyFrameInterval": "string",
  "layers": [
    {
      "height": "string",
      "label": "string",
      "quality": "int",
      "width": "string"
    }
  ],
  "range": "string",
  "spriteColumn": "int",
  "start": "string",
  "step": "string",
  "stretchMode": "string",
  "syncMode": "string"
}

对于 #Microsoft.Media.PngImage,请使用:

{
  "@odata.type": "#Microsoft.Media.PngImage",
  "keyFrameInterval": "string",
  "layers": [
    {
      "height": "string",
      "label": "string",
      "width": "string"
    }
  ],
  "range": "string",
  "start": "string",
  "step": "string",
  "stretchMode": "string",
  "syncMode": "string"
}

覆盖对象

设置 @odata.type 属性以指定对象的类型。

对于 #Microsoft.Media.AudioOverlay,请使用:

{
  "@odata.type": "#Microsoft.Media.AudioOverlay"
}

对于 #Microsoft.Media.VideoOverlay,请使用:

{
  "@odata.type": "#Microsoft.Media.VideoOverlay",
  "cropRectangle": {
    "height": "string",
    "left": "string",
    "top": "string",
    "width": "string"
  },
  "opacity": "int",
  "position": {
    "height": "string",
    "left": "string",
    "top": "string",
    "width": "string"
  }
}

属性值

音频

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.AacAudio”(必需)
比特率 输出编码音频的比特率(以位/秒为单位)。 整数 (int)
渠道 音频中的声道数。 整数 (int)
简介 使用 AAC 编码音频时使用的编码配置文件。 “AacLc”
“HeaacV1”
“HeaacV2”
采样率 用于以赫茨编码的采样率。 整数 (int)

AudioAnalyzerPresetExperimentalOptions

名称 DESCRIPTION 价值

音频叠加

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.AudioOverlay”(必需)

BuiltInStandardEncoderPreset

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.BuiltInStandardEncoderPreset”(必需)
配置 编码器的可选配置设置。 仅 ContentAwareEncoding 和 H265ContentAwareEncoding BuiltInStandardEncoderPreset 支持配置。 PresetConfigurations
预设名称 用于编码视频的内置预设。 “AACGoodQualityAudio”
“AdaptiveStreaming”
“ContentAwareEncoding”
“ContentAwareEncodingExperimental”
“CopyAllBitrateNonInterleaved”
“DDGoodQualityAudio”
'H264MultipleBitrate1080p'
'H264MultipleBitrate720p'
'H264MultipleBitrateSD'
'H264SingleBitrate1080p'
'H264SingleBitrate720p'
'H264SingleBitrateSD'
“H265AdaptiveStreaming”
“H265ContentAwareEncoding”
'H265SingleBitrate1080p'
“H265SingleBitrate4K”
“H265SingleBitrate720p”(必需)

编 解码 器

名称 DESCRIPTION 价值
@odata.type 对于 AacAudio 类型,设置为“#Microsoft.Media.AacAudio”。 对于 类型 DDAudio,设置为“#Microsoft.Media.DDAudio”。 对于 Type CopyAudio,设置为“#Microsoft.Media.CopyAudio”。 对于 CopyVideo 类型,设置为“#Microsoft.Media.CopyVideo”。 对于 H264Video,设置为“#Microsoft.Media.H264Video”。 对于 H265Video 类型,设置为“#Microsoft.Media.H265Video”。 对于 JpgImage 类型,设置为“#Microsoft.Media.JpgImage”。 对于 PngImage 类型,设置为“#Microsoft.Media.PngImage”。 '#Microsoft.Media.AacAudio'
“#Microsoft.Media.CopyAudio”
“#Microsoft.Media.CopyVideo”
'#Microsoft.Media.DDAudio'
“#Microsoft.Media.H264视频”
“#Microsoft.Media.H265视频”
'#Microsoft.Media.JpgImage'
“#Microsoft.Media.PngImage”(必需)
标签 编解码器的可选标签。 该标签可用于控制复用行为。 字符串

复制音频

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.CopyAudio”(必需)

复制视频

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.CopyVideo”(必需)

DDAudio

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 '#Microsoft.Media.DDAudio' (必需)
比特率 输出编码音频的比特率(以位/秒为单位)。 整数 (int)
渠道 音频中的声道数。 整数 (int)
采样率 用于以赫茨编码的采样率。 整数 (int)

Deinterlace (取消交错)

名称 DESCRIPTION 价值
模式 反交错模式。 默认为 AutoPixelAdaptive。 “AutoPixelAdaptive”
“关闭”
平价 取消交错的字段奇偶校验默认为“自动”。 “Auto”
“BottomFieldFirst”
“TopFieldFirst”

FaceDetector预设

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.FaceDetectorPreset”(必需)
blurType 模糊类型 “Black”
“Box”
“High”
“Low”
“Med”
experimental选项 包含预设本身中未公开的参数的键值对的字典 FaceDetectorPresetExperimentalOptions
模式 此模式提供在以下设置之间进行选择的功能:1) 分析 - 仅用于检测。此模式生成元数据 JSON 文件,用于标记整个视频中人脸的外观。如果可能,同一人的外观将分配相同的 ID。2) 组合 - 此外,检测到人脸的编辑(模糊)。 3) 修订 - 这可实现 2 次传递过程,允许选择性地编辑检测到的人脸子集。它采用先前分析传递中的元数据文件以及源视频,以及需要修订的用户选择的 ID 子集。 “分析”
“Combined”
“Redact”
解决方法 指定分析视频的最大分辨率。 默认行为为“SourceResolution”,在分析时将输入视频保留为其原始分辨率。 使用“StandardDefinition”会将输入视频调整为标准定义,同时保留适当的纵横比。 仅当视频分辨率较高时,它才会调整大小。 例如,在处理之前,1920x1080 输入将缩放为 640x360。 切换到“StandardDefinition”可以减少处理高分辨率视频所需的时间。 它还可能会降低使用此组件的成本(有关详细信息 https://azure.microsoft.com/en-us/pricing/details/media-services/#analytics )。 但是,可能无法检测到在调整大小的视频中最终太小的人脸。 “SourceResolution”
“StandardDefinition”

FaceDetectorPresetExperimentalOptions

名称 DESCRIPTION 价值

褪色

名称 DESCRIPTION 价值
持续时间 视频中淡出效果的持续时间。 该值可以采用 ISO 8601 格式(例如,PT05S 在 5 秒内淡入/淡出颜色),或帧计数(例如,10 到从开始时间淡化 10 帧),或流持续时间的相对值(例如,10% 淡化 10% 流持续时间) string (必需)
淡化颜色 淡入/淡出的颜色。它可以位于 CSS Level1 颜色 https://developer.mozilla.org/en-US/docs/Web/CSS/color_value/color_keywords 或 RGB/十六进制值上:例如 rgb(255,0,0),0xFF0000或 #FF0000 string (必需)
开始 输入视频中开始淡出的位置。 该值可以采用 ISO 8601 格式(例如 PT05S 以 5 秒开始),或帧计数(例如,从第 10 帧开始)或流持续时间的相对值(例如,10% 从流持续时间的 10% 开始)。 默认值为 0 字符串

过滤 器

名称 DESCRIPTION 价值
作物 用于裁剪输入视频的矩形窗口的参数。 矩形
取消交错 反交错设置。 Deinterlace (取消交错)
淡入 描述应用于输入媒体的淡化效果的属性。 褪色
淡出 描述应用于输入媒体的淡化效果的属性。 褪色
覆盖 要应用于输入视频的覆盖层的属性。 这些可能是音频、图像或视频覆盖层。 覆盖层[]
旋转 在对输入视频进行编码之前,要应用于输入视频的旋转(如果有)。 默认值为“自动” “Auto”
“None”
“Rotate0”
“Rotate180”
“Rotate270”
“Rotate90”

格式

名称 DESCRIPTION 价值
@odata.type 对于 JpgFormat 类型,设置为“#Microsoft.Media.JpgFormat”。 设置为类型 为 PngFormat 的“#Microsoft.Media.PngFormat”。 对于 Mp4Format 类型,设置为“#Microsoft.Media.Mp4Format”。 对于 TransportStreamFormat,设置为“#Microsoft.Media.TransportStreamFormat”。 '#Microsoft.Media.JpgFormat'
'#Microsoft.Media.Mp4Format'
'#Microsoft.Media.PngFormat'
“#Microsoft.Media.TransportStreamFormat”(必需)
filenamePattern 用于创建输出文件的文件命名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件名称的扩展宏。 如果输入视频文件的基名称(不包括文件后缀)长度小于 32 个字符,将使用输入视频文件的基名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号(从 1 开始)。 {Bitrate} - 以 kbps 为单位的音频/视频比特率。 不适用于缩略图。 {编解码器} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未提交的宏都将折叠并从文件名中删除。 string (必需)

H264层

名称 DESCRIPTION 价值
adaptiveBFrame 是否在编码此层时使用自适应 B 帧。 如果未指定,则每当视频配置文件允许其使用时,编码器都会打开它。 布尔
b帧 编码此层时要使用的 B 帧数。 如果未指定,编码器将根据视频配置文件和级别选择适当的数字。 整数 (int)
比特率 生成此层时,每秒要对输入视频进行编码的平均比特率(以比特/秒为单位)。 这是必填字段。 int (必需)
缓冲窗口 VBV 缓冲区窗口长度。 该值应采用 ISO 8601 格式。 该值应位于 [0.1-100] 秒范围内。 默认值为 5 秒(例如 PT5S)。 字符串
CRF 编码此层时要使用的 CRF 值。 当在 CRF 模式下设置视频编解码器的 RateControlMode 时,此设置生效。 CRF 值的范围介于 0 和 51 之间,其中较低的值会导致质量更好,代价是文件大小较高。 较高的值意味着更多的压缩,但在某些时候会注意到质量下降。 默认值为 23。 整数 (int)
熵模式 要用于此层的萎缩模式。 如果未指定,编码器将选择适合配置文件和级别的模式。 “Cabac”
“Cavlc”
帧率 要对此层进行编码的帧速率(以每秒帧为单位)。 该值可以采用 M/N 的形式,其中 M 和 N 是整数(例如,30000/1001),也可以以数字的形式(例如,30 或 29.97)。 编码器根据配置文件和级别对允许的帧速率强制实施约束。 如果未指定,编码器将使用与输入视频相同的帧速率。 字符串
身高 此层的输出视频的高度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的高度为一半的像素(与输入相同)。 字符串
标签 此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 字符串
水平 我们目前支持高达 6.2 的级别。 该值可以是“自动”,也可以是与 H.264 配置文件匹配的数字。 如果未指定,则默认值为“自动”,允许编码器选择适合此层的级别。 字符串
最大比特率 最大比特率(以比特/秒为单位),其中应假定 VBV 缓冲区重新填充。 如果未指定,则默认为与比特率相同的值。 整数 (int)
简介 我们目前支持基线、Main、High、High422、High444。 默认值为“自动”。 “Auto”
“Baseline”
“High”
“High422”
“High444”
“Main”
referenceFrames 编码此层时要使用的引用帧数。 如果未指定,编码器会根据编码器复杂性设置确定适当的数字。 整数 (int)
编码此层时要使用的切片数。 如果未指定,则默认值为零,这意味着编码器将为每个帧使用单个切片。 整数 (int)
宽度 此层的输出视频的宽度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的宽度与输入的宽度相等一半。 字符串

H264视频

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.H264Video”(必需)
复杂性 告知编码器如何选择其编码设置。 默认值为“平衡”。 “平衡”
“质量”
“速度”
keyFrameInterval 键帧间隔 两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒(PT2S)。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 字符串
要由编码器生成的输出 H.264 层的集合。 H264层[]
rateControlMode 视频速率控制模式 “ABR”
“CBR”
“CRF”
sceneChangeDetection 编码器是否应在场景更改时插入关键帧。 如果未指定,则默认值为 false。 仅当编码器配置为生成单个输出视频时,才应将此标志设置为 true。 布尔
stretchMode (拉伸模式) 调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率。 默认值为 AutoSize “AutoFit”
“AutoSize”
“None”
syncMode 同步模式 视频同步模式 “Auto”
'Cfr'
“直通”
“Vfr”

H265层

名称 DESCRIPTION 价值
adaptiveBFrame 指定是否在编码此层时使用自适应 B 帧。 如果未指定,则每当视频配置文件允许其使用时,编码器都会打开它。 布尔
b帧 编码此层时要使用的 B 帧数。 如果未指定,编码器将根据视频配置文件和级别选择适当的数字。 整数 (int)
比特率 生成此层时,每秒要对输入视频进行编码的平均比特率(以比特/秒为单位)。 例如:目标比特率为 3000Kbps 或 3Mbps 表示此值应为 3000000。这是必填字段。 int (必需)
缓冲窗口 VBV 缓冲区窗口长度。 该值应采用 ISO 8601 格式。 该值应位于 [0.1-100] 秒范围内。 默认值为 5 秒(例如 PT5S)。 字符串
CRF 编码此层时要使用的 CRF 值。 当在 CRF 模式下设置视频编解码器的 RateControlMode 时,此设置生效。 CRF 值的范围介于 0 和 51 之间,其中较低的值会导致质量更好,代价是文件大小较高。 较高的值意味着更多的压缩,但在某些时候会注意到质量下降。 默认值为 28。 整数 (int)
帧率 要对此层进行编码的帧速率(以每秒帧为单位)。 该值可以采用 M/N 的形式,其中 M 和 N 是整数(例如,30000/1001),也可以以数字的形式(例如,30 或 29.97)。 编码器根据配置文件和级别对允许的帧速率强制实施约束。 如果未指定,编码器将使用与输入视频相同的帧速率。 字符串
身高 此层的输出视频的高度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的高度为一半的像素(与输入相同)。 字符串
标签 此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 字符串
水平 我们目前支持高达 6.2 的级别。 该值可以是“自动”,也可以是与 H.265 配置文件匹配的数字。 如果未指定,则默认值为“自动”,允许编码器选择适合此层的级别。 字符串
最大比特率 最大比特率(以比特/秒为单位),其中应假定 VBV 缓冲区重新填充。 如果未指定,则默认为与比特率相同的值。 整数 (int)
简介 我们目前支持 Main。 默认值为“自动”。 “Auto”
“Main”
“Main10”
referenceFrames 编码此层时要使用的引用帧数。 如果未指定,编码器会根据编码器复杂性设置确定适当的数字。 整数 (int)
编码此层时要使用的切片数。 如果未指定,则默认值为零,这意味着编码器将为每个帧使用单个切片。 整数 (int)
宽度 此层的输出视频的宽度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的宽度与输入的宽度相等一半。 字符串

H265视频

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.H265Video”(必需)
复杂性 告知编码器如何选择其编码设置。 质量将提供更高的压缩率,但成本更高,计算时间更长。 速度将产生一个相对较大的文件,但速度更快且更经济。 默认值为“平衡”。 “平衡”
“质量”
“速度”
keyFrameInterval 键帧间隔 两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒(PT2S)。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 字符串
要由编码器生成的输出 H.265 层的集合。 H265层[]
sceneChangeDetection 指定编码器是否应在场景更改时插入关键帧。 如果未指定,则默认值为 false。 仅当编码器配置为生成单个输出视频时,才应将此标志设置为 true。 布尔
stretchMode (拉伸模式) 调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率。 默认值为 AutoSize “AutoFit”
“AutoSize”
“None”
syncMode 同步模式 视频同步模式 “Auto”
'Cfr'
“直通”
“Vfr”

JPG 格式

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.JpgFormat”(必需)

Jpg图片

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.JpgImage”(必需)
keyFrameInterval 键帧间隔 两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒(PT2S)。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 字符串
要由编码器生成的输出 JPEG 图像层的集合。 JpgLayer[]
范围 相对于在输入视频中转换预设开始时间的位置,在该视频中停止生成缩略图。 该值可以采用 ISO 8601 格式(例如,PT5M30S从开始时间停止 5 分 30 秒)或帧计数(例如,从开始时从帧的第 300 帧停止的 300 个帧)。如果此值为 1,则表示仅在开始时间生成一个缩略图,或流持续时间的相对值(例如,50% 从开始时间停止流持续时间的一半)。 默认值为 100%,这意味着在流末尾停止。 字符串
spriteColumn 设置缩略图子画面图像中使用的列数。 自动计算行数,并使用子画面中每个缩略图的坐标映射生成 VTT 文件。 注意:此值应为正整数,建议使用适当的值,以便输出图像分辨率不会超出 JPEG 最大像素分辨率限制 65535x65535。 整数 (int)
开始 输入视频中开始生成缩略图的位置。 该值可以采用 ISO 8601 格式(例如 PT05S 以 5 秒开始),或帧计数(例如,从第 10 帧开始)或流持续时间的相对值(例如,10% 从流持续时间的 10% 开始)。 此外还支持宏 {Best},该宏告知编码器从视频的前几秒钟中选择最佳缩略图,并且无论步骤和范围的其他设置如何,都将仅生成一个缩略图。 默认值为宏 {Best}。 string (必需)
生成缩略图的间隔。 该值可以采用 ISO 8601 格式(例如,每 5 秒一张图像的 PT05S)或帧计数(例如,每 30 帧一张图像 30 张)或流持续时间的相对值(例如,每 10 个流持续时间每 10% 一张图像的 10%)。 注意:步骤值将影响第一个生成的缩略图,这可能不是在转换预设开始时间指定的缩略图。 这是由于编码器,它尝试从开始时间和步骤位置之间选择最佳缩略图作为第一个输出。 由于默认值为 10%,这意味着如果流具有较长的持续时间,则第一个生成的缩略图可能远离在开始时间指定的缩略图。 如果第一个缩略图预期接近开始时间,请尝试为 Step 选择合理的值,或者在开始时仅需要一个缩略图时将 Range 值设置为 1。 字符串
stretchMode (拉伸模式) 调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率。 默认值为 AutoSize “AutoFit”
“AutoSize”
“None”
syncMode 同步模式 视频同步模式 “Auto”
'Cfr'
“直通”
“Vfr”

Jpg 图层

名称 DESCRIPTION 价值
身高 此层的输出视频的高度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的高度为一半的像素(与输入相同)。 字符串
标签 此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 字符串
质量 JPEG 输出的压缩质量。 范围为 0-100,默认值为 70。 整数 (int)
宽度 此层的输出视频的宽度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的宽度与输入的宽度相等一半。 字符串

Microsoft.Media/mediaServices/transforms

名称 DESCRIPTION 价值
apiVersion API 版本 '2022-07-01'
姓名 资源名称 string (必需)
属性 资源属性。 TransformProperties (变换属性)
类型 资源类型 “Microsoft.Media/mediaServices/transforms”

Mp4格式

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.Mp4Format”(必需)
outputFiles (输出文件) 要生成的输出文件的列表。 列表中的每个条目都是一组要一起复用的音频和视频层标签。 输出文件[]

输出文件

名称 DESCRIPTION 价值
标签 描述编码器如何将视频和音频多路复用到输出文件中的标签列表。 例如,如果编码器正在生成带有标签 v1 和 v2 的两个视频层,以及一个带有标签 a1 的音频层,则“[v1, a1]”等数组会告知编码器生成一个输出文件,其中包含 v1 表示的视频轨迹和 a1 表示的音频轨迹。 string[] (必需)

覆盖

名称 DESCRIPTION 价值
@odata.type 对于 Type AudioOverlay,设置为“#Microsoft.Media.AudioOverlay”。 对于 VideoOverlay 类型,设置为“#Microsoft.Media.VideoOverlay”。 “#Microsoft.Media.AudioOverlay”
“#Microsoft.Media.VideoOverlay”(必需)
audioGainLevel 音频增益级别 覆盖中的音频增益级别。 该值应位于 [0, 1.0] 范围内。 默认值为 1.0。 整数 (int)
结束 结束位置,引用输入视频,覆盖结束。 该值应采用 ISO 8601 格式。 例如,PT30S 在输入视频中以 30 秒结束覆盖。 如果未指定或值大于输入视频持续时间,则在覆盖媒体持续时间大于输入视频持续时间时,将应用覆盖层,直到输入视频结束,否则覆盖将持续到覆盖媒体持续时间。 字符串
淡化持续时间 覆盖逐渐淡入输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定默认行为,则不会淡入(与 PT0S 相同)。 字符串
淡出持续时间 覆盖逐渐淡出输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定默认行为,则不会淡出(与 PT0S 相同)。 字符串
inputLabel (输入标签) 要用作覆盖的作业输入的标签。 输入必须指定一个文件。 可以使用 JPG、PNG、GIF 或 BMP 格式或音频文件(如 WAV、MP3、WMA 或 M4A 文件)或视频文件指定图像文件。 请参阅 https://aka.ms/mesformats 支持的音频和视频文件格式的完整列表。 string (必需)
开始 开始位置,引用输入视频,覆盖开始。 该值应采用 ISO 8601 格式。 例如,PT05S 在输入视频中的 5 秒处启动覆盖。 如果未指定覆盖层,则从输入视频的开头开始。 字符串

Png格式

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.PngFormat”(必需)

Png图像

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.PngImage”(必需)
keyFrameInterval 键帧间隔 两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒(PT2S)。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 字符串
要由编码器生成的输出 PNG 图像层的集合。 PngLayer[]
范围 相对于在输入视频中转换预设开始时间的位置,在该视频中停止生成缩略图。 该值可以采用 ISO 8601 格式(例如,PT5M30S从开始时间停止 5 分 30 秒)或帧计数(例如,从开始时从帧的第 300 帧停止的 300 个帧)。如果此值为 1,则表示仅在开始时间生成一个缩略图,或流持续时间的相对值(例如,50% 从开始时间停止流持续时间的一半)。 默认值为 100%,这意味着在流末尾停止。 字符串
开始 输入视频中开始生成缩略图的位置。 该值可以采用 ISO 8601 格式(例如 PT05S 以 5 秒开始),或帧计数(例如,从第 10 帧开始)或流持续时间的相对值(例如,10% 从流持续时间的 10% 开始)。 此外还支持宏 {Best},该宏告知编码器从视频的前几秒钟中选择最佳缩略图,并且无论步骤和范围的其他设置如何,都将仅生成一个缩略图。 默认值为宏 {Best}。 string (必需)
生成缩略图的间隔。 该值可以采用 ISO 8601 格式(例如,每 5 秒一张图像的 PT05S)或帧计数(例如,每 30 帧一张图像 30 张)或流持续时间的相对值(例如,每 10 个流持续时间每 10% 一张图像的 10%)。 注意:步骤值将影响第一个生成的缩略图,这可能不是在转换预设开始时间指定的缩略图。 这是由于编码器,它尝试从开始时间和步骤位置之间选择最佳缩略图作为第一个输出。 由于默认值为 10%,这意味着如果流具有较长的持续时间,则第一个生成的缩略图可能远离在开始时间指定的缩略图。 如果第一个缩略图预期接近开始时间,请尝试为 Step 选择合理的值,或者在开始时仅需要一个缩略图时将 Range 值设置为 1。 字符串
stretchMode (拉伸模式) 调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率。 默认值为 AutoSize “AutoFit”
“AutoSize”
“None”
syncMode 同步模式 视频同步模式 “Auto”
'Cfr'
“直通”
“Vfr”

Png图层

名称 DESCRIPTION 价值
身高 此层的输出视频的高度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的高度为一半的像素(与输入相同)。 字符串
标签 此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 字符串
宽度 此层的输出视频的宽度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的宽度与输入的宽度相等一半。 字符串

预设

名称 DESCRIPTION 价值
@odata.type 对于 VideoAnalyzerPreset 类型,设置为“#Microsoft.Media.VideoAnalyzerPreset”。 对于 BuiltInStandardEncoderPreset,设置为“#Microsoft.Media.BuiltInStandardEncoderPreset”。 对于 FaceDetectorPreset 类型,设置为“#Microsoft.Media.FaceDetectorPreset”。 对于 StandardEncoderPreset 类型,设置为“#Microsoft.Media.StandardEncoderPreset”。 “#Microsoft.Media.BuiltInStandardEncoderPreset”
“#Microsoft.Media.FaceDetectorPreset”
“#Microsoft.Media.StandardEncoderPreset”
“#Microsoft.Media.VideoAnalyzerPreset”(必需)

PresetConfigurations

名称 DESCRIPTION 价值
复杂性 允许配置编码器设置,以控制速度和质量之间的平衡。 示例:将复杂性设置为“速度”,以提高编码速度,但压缩效率较低。 “平衡”
“质量”
“速度”
interleaveOutput (交错输出) 设置输出的交错模式,以控制音频和视频如何以容器格式存储。 示例:将 InterleavedOutput 设置为 NonInterleavedOutput,以在单独的 MP4 文件中生成仅音频和仅视频输出。 “InterleavedOutput”
“NonInterleavedOutput”
keyFrameIntervalInSeconds 关键帧间隔(以秒为单位)。 示例:将 KeyFrameIntervalInSeconds 设置为 2 以减少某些玩家的播放缓冲。 整数 (int)
最大比特率 Bps 最大比特率(每秒位数)(最高视频层的阈值)。 示例:将 MaxBitrateBps 设置为 6000000,以避免为具有较高复杂性的内容生成非常高的比特率输出。 整数 (int)
最大高度 输出视频层的最大高度。 示例:将 MaxHeight 设置为 720 以生成高达 720P 的输出层,即使输入为 4K 也是如此。 整数 (int)
最大层数 输出视频层的最大数目。 示例:将 MaxLayers 设置为 4,以确保生成最多 4 个输出层,以控制编码作业的总体成本。 整数 (int)
最小比特率 Bps 最小比特率(每秒位数)(底层视频层的阈值)。 示例:将 MinBitrateBps 设置为 200000,其底层覆盖网络带宽较低的用户。 整数 (int)
minHeight 输出视频层的最小高度。 示例:将 MinHeight 设置为 360,以避免输出层较小的分辨率,例如 180P。 整数 (int)

矩形

名称 DESCRIPTION 价值
身高 矩形区域的高度(以像素为单位)。 这可以是绝对像素值(例如 100),也可以相对于视频的大小(例如,50%)。 字符串
左边距中的像素数。 这可以是绝对像素值(例如 100),也可以相对于视频的大小(例如,50%)。 字符串
顶部 上边距中的像素数。 这可以是绝对像素值(例如 100),也可以相对于视频的大小(例如,50%)。 字符串
宽度 矩形区域的宽度(以像素为单位)。 这可以是绝对像素值(例如 100),也可以相对于视频的大小(例如,50%)。 字符串

StandardEncoderPreset

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.StandardEncoderPreset”(必需)
编 解码 器 编码输入视频时要使用的编解码器列表。 编解码器[] (必需)
experimental选项 包含预设本身中未公开的参数的键值对的字典 StandardEncoderPresetExperimentalOptions
筛选器 编码前应用于输入媒体的一个或多个筛选作。 过滤 器
格式 要由编码器生成的输出列表。 Format[] (必需)

StandardEncoderPresetExperimentalOptions

名称 DESCRIPTION 价值

TransformOutput (变换输出)

名称 DESCRIPTION 价值
onError 错误 转换可以定义多个输出。 此属性定义服务在一个输出失败时应执行的作 - 继续生成其他输出,或者停止其他输出。 总体作业状态不会反映使用“ContinueJob”指定的输出失败。 默认值为“StopProcessingJob”。 “ContinueJob”
“StopProcessingJob”
预设 描述将用于修改、转码或从源文件中提取见解以生成输出的作的预设。 预设 (必需)
relativePriority 设置 Transform 中的 TransformOutputs 的相对优先级。 这会设置服务用于处理 TransformOutputs 的优先级。 默认优先级为 Normal。 “High”
“Low”
“Normal”

TransformProperties (变换属性)

名称 DESCRIPTION 价值
描述 转换的可选详细描述。 字符串
输出 转换应生成的一个或多个 TransformOutput 的数组。 TransformOutput[] (必需)

TransportStreamFormat 格式

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.TransportStreamFormat”(必需)
outputFiles (输出文件) 要生成的输出文件的列表。 列表中的每个条目都是一组要一起复用的音频和视频层标签。 输出文件[]

VideoAnalyzer预设

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.VideoAnalyzerPreset”(必需)
音频语言 使用“语言标记区域”的 BCP-47 格式(例如“en-US”)输入中的音频有效负载的语言。 如果知道内容的语言,建议指定它。 必须为 AudioAnalysisMode::Basic 显式指定语言,因为基本模式下不包括自动语言检测。 如果未指定语言或设置为 null,则自动语言检测将选择检测到的第一种语言,并在文件的持续时间内使用所选语言进行处理。 它目前不支持在检测到第一种语言后动态切换语言。 自动检测最适用于具有清晰辨别语音的录音。 如果自动检测找不到语言,则听录将回退到“en-US”。”此处提供了支持的语言列表: https://go.microsoft.com/fwlink/?linkid=2109463 字符串
experimental选项 包含预设本身中未公开的参数的键值对的字典 AudioAnalyzerPresetExperimentalOptions
insightsToExtract 定义希望服务生成的见解类型。 允许的值为“AudioInsightsOnly”、“VideoInsightsOnly”和“AllInsights”。 默认值为 AllInsights。 如果将此项设置为 AllInsights,并且输入仅为音频,则仅生成音频见解。 同样,如果输入仅是视频,则仅生成视频见解。 如果希望某些输入仅成为视频,建议不要使用 AudioInsightsOnly;如果希望某些输入仅音频,请使用 VideoInsightsOnly。 处于此类条件的作业将出错。 “AllInsights”
“AudioInsightsOnly”
“VideoInsightsOnly”
模式 确定要执行的音频分析作集。 如果未指定,则会选择标准 AudioAnalysisMode。 “Basic”
“Standard”

视频叠加

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.VideoOverlay”(必需)
cropRectangle 的 用于裁剪覆盖图像或视频的可选矩形窗口。 矩形
不透明度 覆盖的不透明度。 这是 [0 - 1.0] 范围内的值。 默认值为 1.0,表示覆盖不透明。 整数 (int)
职位 应用覆盖层的输入视频中的位置。 矩形

用法示例

Terraform (AzAPI 提供程序)资源定义

可以使用目标作部署 mediaServices/transforms 资源类型:

  • 资源组

有关每个 API 版本中已更改属性的列表,请参阅 更改日志

资源格式

若要创建 Microsoft.Media/mediaServices/transforms 资源,请将以下 Terraform 添加到模板。

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.Media/mediaServices/transforms@2022-07-01"
  name = "string"
  parent_id = "string"
  body = {
    properties = {
      description = "string"
      outputs = [
        {
          onError = "string"
          preset = {
            @odata.type = "string"
            // For remaining properties, see Preset objects
          }
          relativePriority = "string"
        }
      ]
    }
  }
}

预设对象

设置 @odata.type 属性以指定对象的类型。

对于 #Microsoft.Media.VideoAnalyzerPreset,请使用:

{
  @odata.type = "#Microsoft.Media.VideoAnalyzerPreset"
  audioLanguage = "string"
  experimentalOptions = {
    {customized property} = "string"
  }
  insightsToExtract = "string"
  mode = "string"
}

对于 #Microsoft.Media.BuiltInStandardEncoderPreset,请使用:

{
  @odata.type = "#Microsoft.Media.BuiltInStandardEncoderPreset"
  configurations = {
    complexity = "string"
    interleaveOutput = "string"
    keyFrameIntervalInSeconds = int
    maxBitrateBps = int
    maxHeight = int
    maxLayers = int
    minBitrateBps = int
    minHeight = int
  }
  presetName = "string"
}

对于 #Microsoft.Media.FaceDetectorPreset,请使用:

{
  @odata.type = "#Microsoft.Media.FaceDetectorPreset"
  blurType = "string"
  experimentalOptions = {
    {customized property} = "string"
  }
  mode = "string"
  resolution = "string"
}

对于 #Microsoft.Media.StandardEncoderPreset,请使用:

{
  @odata.type = "#Microsoft.Media.StandardEncoderPreset"
  codecs = [
    {
      label = "string"
      @odata.type = "string"
      // For remaining properties, see Codec objects
    }
  ]
  experimentalOptions = {
    {customized property} = "string"
  }
  filters = {
    crop = {
      height = "string"
      left = "string"
      top = "string"
      width = "string"
    }
    deinterlace = {
      mode = "string"
      parity = "string"
    }
    fadeIn = {
      duration = "string"
      fadeColor = "string"
      start = "string"
    }
    fadeOut = {
      duration = "string"
      fadeColor = "string"
      start = "string"
    }
    overlays = [
      {
        audioGainLevel = int
        end = "string"
        fadeInDuration = "string"
        fadeOutDuration = "string"
        inputLabel = "string"
        start = "string"
        @odata.type = "string"
        // For remaining properties, see Overlay objects
      }
    ]
    rotation = "string"
  }
  formats = [
    {
      filenamePattern = "string"
      @odata.type = "string"
      // For remaining properties, see Format objects
    }
  ]
}

设置对象格式

设置 @odata.type 属性以指定对象的类型。

对于 #Microsoft.Media.JpgFormat,请使用:

{
  @odata.type = "#Microsoft.Media.JpgFormat"
}

对于 #Microsoft.Media.PngFormat,请使用:

{
  @odata.type = "#Microsoft.Media.PngFormat"
}

对于 #Microsoft.Media.Mp4Format,请使用:

{
  @odata.type = "#Microsoft.Media.Mp4Format"
  outputFiles = [
    {
      labels = [
        "string"
      ]
    }
  ]
}

对于 #Microsoft.Media.TransportStreamFormat,请使用:

{
  @odata.type = "#Microsoft.Media.TransportStreamFormat"
  outputFiles = [
    {
      labels = [
        "string"
      ]
    }
  ]
}

编解码器对象

设置 @odata.type 属性以指定对象的类型。

对于 #Microsoft.Media.AacAudio,请使用:

{
  @odata.type = "#Microsoft.Media.AacAudio"
  bitrate = int
  channels = int
  profile = "string"
  samplingRate = int
}

对于 #Microsoft.Media.DDAudio,请使用:

{
  @odata.type = "#Microsoft.Media.DDAudio"
  bitrate = int
  channels = int
  samplingRate = int
}

对于 #Microsoft.Media.CopyAudio,请使用:

{
  @odata.type = "#Microsoft.Media.CopyAudio"
}

对于 #Microsoft.Media.CopyVideo,请使用:

{
  @odata.type = "#Microsoft.Media.CopyVideo"
}

对于 #Microsoft.Media.H264Video,请使用:

{
  @odata.type = "#Microsoft.Media.H264Video"
  complexity = "string"
  keyFrameInterval = "string"
  layers = [
    {
      adaptiveBFrame = bool
      bFrames = int
      bitrate = int
      bufferWindow = "string"
      crf = int
      entropyMode = "string"
      frameRate = "string"
      height = "string"
      label = "string"
      level = "string"
      maxBitrate = int
      profile = "string"
      referenceFrames = int
      slices = int
      width = "string"
    }
  ]
  rateControlMode = "string"
  sceneChangeDetection = bool
  stretchMode = "string"
  syncMode = "string"
}

对于 #Microsoft.Media.H265Video,请使用:

{
  @odata.type = "#Microsoft.Media.H265Video"
  complexity = "string"
  keyFrameInterval = "string"
  layers = [
    {
      adaptiveBFrame = bool
      bFrames = int
      bitrate = int
      bufferWindow = "string"
      crf = int
      frameRate = "string"
      height = "string"
      label = "string"
      level = "string"
      maxBitrate = int
      profile = "string"
      referenceFrames = int
      slices = int
      width = "string"
    }
  ]
  sceneChangeDetection = bool
  stretchMode = "string"
  syncMode = "string"
}

对于 #Microsoft.Media.JpgImage,请使用:

{
  @odata.type = "#Microsoft.Media.JpgImage"
  keyFrameInterval = "string"
  layers = [
    {
      height = "string"
      label = "string"
      quality = int
      width = "string"
    }
  ]
  range = "string"
  spriteColumn = int
  start = "string"
  step = "string"
  stretchMode = "string"
  syncMode = "string"
}

对于 #Microsoft.Media.PngImage,请使用:

{
  @odata.type = "#Microsoft.Media.PngImage"
  keyFrameInterval = "string"
  layers = [
    {
      height = "string"
      label = "string"
      width = "string"
    }
  ]
  range = "string"
  start = "string"
  step = "string"
  stretchMode = "string"
  syncMode = "string"
}

覆盖对象

设置 @odata.type 属性以指定对象的类型。

对于 #Microsoft.Media.AudioOverlay,请使用:

{
  @odata.type = "#Microsoft.Media.AudioOverlay"
}

对于 #Microsoft.Media.VideoOverlay,请使用:

{
  @odata.type = "#Microsoft.Media.VideoOverlay"
  cropRectangle = {
    height = "string"
    left = "string"
    top = "string"
    width = "string"
  }
  opacity = int
  position = {
    height = "string"
    left = "string"
    top = "string"
    width = "string"
  }
}

属性值

音频

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.AacAudio”(必需)
比特率 输出编码音频的比特率(以位/秒为单位)。 整数 (int)
渠道 音频中的声道数。 整数 (int)
简介 使用 AAC 编码音频时使用的编码配置文件。 “AacLc”
“HeaacV1”
“HeaacV2”
采样率 用于以赫茨编码的采样率。 整数 (int)

AudioAnalyzerPresetExperimentalOptions

名称 DESCRIPTION 价值

音频叠加

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.AudioOverlay”(必需)

BuiltInStandardEncoderPreset

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.BuiltInStandardEncoderPreset”(必需)
配置 编码器的可选配置设置。 仅 ContentAwareEncoding 和 H265ContentAwareEncoding BuiltInStandardEncoderPreset 支持配置。 PresetConfigurations
预设名称 用于编码视频的内置预设。 “AACGoodQualityAudio”
“AdaptiveStreaming”
“ContentAwareEncoding”
“ContentAwareEncodingExperimental”
“CopyAllBitrateNonInterleaved”
“DDGoodQualityAudio”
'H264MultipleBitrate1080p'
'H264MultipleBitrate720p'
'H264MultipleBitrateSD'
'H264SingleBitrate1080p'
'H264SingleBitrate720p'
'H264SingleBitrateSD'
“H265AdaptiveStreaming”
“H265ContentAwareEncoding”
'H265SingleBitrate1080p'
“H265SingleBitrate4K”
“H265SingleBitrate720p”(必需)

编 解码 器

名称 DESCRIPTION 价值
@odata.type 对于 AacAudio 类型,设置为“#Microsoft.Media.AacAudio”。 对于 类型 DDAudio,设置为“#Microsoft.Media.DDAudio”。 对于 Type CopyAudio,设置为“#Microsoft.Media.CopyAudio”。 对于 CopyVideo 类型,设置为“#Microsoft.Media.CopyVideo”。 对于 H264Video,设置为“#Microsoft.Media.H264Video”。 对于 H265Video 类型,设置为“#Microsoft.Media.H265Video”。 对于 JpgImage 类型,设置为“#Microsoft.Media.JpgImage”。 对于 PngImage 类型,设置为“#Microsoft.Media.PngImage”。 '#Microsoft.Media.AacAudio'
“#Microsoft.Media.CopyAudio”
“#Microsoft.Media.CopyVideo”
'#Microsoft.Media.DDAudio'
“#Microsoft.Media.H264视频”
“#Microsoft.Media.H265视频”
'#Microsoft.Media.JpgImage'
“#Microsoft.Media.PngImage”(必需)
标签 编解码器的可选标签。 该标签可用于控制复用行为。 字符串

复制音频

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.CopyAudio”(必需)

复制视频

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.CopyVideo”(必需)

DDAudio

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 '#Microsoft.Media.DDAudio' (必需)
比特率 输出编码音频的比特率(以位/秒为单位)。 整数 (int)
渠道 音频中的声道数。 整数 (int)
采样率 用于以赫茨编码的采样率。 整数 (int)

Deinterlace (取消交错)

名称 DESCRIPTION 价值
模式 反交错模式。 默认为 AutoPixelAdaptive。 “AutoPixelAdaptive”
“关闭”
平价 取消交错的字段奇偶校验默认为“自动”。 “Auto”
“BottomFieldFirst”
“TopFieldFirst”

FaceDetector预设

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.FaceDetectorPreset”(必需)
blurType 模糊类型 “Black”
“Box”
“High”
“Low”
“Med”
experimental选项 包含预设本身中未公开的参数的键值对的字典 FaceDetectorPresetExperimentalOptions
模式 此模式提供在以下设置之间进行选择的功能:1) 分析 - 仅用于检测。此模式生成元数据 JSON 文件,用于标记整个视频中人脸的外观。如果可能,同一人的外观将分配相同的 ID。2) 组合 - 此外,检测到人脸的编辑(模糊)。 3) 修订 - 这可实现 2 次传递过程,允许选择性地编辑检测到的人脸子集。它采用先前分析传递中的元数据文件以及源视频,以及需要修订的用户选择的 ID 子集。 “分析”
“Combined”
“Redact”
解决方法 指定分析视频的最大分辨率。 默认行为为“SourceResolution”,在分析时将输入视频保留为其原始分辨率。 使用“StandardDefinition”会将输入视频调整为标准定义,同时保留适当的纵横比。 仅当视频分辨率较高时,它才会调整大小。 例如,在处理之前,1920x1080 输入将缩放为 640x360。 切换到“StandardDefinition”可以减少处理高分辨率视频所需的时间。 它还可能会降低使用此组件的成本(有关详细信息 https://azure.microsoft.com/en-us/pricing/details/media-services/#analytics )。 但是,可能无法检测到在调整大小的视频中最终太小的人脸。 “SourceResolution”
“StandardDefinition”

FaceDetectorPresetExperimentalOptions

名称 DESCRIPTION 价值

褪色

名称 DESCRIPTION 价值
持续时间 视频中淡出效果的持续时间。 该值可以采用 ISO 8601 格式(例如,PT05S 在 5 秒内淡入/淡出颜色),或帧计数(例如,10 到从开始时间淡化 10 帧),或流持续时间的相对值(例如,10% 淡化 10% 流持续时间) string (必需)
淡化颜色 淡入/淡出的颜色。它可以位于 CSS Level1 颜色 https://developer.mozilla.org/en-US/docs/Web/CSS/color_value/color_keywords 或 RGB/十六进制值上:例如 rgb(255,0,0),0xFF0000或 #FF0000 string (必需)
开始 输入视频中开始淡出的位置。 该值可以采用 ISO 8601 格式(例如 PT05S 以 5 秒开始),或帧计数(例如,从第 10 帧开始)或流持续时间的相对值(例如,10% 从流持续时间的 10% 开始)。 默认值为 0 字符串

过滤 器

名称 DESCRIPTION 价值
作物 用于裁剪输入视频的矩形窗口的参数。 矩形
取消交错 反交错设置。 Deinterlace (取消交错)
淡入 描述应用于输入媒体的淡化效果的属性。 褪色
淡出 描述应用于输入媒体的淡化效果的属性。 褪色
覆盖 要应用于输入视频的覆盖层的属性。 这些可能是音频、图像或视频覆盖层。 覆盖层[]
旋转 在对输入视频进行编码之前,要应用于输入视频的旋转(如果有)。 默认值为“自动” “Auto”
“None”
“Rotate0”
“Rotate180”
“Rotate270”
“Rotate90”

格式

名称 DESCRIPTION 价值
@odata.type 对于 JpgFormat 类型,设置为“#Microsoft.Media.JpgFormat”。 设置为类型 为 PngFormat 的“#Microsoft.Media.PngFormat”。 对于 Mp4Format 类型,设置为“#Microsoft.Media.Mp4Format”。 对于 TransportStreamFormat,设置为“#Microsoft.Media.TransportStreamFormat”。 '#Microsoft.Media.JpgFormat'
'#Microsoft.Media.Mp4Format'
'#Microsoft.Media.PngFormat'
“#Microsoft.Media.TransportStreamFormat”(必需)
filenamePattern 用于创建输出文件的文件命名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件名称的扩展宏。 如果输入视频文件的基名称(不包括文件后缀)长度小于 32 个字符,将使用输入视频文件的基名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号(从 1 开始)。 {Bitrate} - 以 kbps 为单位的音频/视频比特率。 不适用于缩略图。 {编解码器} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未提交的宏都将折叠并从文件名中删除。 string (必需)

H264层

名称 DESCRIPTION 价值
adaptiveBFrame 是否在编码此层时使用自适应 B 帧。 如果未指定,则每当视频配置文件允许其使用时,编码器都会打开它。 布尔
b帧 编码此层时要使用的 B 帧数。 如果未指定,编码器将根据视频配置文件和级别选择适当的数字。 整数 (int)
比特率 生成此层时,每秒要对输入视频进行编码的平均比特率(以比特/秒为单位)。 这是必填字段。 int (必需)
缓冲窗口 VBV 缓冲区窗口长度。 该值应采用 ISO 8601 格式。 该值应位于 [0.1-100] 秒范围内。 默认值为 5 秒(例如 PT5S)。 字符串
CRF 编码此层时要使用的 CRF 值。 当在 CRF 模式下设置视频编解码器的 RateControlMode 时,此设置生效。 CRF 值的范围介于 0 和 51 之间,其中较低的值会导致质量更好,代价是文件大小较高。 较高的值意味着更多的压缩,但在某些时候会注意到质量下降。 默认值为 23。 整数 (int)
熵模式 要用于此层的萎缩模式。 如果未指定,编码器将选择适合配置文件和级别的模式。 “Cabac”
“Cavlc”
帧率 要对此层进行编码的帧速率(以每秒帧为单位)。 该值可以采用 M/N 的形式,其中 M 和 N 是整数(例如,30000/1001),也可以以数字的形式(例如,30 或 29.97)。 编码器根据配置文件和级别对允许的帧速率强制实施约束。 如果未指定,编码器将使用与输入视频相同的帧速率。 字符串
身高 此层的输出视频的高度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的高度为一半的像素(与输入相同)。 字符串
标签 此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 字符串
水平 我们目前支持高达 6.2 的级别。 该值可以是“自动”,也可以是与 H.264 配置文件匹配的数字。 如果未指定,则默认值为“自动”,允许编码器选择适合此层的级别。 字符串
最大比特率 最大比特率(以比特/秒为单位),其中应假定 VBV 缓冲区重新填充。 如果未指定,则默认为与比特率相同的值。 整数 (int)
简介 我们目前支持基线、Main、High、High422、High444。 默认值为“自动”。 “Auto”
“Baseline”
“High”
“High422”
“High444”
“Main”
referenceFrames 编码此层时要使用的引用帧数。 如果未指定,编码器会根据编码器复杂性设置确定适当的数字。 整数 (int)
编码此层时要使用的切片数。 如果未指定,则默认值为零,这意味着编码器将为每个帧使用单个切片。 整数 (int)
宽度 此层的输出视频的宽度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的宽度与输入的宽度相等一半。 字符串

H264视频

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.H264Video”(必需)
复杂性 告知编码器如何选择其编码设置。 默认值为“平衡”。 “平衡”
“质量”
“速度”
keyFrameInterval 键帧间隔 两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒(PT2S)。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 字符串
要由编码器生成的输出 H.264 层的集合。 H264层[]
rateControlMode 视频速率控制模式 “ABR”
“CBR”
“CRF”
sceneChangeDetection 编码器是否应在场景更改时插入关键帧。 如果未指定,则默认值为 false。 仅当编码器配置为生成单个输出视频时,才应将此标志设置为 true。 布尔
stretchMode (拉伸模式) 调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率。 默认值为 AutoSize “AutoFit”
“AutoSize”
“None”
syncMode 同步模式 视频同步模式 “Auto”
'Cfr'
“直通”
“Vfr”

H265层

名称 DESCRIPTION 价值
adaptiveBFrame 指定是否在编码此层时使用自适应 B 帧。 如果未指定,则每当视频配置文件允许其使用时,编码器都会打开它。 布尔
b帧 编码此层时要使用的 B 帧数。 如果未指定,编码器将根据视频配置文件和级别选择适当的数字。 整数 (int)
比特率 生成此层时,每秒要对输入视频进行编码的平均比特率(以比特/秒为单位)。 例如:目标比特率为 3000Kbps 或 3Mbps 表示此值应为 3000000。这是必填字段。 int (必需)
缓冲窗口 VBV 缓冲区窗口长度。 该值应采用 ISO 8601 格式。 该值应位于 [0.1-100] 秒范围内。 默认值为 5 秒(例如 PT5S)。 字符串
CRF 编码此层时要使用的 CRF 值。 当在 CRF 模式下设置视频编解码器的 RateControlMode 时,此设置生效。 CRF 值的范围介于 0 和 51 之间,其中较低的值会导致质量更好,代价是文件大小较高。 较高的值意味着更多的压缩,但在某些时候会注意到质量下降。 默认值为 28。 整数 (int)
帧率 要对此层进行编码的帧速率(以每秒帧为单位)。 该值可以采用 M/N 的形式,其中 M 和 N 是整数(例如,30000/1001),也可以以数字的形式(例如,30 或 29.97)。 编码器根据配置文件和级别对允许的帧速率强制实施约束。 如果未指定,编码器将使用与输入视频相同的帧速率。 字符串
身高 此层的输出视频的高度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的高度为一半的像素(与输入相同)。 字符串
标签 此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 字符串
水平 我们目前支持高达 6.2 的级别。 该值可以是“自动”,也可以是与 H.265 配置文件匹配的数字。 如果未指定,则默认值为“自动”,允许编码器选择适合此层的级别。 字符串
最大比特率 最大比特率(以比特/秒为单位),其中应假定 VBV 缓冲区重新填充。 如果未指定,则默认为与比特率相同的值。 整数 (int)
简介 我们目前支持 Main。 默认值为“自动”。 “Auto”
“Main”
“Main10”
referenceFrames 编码此层时要使用的引用帧数。 如果未指定,编码器会根据编码器复杂性设置确定适当的数字。 整数 (int)
编码此层时要使用的切片数。 如果未指定,则默认值为零,这意味着编码器将为每个帧使用单个切片。 整数 (int)
宽度 此层的输出视频的宽度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的宽度与输入的宽度相等一半。 字符串

H265视频

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.H265Video”(必需)
复杂性 告知编码器如何选择其编码设置。 质量将提供更高的压缩率,但成本更高,计算时间更长。 速度将产生一个相对较大的文件,但速度更快且更经济。 默认值为“平衡”。 “平衡”
“质量”
“速度”
keyFrameInterval 键帧间隔 两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒(PT2S)。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 字符串
要由编码器生成的输出 H.265 层的集合。 H265层[]
sceneChangeDetection 指定编码器是否应在场景更改时插入关键帧。 如果未指定,则默认值为 false。 仅当编码器配置为生成单个输出视频时,才应将此标志设置为 true。 布尔
stretchMode (拉伸模式) 调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率。 默认值为 AutoSize “AutoFit”
“AutoSize”
“None”
syncMode 同步模式 视频同步模式 “Auto”
'Cfr'
“直通”
“Vfr”

JPG 格式

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.JpgFormat”(必需)

Jpg图片

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.JpgImage”(必需)
keyFrameInterval 键帧间隔 两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒(PT2S)。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 字符串
要由编码器生成的输出 JPEG 图像层的集合。 JpgLayer[]
范围 相对于在输入视频中转换预设开始时间的位置,在该视频中停止生成缩略图。 该值可以采用 ISO 8601 格式(例如,PT5M30S从开始时间停止 5 分 30 秒)或帧计数(例如,从开始时从帧的第 300 帧停止的 300 个帧)。如果此值为 1,则表示仅在开始时间生成一个缩略图,或流持续时间的相对值(例如,50% 从开始时间停止流持续时间的一半)。 默认值为 100%,这意味着在流末尾停止。 字符串
spriteColumn 设置缩略图子画面图像中使用的列数。 自动计算行数,并使用子画面中每个缩略图的坐标映射生成 VTT 文件。 注意:此值应为正整数,建议使用适当的值,以便输出图像分辨率不会超出 JPEG 最大像素分辨率限制 65535x65535。 整数 (int)
开始 输入视频中开始生成缩略图的位置。 该值可以采用 ISO 8601 格式(例如 PT05S 以 5 秒开始),或帧计数(例如,从第 10 帧开始)或流持续时间的相对值(例如,10% 从流持续时间的 10% 开始)。 此外还支持宏 {Best},该宏告知编码器从视频的前几秒钟中选择最佳缩略图,并且无论步骤和范围的其他设置如何,都将仅生成一个缩略图。 默认值为宏 {Best}。 string (必需)
生成缩略图的间隔。 该值可以采用 ISO 8601 格式(例如,每 5 秒一张图像的 PT05S)或帧计数(例如,每 30 帧一张图像 30 张)或流持续时间的相对值(例如,每 10 个流持续时间每 10% 一张图像的 10%)。 注意:步骤值将影响第一个生成的缩略图,这可能不是在转换预设开始时间指定的缩略图。 这是由于编码器,它尝试从开始时间和步骤位置之间选择最佳缩略图作为第一个输出。 由于默认值为 10%,这意味着如果流具有较长的持续时间,则第一个生成的缩略图可能远离在开始时间指定的缩略图。 如果第一个缩略图预期接近开始时间,请尝试为 Step 选择合理的值,或者在开始时仅需要一个缩略图时将 Range 值设置为 1。 字符串
stretchMode (拉伸模式) 调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率。 默认值为 AutoSize “AutoFit”
“AutoSize”
“None”
syncMode 同步模式 视频同步模式 “Auto”
'Cfr'
“直通”
“Vfr”

Jpg 图层

名称 DESCRIPTION 价值
身高 此层的输出视频的高度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的高度为一半的像素(与输入相同)。 字符串
标签 此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 字符串
质量 JPEG 输出的压缩质量。 范围为 0-100,默认值为 70。 整数 (int)
宽度 此层的输出视频的宽度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的宽度与输入的宽度相等一半。 字符串

Microsoft.Media/mediaServices/transforms

名称 DESCRIPTION 价值
姓名 资源名称 string (必需)
parent_id 此资源的父资源的 ID。 类型资源的 ID: mediaServices
属性 资源属性。 TransformProperties (变换属性)
类型 资源类型 “Microsoft.Media/mediaServices/transforms@2022-07-01”

Mp4格式

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.Mp4Format”(必需)
outputFiles (输出文件) 要生成的输出文件的列表。 列表中的每个条目都是一组要一起复用的音频和视频层标签。 输出文件[]

输出文件

名称 DESCRIPTION 价值
标签 描述编码器如何将视频和音频多路复用到输出文件中的标签列表。 例如,如果编码器正在生成带有标签 v1 和 v2 的两个视频层,以及一个带有标签 a1 的音频层,则“[v1, a1]”等数组会告知编码器生成一个输出文件,其中包含 v1 表示的视频轨迹和 a1 表示的音频轨迹。 string[] (必需)

覆盖

名称 DESCRIPTION 价值
@odata.type 对于 Type AudioOverlay,设置为“#Microsoft.Media.AudioOverlay”。 对于 VideoOverlay 类型,设置为“#Microsoft.Media.VideoOverlay”。 “#Microsoft.Media.AudioOverlay”
“#Microsoft.Media.VideoOverlay”(必需)
audioGainLevel 音频增益级别 覆盖中的音频增益级别。 该值应位于 [0, 1.0] 范围内。 默认值为 1.0。 整数 (int)
结束 结束位置,引用输入视频,覆盖结束。 该值应采用 ISO 8601 格式。 例如,PT30S 在输入视频中以 30 秒结束覆盖。 如果未指定或值大于输入视频持续时间,则在覆盖媒体持续时间大于输入视频持续时间时,将应用覆盖层,直到输入视频结束,否则覆盖将持续到覆盖媒体持续时间。 字符串
淡化持续时间 覆盖逐渐淡入输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定默认行为,则不会淡入(与 PT0S 相同)。 字符串
淡出持续时间 覆盖逐渐淡出输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定默认行为,则不会淡出(与 PT0S 相同)。 字符串
inputLabel (输入标签) 要用作覆盖的作业输入的标签。 输入必须指定一个文件。 可以使用 JPG、PNG、GIF 或 BMP 格式或音频文件(如 WAV、MP3、WMA 或 M4A 文件)或视频文件指定图像文件。 请参阅 https://aka.ms/mesformats 支持的音频和视频文件格式的完整列表。 string (必需)
开始 开始位置,引用输入视频,覆盖开始。 该值应采用 ISO 8601 格式。 例如,PT05S 在输入视频中的 5 秒处启动覆盖。 如果未指定覆盖层,则从输入视频的开头开始。 字符串

Png格式

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.PngFormat”(必需)

Png图像

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.PngImage”(必需)
keyFrameInterval 键帧间隔 两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒(PT2S)。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。 字符串
要由编码器生成的输出 PNG 图像层的集合。 PngLayer[]
范围 相对于在输入视频中转换预设开始时间的位置,在该视频中停止生成缩略图。 该值可以采用 ISO 8601 格式(例如,PT5M30S从开始时间停止 5 分 30 秒)或帧计数(例如,从开始时从帧的第 300 帧停止的 300 个帧)。如果此值为 1,则表示仅在开始时间生成一个缩略图,或流持续时间的相对值(例如,50% 从开始时间停止流持续时间的一半)。 默认值为 100%,这意味着在流末尾停止。 字符串
开始 输入视频中开始生成缩略图的位置。 该值可以采用 ISO 8601 格式(例如 PT05S 以 5 秒开始),或帧计数(例如,从第 10 帧开始)或流持续时间的相对值(例如,10% 从流持续时间的 10% 开始)。 此外还支持宏 {Best},该宏告知编码器从视频的前几秒钟中选择最佳缩略图,并且无论步骤和范围的其他设置如何,都将仅生成一个缩略图。 默认值为宏 {Best}。 string (必需)
生成缩略图的间隔。 该值可以采用 ISO 8601 格式(例如,每 5 秒一张图像的 PT05S)或帧计数(例如,每 30 帧一张图像 30 张)或流持续时间的相对值(例如,每 10 个流持续时间每 10% 一张图像的 10%)。 注意:步骤值将影响第一个生成的缩略图,这可能不是在转换预设开始时间指定的缩略图。 这是由于编码器,它尝试从开始时间和步骤位置之间选择最佳缩略图作为第一个输出。 由于默认值为 10%,这意味着如果流具有较长的持续时间,则第一个生成的缩略图可能远离在开始时间指定的缩略图。 如果第一个缩略图预期接近开始时间,请尝试为 Step 选择合理的值,或者在开始时仅需要一个缩略图时将 Range 值设置为 1。 字符串
stretchMode (拉伸模式) 调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率。 默认值为 AutoSize “AutoFit”
“AutoSize”
“None”
syncMode 同步模式 视频同步模式 “Auto”
'Cfr'
“直通”
“Vfr”

Png图层

名称 DESCRIPTION 价值
身高 此层的输出视频的高度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的高度为一半的像素(与输入相同)。 字符串
标签 此层的字母数字标签,可用于多路复用不同的视频和音频层或命名输出文件。 字符串
宽度 此层的输出视频的宽度。 该值可以是绝对值(以像素为单位)或相对值(以百分比为单位)。 例如,50% 表示输出视频的宽度与输入的宽度相等一半。 字符串

预设

名称 DESCRIPTION 价值
@odata.type 对于 VideoAnalyzerPreset 类型,设置为“#Microsoft.Media.VideoAnalyzerPreset”。 对于 BuiltInStandardEncoderPreset,设置为“#Microsoft.Media.BuiltInStandardEncoderPreset”。 对于 FaceDetectorPreset 类型,设置为“#Microsoft.Media.FaceDetectorPreset”。 对于 StandardEncoderPreset 类型,设置为“#Microsoft.Media.StandardEncoderPreset”。 “#Microsoft.Media.BuiltInStandardEncoderPreset”
“#Microsoft.Media.FaceDetectorPreset”
“#Microsoft.Media.StandardEncoderPreset”
“#Microsoft.Media.VideoAnalyzerPreset”(必需)

PresetConfigurations

名称 DESCRIPTION 价值
复杂性 允许配置编码器设置,以控制速度和质量之间的平衡。 示例:将复杂性设置为“速度”,以提高编码速度,但压缩效率较低。 “平衡”
“质量”
“速度”
interleaveOutput (交错输出) 设置输出的交错模式,以控制音频和视频如何以容器格式存储。 示例:将 InterleavedOutput 设置为 NonInterleavedOutput,以在单独的 MP4 文件中生成仅音频和仅视频输出。 “InterleavedOutput”
“NonInterleavedOutput”
keyFrameIntervalInSeconds 关键帧间隔(以秒为单位)。 示例:将 KeyFrameIntervalInSeconds 设置为 2 以减少某些玩家的播放缓冲。 整数 (int)
最大比特率 Bps 最大比特率(每秒位数)(最高视频层的阈值)。 示例:将 MaxBitrateBps 设置为 6000000,以避免为具有较高复杂性的内容生成非常高的比特率输出。 整数 (int)
最大高度 输出视频层的最大高度。 示例:将 MaxHeight 设置为 720 以生成高达 720P 的输出层,即使输入为 4K 也是如此。 整数 (int)
最大层数 输出视频层的最大数目。 示例:将 MaxLayers 设置为 4,以确保生成最多 4 个输出层,以控制编码作业的总体成本。 整数 (int)
最小比特率 Bps 最小比特率(每秒位数)(底层视频层的阈值)。 示例:将 MinBitrateBps 设置为 200000,其底层覆盖网络带宽较低的用户。 整数 (int)
minHeight 输出视频层的最小高度。 示例:将 MinHeight 设置为 360,以避免输出层较小的分辨率,例如 180P。 整数 (int)

矩形

名称 DESCRIPTION 价值
身高 矩形区域的高度(以像素为单位)。 这可以是绝对像素值(例如 100),也可以相对于视频的大小(例如,50%)。 字符串
左边距中的像素数。 这可以是绝对像素值(例如 100),也可以相对于视频的大小(例如,50%)。 字符串
顶部 上边距中的像素数。 这可以是绝对像素值(例如 100),也可以相对于视频的大小(例如,50%)。 字符串
宽度 矩形区域的宽度(以像素为单位)。 这可以是绝对像素值(例如 100),也可以相对于视频的大小(例如,50%)。 字符串

StandardEncoderPreset

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.StandardEncoderPreset”(必需)
编 解码 器 编码输入视频时要使用的编解码器列表。 编解码器[] (必需)
experimental选项 包含预设本身中未公开的参数的键值对的字典 StandardEncoderPresetExperimentalOptions
筛选器 编码前应用于输入媒体的一个或多个筛选作。 过滤 器
格式 要由编码器生成的输出列表。 Format[] (必需)

StandardEncoderPresetExperimentalOptions

名称 DESCRIPTION 价值

TransformOutput (变换输出)

名称 DESCRIPTION 价值
onError 错误 转换可以定义多个输出。 此属性定义服务在一个输出失败时应执行的作 - 继续生成其他输出,或者停止其他输出。 总体作业状态不会反映使用“ContinueJob”指定的输出失败。 默认值为“StopProcessingJob”。 “ContinueJob”
“StopProcessingJob”
预设 描述将用于修改、转码或从源文件中提取见解以生成输出的作的预设。 预设 (必需)
relativePriority 设置 Transform 中的 TransformOutputs 的相对优先级。 这会设置服务用于处理 TransformOutputs 的优先级。 默认优先级为 Normal。 “High”
“Low”
“Normal”

TransformProperties (变换属性)

名称 DESCRIPTION 价值
描述 转换的可选详细描述。 字符串
输出 转换应生成的一个或多个 TransformOutput 的数组。 TransformOutput[] (必需)

TransportStreamFormat 格式

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.TransportStreamFormat”(必需)
outputFiles (输出文件) 要生成的输出文件的列表。 列表中的每个条目都是一组要一起复用的音频和视频层标签。 输出文件[]

VideoAnalyzer预设

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.VideoAnalyzerPreset”(必需)
音频语言 使用“语言标记区域”的 BCP-47 格式(例如“en-US”)输入中的音频有效负载的语言。 如果知道内容的语言,建议指定它。 必须为 AudioAnalysisMode::Basic 显式指定语言,因为基本模式下不包括自动语言检测。 如果未指定语言或设置为 null,则自动语言检测将选择检测到的第一种语言,并在文件的持续时间内使用所选语言进行处理。 它目前不支持在检测到第一种语言后动态切换语言。 自动检测最适用于具有清晰辨别语音的录音。 如果自动检测找不到语言,则听录将回退到“en-US”。”此处提供了支持的语言列表: https://go.microsoft.com/fwlink/?linkid=2109463 字符串
experimental选项 包含预设本身中未公开的参数的键值对的字典 AudioAnalyzerPresetExperimentalOptions
insightsToExtract 定义希望服务生成的见解类型。 允许的值为“AudioInsightsOnly”、“VideoInsightsOnly”和“AllInsights”。 默认值为 AllInsights。 如果将此项设置为 AllInsights,并且输入仅为音频,则仅生成音频见解。 同样,如果输入仅是视频,则仅生成视频见解。 如果希望某些输入仅成为视频,建议不要使用 AudioInsightsOnly;如果希望某些输入仅音频,请使用 VideoInsightsOnly。 处于此类条件的作业将出错。 “AllInsights”
“AudioInsightsOnly”
“VideoInsightsOnly”
模式 确定要执行的音频分析作集。 如果未指定,则会选择标准 AudioAnalysisMode。 “Basic”
“Standard”

视频叠加

名称 DESCRIPTION 价值
@odata.type 派生类型的歧视性。 “#Microsoft.Media.VideoOverlay”(必需)
cropRectangle 的 用于裁剪覆盖图像或视频的可选矩形窗口。 矩形
不透明度 覆盖的不透明度。 这是 [0 - 1.0] 范围内的值。 默认值为 1.0,表示覆盖不透明。 整数 (int)
职位 应用覆盖层的输入视频中的位置。 矩形