你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Transforms - Get

获取转换
获取转换。

GET https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.Media/mediaServices/{accountName}/transforms/{transformName}?api-version=2021-11-01

URI 参数

Name In Required Type Description
accountName
path True
  • string

媒体服务帐户名称。

resourceGroupName
path True
  • string

Azure 订阅中的资源组的名称。

subscriptionId
path True
  • string

Microsoft Azure订阅的唯一标识符。

transformName
path True
  • string

转换名称。

api-version
query True
  • string

要与客户端请求一起使用的 API 版本。

响应

Name Type Description
200 OK

OK

Other Status Codes

详细的错误信息。

示例

Get a Transform by name

Sample Request

GET https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/contosoresources/providers/Microsoft.Media/mediaServices/contosomedia/transforms/sampleTransform?api-version=2021-11-01

Sample Response

{
  "name": "sampleTransform",
  "id": "/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/contosoresources/providers/Microsoft.Media/mediaservices/contosomedia/transforms/sampleTransform",
  "type": "Microsoft.Media/mediaservices/transforms",
  "properties": {
    "created": "2021-07-12T10:44:29.2267128Z",
    "description": "A sample Transform using the Standard Encoder with a built in preset.",
    "lastModified": "2021-07-12T10:44:29.2267128Z",
    "outputs": [
      {
        "onError": "StopProcessingJob",
        "relativePriority": "Normal",
        "preset": {
          "@odata.type": "#Microsoft.Media.BuiltInStandardEncoderPreset",
          "presetName": "H264MultipleBitrate1080p"
        }
      }
    ]
  },
  "systemData": {
    "createdBy": "contoso@microsoft.com",
    "createdByType": "User",
    "createdAt": "2021-07-12T10:44:29.2267128Z",
    "lastModifiedBy": "contoso@microsoft.com",
    "lastModifiedByType": "User",
    "lastModifiedAt": "2021-07-12T10:44:29.2267128Z"
  }
}

定义

AacAudio

介绍高级音频编解码器 (AAC) 音频编码设置。

AacAudioProfile

使用 AAC 编码音频时要使用的编码配置文件。

AnalysisResolution

指定分析视频的最大分辨率。 默认行为为“SourceResolution”,在分析时,该行为将保持输入视频的原始分辨率。 使用“StandardDefinition”会将输入视频的大小调整为标准定义,同时保留适当的纵横比。 仅当视频分辨率较高时,它才会调整大小。 例如,在处理之前,1920x1080 输入将缩放为 640x360。 切换到“StandardDefinition”可以减少处理高分辨率视频所需的时间。 它还可能会降低使用此组件的成本, (查看 https://azure.microsoft.com/en-us/pricing/details/media-services/#analytics 详细信息) 。 但是,可能无法检测到最终在调整大小的视频中太小的人脸。

Audio

定义所有音频编解码器的通用属性。

AudioAnalysisMode

确定要执行的音频分析操作集。 如果未指定,则会选择标准 AudioAnalysisMode。

AudioAnalyzerPreset

音频分析器预设应用一组预定义的基于 AI 的分析操作,包括语音听录。 目前,该预设支持处理单个音轨的内容。

AudioOverlay

描述音频覆盖的属性。

BlurType

模糊类型

BuiltInStandardEncoderPreset

描述使用标准编码器对输入视频进行编码的内置预设。

Complexity

可用于配置编码器设置,以控制速度和质量之间的平衡。 示例:将复杂性设置为“速度”,以提高编码速度,但压缩效率较低。

CopyAudio

编解码器标志,指示编码器复制输入音频位流。

CopyVideo

编解码器标志,指示编码器在不重新编码的情况下复制输入视频位流。

createdByType

创建资源的标识的类型。

Deinterlace

描述反交错设置。

DeinterlaceMode

反交错模式。 默认为 AutoPixelAdaptive。

DeinterlaceParity

取消交错的字段奇偶校验默认为“自动”。

EncoderNamedPreset

用于编码视频的内置预设。

EntropyMode

要用于此层的萎缩模式。 如果未指定,编码器会选择适合配置文件和级别的模式。

ErrorAdditionalInfo

资源管理错误附加信息。

ErrorDetail

错误详细信息。

ErrorResponse

错误响应

FaceDetectorPreset

描述分析视频时要使用的所有设置,以便检测 (并选择性地) 显示的所有人脸进行修订。

FaceRedactorMode

此模式提供在以下设置之间进行选择的功能:1) 分析 - 仅用于检测。此模式会生成元数据 JSON 文件,用于标记整个视频中人脸的外观。如果可能,同一人的外观将分配相同的 ID。2) 组合 - 此外, (模糊) 检测到的人脸进行修订。 3) Redact - 这可实现 2 次传递过程,从而允许对检测到的人脸子集进行选择性修订。它从以前的分析传递以及源视频以及需要修订的用户选择 ID 子集中获取元数据文件。

Filters

描述在编码之前应用于输入媒体的所有筛选操作,例如反交错、旋转等。

H264Complexity

告知编码器如何选择其编码设置。 默认值为“均衡”。

H264Layer

描述使用 H.264 视频编解码器将输入视频编码为所需输出比特率层时要使用的设置。

H264RateControlMode

视频速率控制模式

H264Video

描述使用 H.264 编解码器对视频进行编码的所有属性。

H264VideoProfile

我们目前支持基线、Main、High、High422、High444。 默认值为“自动”。

H265Complexity

告知编码器如何选择其编码设置。 质量将提供更高的压缩率,但成本更高,计算时间更长。 速度将生成一个相对较大的文件,但速度更快且更经济。 默认值为“均衡”。

H265Layer

描述使用 H.265 视频编解码器将输入视频编码为所需输出比特率层时要使用的设置。

H265Video

描述使用 H.265 编解码器对视频进行编码的所有属性。

H265VideoProfile

我们目前支持 Main。 默认值为“自动”。

Image

介绍从输入视频生成缩略图的基本属性

ImageFormat

描述输出图像文件的属性。

InsightsType

定义希望服务生成的见解类型。 允许的值为“AudioInsightsOnly”、“VideoInsightsOnly”和“AllInsights”。 默认值为 AllInsights。 如果将此项设置为 AllInsights 且输入仅为音频,则只会生成音频见解。 同样,如果输入仅是视频,则仅生成视频见解。 如果希望某些输入仅成为视频,建议不要使用 AudioInsightsOnly;或者,如果希望某些输入仅音频,请使用 VideoInsightsOnly。 此类条件下的作业将出错。

InterleaveOutput

设置输出的交错模式,以控制音频和视频如何以容器格式存储。 示例:将 InterleavedOutput 设置为 NonInterleavedOutput,以在单独的 MP4 文件中生成仅音频和仅视频输出。

JpgFormat

描述用于生成 JPEG 缩略图的设置。

JpgImage

描述从输入视频生成一系列 JPEG 图像的属性。

JpgLayer

描述从输入视频生成 JPEG 图像的设置。

Mp4Format

描述输出 ISO MP4 文件的属性。

MultiBitrateFormat

描述生成 GOP 对齐多比特率文件的集合的属性。 默认行为是为每个视频层生成一个输出文件,该文件与所有音频一起复用。 可以通过指定 outputFiles 集合来控制生成的确切输出文件。

OnErrorType

转换可以定义多个输出。 此属性定义服务在一个输出失败时应执行的操作 - 继续生成其他输出,或者停止其他输出。 总体作业状态不会反映使用“ContinueJob”指定的输出失败。 默认值为“StopProcessingJob”。

OutputFile

表示生成的输出文件。

PngFormat

描述用于生成 PNG 缩略图的设置。

PngImage

描述从输入视频生成一系列 PNG 图像的属性。

PngLayer

描述从输入视频生成 PNG 图像的设置。

PresetConfigurations

编码器的可选配置设置的对象。

Priority

设置 TransformOutputs 的相对优先级。 这会设置服务用于处理 TransformOutputs 的优先级。 默认优先级为 Normal。

Rectangle

描述在处理矩形窗口之前应用于输入媒体的属性。

Rotation

在对输入视频进行编码之前,将旋转(如果有)应用于输入视频。 默认值为“自动”

StandardEncoderPreset

介绍使用标准编码器对输入视频进行编码时要使用的所有设置。

StretchMode

调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 () 。 默认值为 AutoSize

systemData

与创建和上次修改资源相关的元数据。

Transform

转换封装用于从输入媒体(如转码或提取见解)生成所需输出的规则或说明。 创建转换后,可以通过创建作业将其应用于输入媒体。

TransformOutput

描述 TransformOutput 的属性,这些属性是生成所需输出时要应用的规则。

TransportStreamFormat

介绍生成 MPEG-2 传输流 (ISO/IEC 13818-1) 输出视频文件的属性, (s) 。

Video

描述编码输入视频的基本属性。

VideoAnalyzerPreset

视频分析器预设,用于从音频和视频中提取见解 (丰富的元数据) ,并输出 JSON 格式化文件。

VideoOverlay

描述视频覆盖的属性。

VideoSyncMode

视频同步模式

AacAudio

介绍高级音频编解码器 (AAC) 音频编码设置。

Name Type Description
@odata.type string:
  • #Microsoft.Media.AacAudio

派生类型的歧视性。

bitrate
  • integer

输出编码音频的比特率(以位数/秒为单位)。

channels
  • integer

音频中的通道数。

label
  • string

编解码器的可选标签。 标签可用于控制复用行为。

profile

使用 AAC 编码音频时要使用的编码配置文件。

samplingRate
  • integer

用于以赫茨编码的采样率。

AacAudioProfile

使用 AAC 编码音频时要使用的编码配置文件。

Name Type Description
AacLc
  • string

指定输出音频要编码为 AAC 低复杂性配置文件, (AAC-LC) 。

HeAacV1
  • string

指定将输出音频编码为 HE-AAC v1 配置文件。

HeAacV2
  • string

指定将输出音频编码为 HE-AAC v2 配置文件。

AnalysisResolution

指定分析视频的最大分辨率。 默认行为为“SourceResolution”,在分析时,该行为将保持输入视频的原始分辨率。 使用“StandardDefinition”会将输入视频的大小调整为标准定义,同时保留适当的纵横比。 仅当视频分辨率较高时,它才会调整大小。 例如,在处理之前,1920x1080 输入将缩放为 640x360。 切换到“StandardDefinition”可以减少处理高分辨率视频所需的时间。 它还可能会降低使用此组件的成本, (查看 https://azure.microsoft.com/en-us/pricing/details/media-services/#analytics 详细信息) 。 但是,可能无法检测到最终在调整大小的视频中太小的人脸。

Name Type Description
SourceResolution
  • string
StandardDefinition
  • string

Audio

定义所有音频编解码器的通用属性。

Name Type Description
@odata.type string:
  • #Microsoft.Media.Audio

派生类型的歧视性。

bitrate
  • integer

输出编码音频的比特率(以位数/秒为单位)。

channels
  • integer

音频中的通道数。

label
  • string

编解码器的可选标签。 标签可用于控制复用行为。

samplingRate
  • integer

用于以赫茨编码的采样率。

AudioAnalysisMode

确定要执行的音频分析操作集。 如果未指定,则会选择标准 AudioAnalysisMode。

Name Type Description
Basic
  • string

此模式执行语音转文本听录并生成 VTT 字幕文件。 此模式的输出包括一个见解 JSON 文件,该文件仅包含关键字、听录和计时信息。 此模式不包括自动语言检测和说话人分割聚类。

Standard
  • string

执行基本模式中包含的所有操作,此外执行语言检测和说话人听写。

AudioAnalyzerPreset

音频分析器预设应用一组预定义的基于 AI 的分析操作,包括语音听录。 目前,该预设支持处理单个音轨的内容。

Name Type Description
@odata.type string:
  • #Microsoft.Media.AudioAnalyzerPreset

派生类型的歧视性。

audioLanguage
  • string

使用“语言标记区域”的 BCP-47 格式输入中的音频有效负载的语言 (例如:“en-US”) 。 如果知道内容的语言,建议指定它。 必须为 AudioAnalysisMode::Basic 显式指定该语言,因为自动语言检测不包括在基本模式下。 如果未指定语言或将语言设置为 null,自动语言检测将选择检测到的第一种语言并使用所选语言处理整个文件。 它目前不支持在检测到第一种语言后在各语言之间进行动态切换。 自动检测最适用于具有清晰辨别语音的音频录制。 如果自动检测找不到语言,听录将回退到“en-US”。此处提供了受支持的语言列表: https://go.microsoft.com/fwlink/?linkid=2109463

experimentalOptions
  • object

包含预设本身中未公开的参数的键值对的字典

mode

确定要执行的音频分析操作集。 如果未指定,则会选择标准 AudioAnalysisMode。

AudioOverlay

描述音频覆盖的属性。

Name Type Description
@odata.type string:
  • #Microsoft.Media.AudioOverlay

派生类型的歧视性。

audioGainLevel
  • number

覆盖中的音频增益级别。 该值应位于 [0, 1.0] 范围内。 默认值为 1.0。

end
  • string

结束位置,包含对输入视频的引用,覆盖结束。 该值应采用 ISO 8601 格式。 例如,PT30S 在输入视频中以 30 秒结束覆盖。 如果未指定或值大于输入视频持续时间,则覆盖将应用于输入视频的末尾(如果覆盖媒体持续时间大于输入视频持续时间),否则覆盖将持续到覆盖媒体持续时间。

fadeInDuration
  • string

覆盖逐渐淡入输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定默认行为,则不会在与 PT0S) 相同的 (中淡出。

fadeOutDuration
  • string

覆盖层淡出输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定,则默认行为是没有与 PT0S) 相同的淡出 (。

inputLabel
  • string

要用作覆盖的作业输入的标签。 输入必须指定一个文件。 可以指定 JPG、PNG、GIF 或 BMP 格式的图像文件,或者指定音频文件(如 WAV、MP3、WMA 或 M4A 文件)或视频文件。 请参阅 https://aka.ms/mesformats 支持的音频和视频文件格式的完整列表。

start
  • string

开始位置,其中包含对输入视频的引用,覆盖层将从该位置开始。 该值应采用 ISO 8601 格式。 例如,PT05S 在输入视频中以 5 秒开始覆盖。 如果未指定覆盖层,则从输入视频的开头开始。

BlurType

模糊类型

Name Type Description
Black
  • string

黑色:黑出筛选器

Box
  • string

框:调试筛选器,仅边界框

High
  • string

高:混淆模糊筛选器

Low
  • string

低:箱车模糊筛选器

Med
  • string

Med:高斯模糊筛选器

BuiltInStandardEncoderPreset

描述使用标准编码器对输入视频进行编码的内置预设。

Name Type Description
@odata.type string:
  • #Microsoft.Media.BuiltInStandardEncoderPreset

派生类型的歧视性。

configurations

编码器的可选配置设置。 仅 ContentAwareEncoding 和 H265ContentAwareEncoding BuiltInStandardEncoderPreset 支持配置。

presetName

用于编码视频的内置预设。

Complexity

可用于配置编码器设置,以控制速度和质量之间的平衡。 示例:将复杂性设置为“速度”,以提高编码速度,但压缩效率较低。

Name Type Description
Balanced
  • string

将编码器配置为使用在速度和质量之间实现平衡的设置。

Quality
  • string

将编码器配置为使用经过优化的设置,以产生更高质量的输出,代价是总体编码时间变慢。

Speed
  • string

将编码器配置为使用经过优化的设置以加快编码速度。 为了缩短编码时间,会牺牲质量。

CopyAudio

编解码器标志,指示编码器复制输入音频位流。

Name Type Description
@odata.type string:
  • #Microsoft.Media.CopyAudio

派生类型的歧视性。

label
  • string

编解码器的可选标签。 标签可用于控制复用行为。

CopyVideo

编解码器标志,指示编码器在不重新编码的情况下复制输入视频位流。

Name Type Description
@odata.type string:
  • #Microsoft.Media.CopyVideo

派生类型的歧视性。

label
  • string

编解码器的可选标签。 标签可用于控制复用行为。

createdByType

创建资源的标识的类型。

Name Type Description
Application
  • string
Key
  • string
ManagedIdentity
  • string
User
  • string

Deinterlace

描述反交错设置。

Name Type Description
mode

反交错模式。 默认为 AutoPixelAdaptive。

parity

取消交错的字段奇偶校验默认为“自动”。

DeinterlaceMode

反交错模式。 默认为 AutoPixelAdaptive。

Name Type Description
AutoPixelAdaptive
  • string

在输入视频中的每个帧上应用自动像素自适应反交错。

Off
  • string

禁用源视频的反交错。

DeinterlaceParity

取消交错的字段奇偶校验默认为“自动”。

Name Type Description
Auto
  • string

自动检测字段的顺序

BottomFieldFirst
  • string

应用底部字段第一次处理输入视频。

TopFieldFirst
  • string

应用顶部字段第一个输入视频处理。

EncoderNamedPreset

用于编码视频的内置预设。

Name Type Description
AACGoodQualityAudio
  • string

生成一个 MP4 文件,该文件仅包含编码为 192 kbps 的立体声音频。

AdaptiveStreaming
  • string

使用 H.264 视频和立体声 AAC 音频生成一组 GOP 对齐的 MP4 文件。 根据输入分辨率、比特率和帧速率自动生成比特率阶梯。 自动生成的预设始终不会超过输入分辨率。 例如,如果输入为 720p,则输出将最高保持 720p。

ContentAwareEncoding
  • string

使用内容感知编码生成一组符合 GOP 标准的 MP4。 在提供任何输入内容的情况下,服务将对输入内容执行初始的轻量分析,并使用结果来确定最佳层数,以及自适应流式处理适合传送的比特率和分辨率设置。 此预设对于中低复杂度的视频特别有效,这些视频的输出文件的比特率将会较低,但质量仍可为观看者带来良好体验。 输出将包含带有交错式视频和音频的 MP4 文件。

ContentAwareEncodingExperimental
  • string

公开内容感知编码的实验预设。 在提供任何输入内容的情况下,服务将尝试自动确定最佳层数,以及自适应流式处理适合使用的比特率和分辨率设置。 底层算法将不断演进。 输出将包含带有交错式视频和音频的 MP4 文件。

CopyAllBitrateNonInterleaved
  • string

将输入资产中的所有视频和音频流复制为非交错视频和音频输出文件。 此预设可用于剪辑现有资产,或将一组关键帧 (GOP) 对齐的 MP4 文件转换为可流式传输的资产。

H264MultipleBitrate1080p
  • string

生成一组 8 GOP 对齐的 MP4 文件,范围从 6000 kbps 到 400 kbps,以及立体声 AAC 音频。 分辨率从 1080p 开始,下降到 180p。

H264MultipleBitrate720p
  • string

生成一组 6 GOP 对齐的 MP4 文件,范围从 3400 kbps 到 400 kbps,以及立体声 AAC 音频。 分辨率从 720p 开始,下降到 180p。

H264MultipleBitrateSD
  • string

生成一组 5 GOP 对齐的 MP4 文件,范围从 1900kbps 到 400 kbps,以及立体声 AAC 音频。 分辨率从 480p 开始,下降到 240p。

H264SingleBitrate1080p
  • string

生成 MP4 文件,其中视频使用 H.264 编解码器编码为 6750 kbps,图片高度为 1080 像素,立体声音频使用 AAC-LC 编解码器编码为 128 kbps。

H264SingleBitrate720p
  • string

生成 MP4 文件,其中视频使用 H.264 编解码器编码为 4500 kbps,图片高度为 720 像素,立体声音频使用 AAC-LC 编解码器编码为 128 kbps。

H264SingleBitrateSD
  • string

生成 MP4 文件,其中视频使用 H.264 编解码器编码为 2200 kbps,图片高度为 480 像素,立体声音频使用 AAC-LC 编解码器编码为 128 kbps。

H265AdaptiveStreaming
  • string

生成一组符合 GOP 的 MP4 文件,其中包含 H.265 视频和立体声 AAC 音频。 根据输入分辨率、比特率和帧速率自动生成比特率阶梯。 自动生成的预设始终不会超过输入分辨率。 例如,如果输入为 720p,则输出将最高保持 720p。

H265ContentAwareEncoding
  • string

使用内容感知编码生成一组符合 GOP 标准的 MP4。 在提供任何输入内容的情况下,服务将对输入内容执行初始的轻量分析,并使用结果来确定最佳层数,以及自适应流式处理适合传送的比特率和分辨率设置。 此预设对于中低复杂度的视频特别有效,这些视频的输出文件的比特率将会较低,但质量仍可为观看者带来良好体验。 输出将包含带有交错式视频和音频的 MP4 文件。

H265SingleBitrate1080p
  • string

生成 MP4 文件,其中视频使用 H.265 编解码器编码为 3500 kbps,图片高度为 1080 像素,立体声音频使用 AAC-LC 编解码器编码为 128 kbps。

H265SingleBitrate4K
  • string

生成 MP4 文件,其中视频使用 H.265 编解码器编码为 9500 kbps,图片高度为 2160 像素,立体声音频使用 AAC-LC 编解码器编码为 128 kbps。

H265SingleBitrate720p
  • string

生成 MP4 文件,其中视频使用 H.265 编解码器编码为 1800 kbps,图片高度为 720 像素,立体声音频使用 AAC-LC 编解码器编码为 128 kbps。

EntropyMode

要用于此层的萎缩模式。 如果未指定,编码器会选择适合配置文件和级别的模式。

Name Type Description
Cabac
  • string

上下文自适应二进制算术编码程序 (CABAC) entropy 编码。

Cavlc
  • string

上下文自适应可变长度编码程序 (CAVLC) entropy 编码。

ErrorAdditionalInfo

资源管理错误附加信息。

Name Type Description
info
  • object

其他信息。

type
  • string

其他信息类型。

ErrorDetail

错误详细信息。

Name Type Description
additionalInfo

错误附加信息。

code
  • string

错误代码。

details

错误详细信息。

message
  • string

错误消息。

target
  • string

错误目标。

ErrorResponse

错误响应

Name Type Description
error

错误对象。

FaceDetectorPreset

描述分析视频时要使用的所有设置,以便检测 (并选择性地) 显示的所有人脸进行修订。

Name Type Description
@odata.type string:
  • #Microsoft.Media.FaceDetectorPreset

派生类型的歧视性。

blurType

模糊类型

experimentalOptions
  • object

包含预设本身中未公开的参数的键值对的字典

mode

此模式提供在以下设置之间进行选择的功能:1) 分析 - 仅用于检测。此模式生成元数据 JSON 文件,用于标记整个视频中人脸的外观。如果可能,同一人的外观将分配相同的 ID。2) 组合 - 此外, (模糊) 检测到的人脸进行修订。 3) Redact - 这可实现 2 次传递过程,从而允许对检测到的人脸子集进行选择性修订。它从先前的分析传递以及源视频以及需要修订的用户选择 ID 子集中获取元数据文件。

resolution

指定分析视频的最大分辨率。 默认行为为“SourceResolution”,在分析时将输入视频保留为其原始分辨率。 使用“StandardDefinition”会将输入视频的大小调整为标准定义,同时保留适当的纵横比。 仅当视频分辨率较高时,才会调整大小。 例如,在处理之前,1920x1080 输入将缩放为 640x360。 切换到“StandardDefinition”可以减少处理高分辨率视频所需的时间。 它还可能会降低使用此组件的成本, (有关详细信息 https://azure.microsoft.com/en-us/pricing/details/media-services/#analytics) 。 但是,可能无法检测到在调整大小的视频中最终太小的人脸。

FaceRedactorMode

此模式提供在以下设置之间进行选择的功能:1) 分析 - 仅用于检测。此模式会生成元数据 JSON 文件,用于标记整个视频中人脸的外观。如果可能,同一人的外观将分配相同的 ID。2) 组合 - 此外, (模糊) 检测到的人脸进行修订。 3) Redact - 这可实现 2 次传递过程,从而允许对检测到的人脸子集进行选择性修订。它从以前的分析传递以及源视频以及需要修订的用户选择 ID 子集中获取元数据文件。

Name Type Description
Analyze
  • string

分析模式检测人脸并输出包含结果的元数据文件。 允许编辑元数据文件,然后再使用 Redact 模式模糊人脸。

Combined
  • string

编辑分析的人脸时,组合模式在一次传递中执行分析和修订步骤。

Redact
  • string

Redact 模式使用分析模式下的元数据文件,并编辑找到的人脸。

Filters

描述在编码之前应用于输入媒体的所有筛选操作,例如反交错、旋转等。

Name Type Description
crop

用于裁剪输入视频的矩形窗口的参数。

deinterlace

取消交错设置。

overlays Overlay[]:

要应用于输入视频的覆盖的属性。 这些可能是音频、图像或视频覆盖层。

rotation

在对输入视频进行编码之前,将旋转(如果有)应用于输入视频。 默认值为“自动”

H264Complexity

告知编码器如何选择其编码设置。 默认值为“均衡”。

Name Type Description
Balanced
  • string

告知编码器使用在速度和质量之间实现平衡的设置。

Quality
  • string

告知编码器使用经过优化的设置,以产生更高质量的输出,代价是总体编码时间变慢。

Speed
  • string

告知编码器使用针对更快的编码进行优化的设置。 为了缩短编码时间,会牺牲质量。

H264Layer

描述使用 H.264 视频编解码器将输入视频编码为所需输出比特率层时要使用的设置。

Name Type Description
adaptiveBFrame
  • boolean

编码此层时是否要使用自适应 B 帧。 如果未指定,只要视频配置文件允许其使用,编码器就会打开它。

bFrames
  • integer

编码此层时要使用的 B 帧数。 如果未指定,编码器会根据视频配置文件和级别选择适当的数字。

bitrate
  • integer

生成此层时,每秒要对输入视频进行编码的平均比特率(以位数为单位)。 这是必填字段。

bufferWindow
  • string

VBV 缓冲区窗口长度。 该值应采用 ISO 8601 格式。 该值应位于 [0.1-100] 秒范围内。 默认值为 5 秒 (,例如 PT5S) 。

crf
  • number

编码此层时要使用的 CRF 值。 在 CRF 模式下设置视频编解码器 RateControlMode 时,此设置生效。 CRF 值的范围介于 0 和 51 之间,其中较低的值将导致更好的质量,代价是更高的文件大小。 较高的值意味着更多的压缩,但在某些时候会注意到质量下降。 默认值为 23。

entropyMode

要用于此层的 entropy 模式。 如果未指定,编码器会选择适合配置文件和级别的模式。

frameRate
  • string

帧速率 (每秒) 对此层进行编码的帧速率。 该值可以采用 M/N 的形式,其中 M 和 N 是整数 (例如 30000/1001) ,或者以数字形式 (例如 30 或 29.97) 。 编码器根据配置文件和级别对允许的帧速率强制实施约束。 如果未指定,编码器将使用与输入视频相同的帧速率。

height
  • string

此层的输出视频的高度。 该值可以是以像素为单位的绝对 () ,也可以是百分比) 相对 (。 例如,50% 表示输出视频的高度为一半的像素作为输入。

label
  • string

此层的字母数字标签,可用于多路复用不同的视频和音频层,或用于命名输出文件。

level
  • string

我们目前支持级别高达 6.2。 该值可以是“自动”,也可以是与 H.264 配置文件匹配的数字。 如果未指定,则默认值为“自动”,允许编码器选择适合此层的级别。

maxBitrate
  • integer

最大比特率 (每秒) (应假定 VBV 缓冲区重新填充)。 如果未指定,则默认为比特率相同的值。

profile

我们目前支持基线、Main、High、High422、High444。 默认值为“自动”。

referenceFrames
  • integer

编码此层时要使用的引用帧数。 如果未指定,编码器会根据编码器复杂性设置确定适当的数字。

slices
  • integer

对此层进行编码时要使用的切片数。 如果未指定,默认值为零,这意味着编码器将为每个帧使用单个切片。

width
  • string

此层的输出视频的宽度。 该值可以是以像素为单位的绝对 () ,也可以是百分比) 相对 (。 例如,50% 表示输出视频的宽度为输入的一半像素。

H264RateControlMode

视频速率控制模式

Name Type Description
ABR
  • string

达到目标比特率的平均比特率 (ABR) 模式:默认模式。

CBR
  • string

固定比特率 (CBR) 模式,用于收紧围绕目标比特率的比特率变化。

CRF
  • string

固定速率因子 (以恒定主观质量为目标的 CRF) 模式。

H264Video

描述使用 H.264 编解码器对视频进行编码的所有属性。

Name Type Description
@odata.type string:
  • #Microsoft.Media.H264Video

派生类型的歧视性。

complexity

告知编码器如何选择其编码设置。 默认值为“均衡”。

keyFrameInterval
  • string

两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒, (PT2S) 。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。

label
  • string

编解码器的可选标签。 标签可用于控制复用行为。

layers

要由编码器生成的输出 H.264 层的集合。

rateControlMode

视频速率控制模式

sceneChangeDetection
  • boolean

编码器是否应在场景更改时插入关键帧。 如果未指定,则默认值为 false。 仅当编码器配置为生成单个输出视频时,才应将此标志设置为 true。

stretchMode

调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 () 。 默认值为 AutoSize

syncMode

视频同步模式

H264VideoProfile

我们目前支持基线、Main、High、High422、High444。 默认值为“自动”。

Name Type Description
Auto
  • string

告知编码器自动确定相应的 H.264 配置文件。

Baseline
  • string

基线配置文件

High
  • string

高调。

High422
  • string

高 4:2:2 配置文件。

High444
  • string

高 4:4:4 预测配置文件。

Main
  • string

主配置文件

H265Complexity

告知编码器如何选择其编码设置。 质量将提供更高的压缩率,但成本更高,计算时间更长。 速度将生成一个相对较大的文件,但速度更快且更经济。 默认值为“均衡”。

Name Type Description
Balanced
  • string

告知编码器使用在速度和质量之间实现平衡的设置。

Quality
  • string

告知编码器使用经过优化的设置,以产生更高质量的输出,代价是总体编码时间变慢。

Speed
  • string

告知编码器使用针对更快的编码进行优化的设置。 为了缩短编码时间,会牺牲质量。

H265Layer

描述使用 H.265 视频编解码器将输入视频编码为所需输出比特率层时要使用的设置。

Name Type Description
adaptiveBFrame
  • boolean

指定编码此层时是否要使用自适应 B 帧。 如果未指定,只要视频配置文件允许其使用,编码器就会打开它。

bFrames
  • integer

编码此层时要使用的 B 帧数。 如果未指定,编码器会根据视频配置文件和级别选择适当的数字。

bitrate
  • integer

生成此层时,每秒要对输入视频进行编码的平均比特率(以位数为单位)。 例如:目标比特率为 3000Kbps 或 3Mbps 表示此值应为 3000000 这是必填字段。

bufferWindow
  • string

VBV 缓冲区窗口长度。 该值应采用 ISO 8601 格式。 该值应位于 [0.1-100] 秒范围内。 默认值为 5 秒 (,例如 PT5S) 。

crf
  • number

编码此层时要使用的 CRF 值。 在 CRF 模式下设置视频编解码器 RateControlMode 时,此设置生效。 CRF 值的范围介于 0 和 51 之间,其中较低的值将导致更好的质量,代价是更高的文件大小。 较高的值意味着更多的压缩,但在某些时候会注意到质量下降。 默认值为 28。

frameRate
  • string

帧速率 (每秒) 对此层进行编码的帧速率。 该值可以采用 M/N 的形式,其中 M 和 N 是整数 (例如 30000/1001) ,或者以数字形式 (例如 30 或 29.97) 。 编码器根据配置文件和级别对允许的帧速率强制实施约束。 如果未指定,编码器将使用与输入视频相同的帧速率。

height
  • string

此层的输出视频的高度。 该值可以是以像素为单位的绝对 () ,也可以是百分比) 相对 (。 例如,50% 表示输出视频的高度为一半的像素作为输入。

label
  • string

此层的字母数字标签,可用于多路复用不同的视频和音频层,或用于命名输出文件。

level
  • string

我们目前支持级别高达 6.2。 该值可以是“自动”,也可以是与 H.265 配置文件匹配的数字。 如果未指定,则默认值为“自动”,允许编码器选择适合此层的级别。

maxBitrate
  • integer

最大比特率 (每秒) (应假定 VBV 缓冲区重新填充)。 如果未指定,则默认为比特率相同的值。

profile

我们目前支持 Main。 默认值为“自动”。

referenceFrames
  • integer

编码此层时要使用的引用帧数。 如果未指定,编码器会根据编码器复杂性设置确定适当的数字。

slices
  • integer

对此层进行编码时要使用的切片数。 如果未指定,默认值为零,这意味着编码器将为每个帧使用单个切片。

width
  • string

此层的输出视频的宽度。 该值可以是以像素为单位的绝对 () ,也可以是百分比) 相对 (。 例如,50% 表示输出视频的宽度为输入的一半像素。

H265Video

描述使用 H.265 编解码器对视频进行编码的所有属性。

Name Type Description
@odata.type string:
  • #Microsoft.Media.H265Video

派生类型的歧视性。

complexity

告知编码器如何选择其编码设置。 质量将提供更高的压缩率,但成本更高,计算时间更长。 速度将生成一个相对较大的文件,但速度更快且更经济。 默认值为“均衡”。

keyFrameInterval
  • string

两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒, (PT2S) 。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。

label
  • string

编解码器的可选标签。 标签可用于控制复用行为。

layers

要由编码器生成的输出 H.265 层的集合。

sceneChangeDetection
  • boolean

指定编码器是否应在场景更改时插入关键帧。 如果未指定,则默认值为 false。 仅当编码器配置为生成单个输出视频时,才应将此标志设置为 true。

stretchMode

调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 () 。 默认值为 AutoSize

syncMode

视频同步模式

H265VideoProfile

我们目前支持 Main。 默认值为“自动”。

Name Type Description
Auto
  • string

告知编码器自动确定相应的 H.265 配置文件。

Main
  • string

主配置文件 (https://x265.readthedocs.io/en/default/cli.html?highlight=profile#profile-level-tier)

Main10
  • string

主 10 个配置文件 (https://en.wikipedia.org/wiki/High_Efficiency_Video_Coding#Main_10)

Image

介绍从输入视频生成缩略图的基本属性

Name Type Description
@odata.type string:
  • #Microsoft.Media.Image

派生类型的歧视性。

keyFrameInterval
  • string

两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒, (PT2S) 。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。

label
  • string

编解码器的可选标签。 标签可用于控制复用行为。

range
  • string

相对于转换输入视频中预设开始时间的位置,在该视频中停止生成缩略图。 该值可以是 ISO 8601 格式(例如,PT5M30S 表示从开始时间起 5 分 30 秒停止),也可以是帧计数(例如,300 表示在开始时间帧的第 300 帧停止。如果该值为 1,则表示在开始时间处仅生成一个缩略图),或者是相对于流持续时间的相对值(例如,50% 表示从开始时间起的流持续时间的一半处停止)。 默认值是 100%,这表示在流的末尾处停止。

start
  • string

输入视频中从何处开始生成缩略图的位置。 该值可以是 ISO 8601 格式(例如,PT05S 表示在 5 秒处开始),可以是帧计数(例如,10 表示在第 10 帧处开始),也可以是流持续时间的相对值(例如,10% 表示在流持续时间的 10% 处开始)。 还支持宏 {Best},它会指示编码器从视频的前几秒中选择最佳的缩略图,并且无论“步距”和“范围”的其他设置如何,都只会生成一个缩略图。 默认值为宏 {Best}。

step
  • string

生成缩略图的间隔。 该值可以采用 ISO 8601 格式 (例如,每 5 秒) 一个图像的 PT05S,或帧计数 (例如,每 30 帧) 一个图像的 30 个,或者流持续时间的相对值 (例如,每 10% 的流持续时间) 一个图像 10%。 注意:步骤值将影响第一个生成的缩略图,这可能不是转换预设开始时间指定的缩略图。 这是因为编码器尝试在开始时间和步骤位置之间选择最佳缩略图作为第一个输出。 由于默认值为 10%,这意味着如果流具有较长的持续时间,则第一个生成的缩略图可能远离在开始时间指定的缩略图。 如果第一个缩略图应接近开始时间,请尝试为 Step 选择合理的值,或者在开始时仅需要一个缩略图时将 Range 值设置为 1。

stretchMode

调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 () 。 默认值为 AutoSize

syncMode

视频同步模式

ImageFormat

描述输出图像文件的属性。

Name Type Description
@odata.type string:
  • #Microsoft.Media.ImageFormat

派生类型的歧视性。

filenamePattern
  • string

生成的输出文件的文件名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件名称的扩展宏。 如果在输入视频文件的基名 (不包括文件后缀) ,则输入视频文件的基名称长度小于 32 个字符,将使用输入视频文件的基名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {比特率} - 音频/视频比特率。 不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未替换的宏都将从文件名折叠和删除。

InsightsType

定义希望服务生成的见解类型。 允许的值为“AudioInsightsOnly”、“VideoInsightsOnly”和“AllInsights”。 默认值为 AllInsights。 如果将此项设置为 AllInsights 且输入仅为音频,则只会生成音频见解。 同样,如果输入仅是视频,则仅生成视频见解。 如果希望某些输入仅成为视频,建议不要使用 AudioInsightsOnly;或者,如果希望某些输入仅音频,请使用 VideoInsightsOnly。 此类条件下的作业将出错。

Name Type Description
AllInsights
  • string

生成音频和视频见解。 如果音频或视频Insights失败,则失败。

AudioInsightsOnly
  • string

仅生成音频见解。 即使存在,也忽略视频。 如果没有音频,则失败。

VideoInsightsOnly
  • string

仅生成视频见解。 如果存在,则忽略音频。 如果不存在视频,则失败。

InterleaveOutput

设置输出的交错模式,以控制音频和视频如何以容器格式存储。 示例:将 InterleavedOutput 设置为 NonInterleavedOutput,以在单独的 MP4 文件中生成仅音频和仅视频输出。

Name Type Description
InterleavedOutput
  • string

输出包括音频和视频。

NonInterleavedOutput
  • string

输出为仅视频或仅音频。

JpgFormat

描述用于生成 JPEG 缩略图的设置。

Name Type Description
@odata.type string:
  • #Microsoft.Media.JpgFormat

派生类型的歧视性。

filenamePattern
  • string

生成的输出文件的文件名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件名称的扩展宏。 如果输入视频文件的基名 (不包括文件后缀) 长度小于 32 个字符,将使用输入视频文件的基名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {比特率} - 音频/视频比特率。 不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未替换的宏都将从文件名折叠和删除。

JpgImage

描述从输入视频生成一系列 JPEG 图像的属性。

Name Type Description
@odata.type string:
  • #Microsoft.Media.JpgImage

派生类型的歧视性。

keyFrameInterval
  • string

两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒, (PT2S) 。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。

label
  • string

编解码器的可选标签。 标签可用于控制复用行为。

layers

要由编码器生成的输出 JPEG 图像层的集合。

range
  • string

相对于转换输入视频中预设开始时间的位置,在该视频中停止生成缩略图。 该值可以是 ISO 8601 格式(例如,PT5M30S 表示从开始时间起 5 分 30 秒停止),也可以是帧计数(例如,300 表示在开始时间帧的第 300 帧停止。如果该值为 1,则表示在开始时间处仅生成一个缩略图),或者是相对于流持续时间的相对值(例如,50% 表示从开始时间起的流持续时间的一半处停止)。 默认值是 100%,这表示在流的末尾处停止。

spriteColumn
  • integer

设置缩略图子画面图像中使用的列数。 自动计算行数,并使用子画面中每个缩略图的坐标映射生成 VTT 文件。 注意:此值应为正整数,建议使用适当的值,以便输出图像分辨率不会超出 JPEG 最大像素分辨率限制 65535x65535。

start
  • string

输入视频中从何处开始生成缩略图的位置。 该值可以是 ISO 8601 格式(例如,PT05S 表示在 5 秒处开始),可以是帧计数(例如,10 表示在第 10 帧处开始),也可以是流持续时间的相对值(例如,10% 表示在流持续时间的 10% 处开始)。 还支持宏 {Best},它会指示编码器从视频的前几秒中选择最佳的缩略图,并且无论“步距”和“范围”的其他设置如何,都只会生成一个缩略图。 默认值为宏 {Best}。

step
  • string

生成缩略图的间隔。 该值可以采用 ISO 8601 格式 (例如,每 5 秒) 一个图像的 PT05S,或帧计数 (例如,每 30 帧) 一个图像的 30 个,或者流持续时间的相对值 (例如,每 10% 的流持续时间) 一个图像 10%。 注意:步骤值将影响第一个生成的缩略图,这可能不是转换预设开始时间指定的缩略图。 这是因为编码器尝试在开始时间和步骤位置之间选择最佳缩略图作为第一个输出。 由于默认值为 10%,这意味着如果流具有较长的持续时间,则第一个生成的缩略图可能远离在开始时间指定的缩略图。 如果第一个缩略图应接近开始时间,请尝试为 Step 选择合理的值,或者在开始时仅需要一个缩略图时将 Range 值设置为 1。

stretchMode

调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 () 。 默认值为 AutoSize

syncMode

视频同步模式

JpgLayer

描述从输入视频生成 JPEG 图像的设置。

Name Type Description
height
  • string

此层的输出视频的高度。 该值可以是以像素为单位的绝对 () ,也可以是百分比) 相对 (。 例如,50% 表示输出视频的高度为一半的像素作为输入。

label
  • string

此层的字母数字标签,可用于多路复用不同的视频和音频层,或用于命名输出文件。

quality
  • integer

JPEG 输出的压缩质量。 范围为 0-100,默认值为 70。

width
  • string

此层的输出视频的宽度。 该值可以是以像素为单位的绝对 () ,也可以是百分比) 相对 (。 例如,50% 表示输出视频的宽度为输入的一半像素。

Mp4Format

描述输出 ISO MP4 文件的属性。

Name Type Description
@odata.type string:
  • #Microsoft.Media.Mp4Format

派生类型的歧视性。

filenamePattern
  • string

生成的输出文件的文件名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件名称的扩展宏。 如果输入视频文件的基名 (不包括文件后缀) 长度小于 32 个字符,将使用输入视频文件的基名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {比特率} - 音频/视频比特率。 不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未替换的宏都将从文件名折叠和删除。

outputFiles

要生成的输出文件列表。 列表中的每个条目都是一组要一起复用的音频和视频层标签。

MultiBitrateFormat

描述生成 GOP 对齐多比特率文件的集合的属性。 默认行为是为每个视频层生成一个输出文件,该文件与所有音频一起复用。 可以通过指定 outputFiles 集合来控制生成的确切输出文件。

Name Type Description
@odata.type string:
  • #Microsoft.Media.MultiBitrateFormat

派生类型的歧视性。

filenamePattern
  • string

生成的输出文件的文件名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件名称的扩展宏。 如果输入视频文件的基名 (不包括文件后缀) 长度小于 32 个字符,将使用输入视频文件的基名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {比特率} - 音频/视频比特率。 不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未替换的宏都将从文件名折叠和删除。

outputFiles

要生成的输出文件列表。 列表中的每个条目都是一组要一起复用的音频和视频层标签。

OnErrorType

转换可以定义多个输出。 此属性定义服务在一个输出失败时应执行的操作 - 继续生成其他输出,或者停止其他输出。 总体作业状态不会反映使用“ContinueJob”指定的输出失败。 默认值为“StopProcessingJob”。

Name Type Description
ContinueJob
  • string

告知服务,如果此 TransformOutput 失败,则允许任何其他 TransformOutput 继续。

StopProcessingJob
  • string

告知服务,如果此 TransformOutput 失败,则可以停止任何其他不完整的 TransformOutput。

OutputFile

表示生成的输出文件。

Name Type Description
labels
  • string[]

描述编码器如何将视频和音频多路复用到输出文件中的标签列表。 例如,如果编码器正在生成带有标签 v1 和 v2 的两个视频层,以及一个带有标签 a1 的音频层,则类似于“[v1,a1]”的数组会告知编码器生成一个输出文件,其中包含 v1 表示的视频轨迹和 a1 表示的音频轨迹。

PngFormat

描述用于生成 PNG 缩略图的设置。

Name Type Description
@odata.type string:
  • #Microsoft.Media.PngFormat

派生类型的歧视性。

filenamePattern
  • string

生成的输出文件的文件名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件名称的扩展宏。 如果输入视频文件的基名 (不包括文件后缀) 长度小于 32 个字符,将使用输入视频文件的基名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {比特率} - 音频/视频比特率。 不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未替换的宏都将从文件名折叠和删除。

PngImage

描述从输入视频生成一系列 PNG 图像的属性。

Name Type Description
@odata.type string:
  • #Microsoft.Media.PngImage

派生类型的歧视性。

keyFrameInterval
  • string

两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒, (PT2S) 。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。

label
  • string

编解码器的可选标签。 标签可用于控制复用行为。

layers

要由编码器生成的输出 PNG 图像层的集合。

range
  • string

相对于转换输入视频中预设开始时间的位置,在该视频中停止生成缩略图。 该值可以是 ISO 8601 格式(例如,PT5M30S 表示从开始时间起 5 分 30 秒停止),也可以是帧计数(例如,300 表示在开始时间帧的第 300 帧停止。如果该值为 1,则表示在开始时间处仅生成一个缩略图),或者是相对于流持续时间的相对值(例如,50% 表示从开始时间起的流持续时间的一半处停止)。 默认值是 100%,这表示在流的末尾处停止。

start
  • string

输入视频中从何处开始生成缩略图的位置。 该值可以是 ISO 8601 格式(例如,PT05S 表示在 5 秒处开始),可以是帧计数(例如,10 表示在第 10 帧处开始),也可以是流持续时间的相对值(例如,10% 表示在流持续时间的 10% 处开始)。 还支持宏 {Best},它会指示编码器从视频的前几秒中选择最佳的缩略图,并且无论“步距”和“范围”的其他设置如何,都只会生成一个缩略图。 默认值为宏 {Best}。

step
  • string

生成缩略图的间隔。 该值可以采用 ISO 8601 格式 (例如,每 5 秒) 一个图像的 PT05S,或帧计数 (例如,每 30 帧) 一个图像的 30 个,或者流持续时间的相对值 (例如,每 10% 的流持续时间) 一个图像 10%。 注意:步骤值将影响第一个生成的缩略图,这可能不是转换预设开始时间指定的缩略图。 这是因为编码器尝试在开始时间和步骤位置之间选择最佳缩略图作为第一个输出。 由于默认值为 10%,这意味着如果流具有较长的持续时间,则第一个生成的缩略图可能远离在开始时间指定的缩略图。 如果第一个缩略图应接近开始时间,请尝试为 Step 选择合理的值,或者在开始时仅需要一个缩略图时将 Range 值设置为 1。

stretchMode

调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 () 。 默认值为 AutoSize

syncMode

视频同步模式

PngLayer

描述从输入视频生成 PNG 图像的设置。

Name Type Description
height
  • string

此层的输出视频的高度。 该值可以是以像素为单位的绝对 () ,也可以是百分比) 相对 (。 例如,50% 表示输出视频的高度为一半的像素作为输入。

label
  • string

此层的字母数字标签,可用于多路复用不同的视频和音频层,或用于命名输出文件。

width
  • string

此层的输出视频的宽度。 该值可以是以像素为单位的绝对 () ,也可以是百分比) 相对 (。 例如,50% 表示输出视频的宽度为输入的一半像素。

PresetConfigurations

编码器的可选配置设置的对象。

Name Type Description
complexity

可用于配置编码器设置,以控制速度和质量之间的平衡。 示例:将复杂性设置为“速度”,以提高编码速度,但压缩效率较低。

interleaveOutput

设置输出的交错模式,以控制音频和视频如何以容器格式存储。 示例:将 InterleavedOutput 设置为 NonInterleavedOutput,以在单独的 MP4 文件中生成仅音频和仅视频输出。

keyFrameIntervalInSeconds
  • number

关键帧间隔(以秒为单位)。 示例:将 KeyFrameIntervalInSeconds 设置为 2,以减少某些玩家的播放缓冲。

maxBitrateBps
  • integer

顶级视频层) 的最大比特率(以每秒位为单位) (阈值。 示例:将 MaxBitrateBps 设置为 6000000,以避免为具有较高复杂性的内容生成非常高的比特率输出。

maxHeight
  • integer

输出视频层的最大高度。 示例:将 MaxHeight 设置为 720,以生成高达 720P 的输出层,即使输入为 4K。

maxLayers
  • integer

输出视频层的最大数目。 示例:将 MaxLayers 设置为 4,以确保生成最多 4 个输出层,以控制编码作业的总体成本。

minBitrateBps
  • integer

底部视频层) 的最小比特率(以秒为单位) (阈值。 示例:将 MinBitrateBps 设置为 200000,其底层覆盖网络带宽较低的用户。

minHeight
  • integer

输出视频层的最小高度。 示例:将 MinHeight 设置为 360,以避免 180P 等较小分辨率的输出层。

Priority

设置 TransformOutputs 的相对优先级。 这会设置服务用于处理 TransformOutputs 的优先级。 默认优先级为 Normal。

Name Type Description
High
  • string

用于应优先于其他人的 TransformOutput。

Low
  • string

用于可在 Normal 和 High priority TransformOutputs 之后生成的 TransformOutput。

Normal
  • string

用于可在 Normal 优先级生成的 TransformOutput。

Rectangle

描述在处理矩形窗口之前应用于输入媒体的属性。

Name Type Description
height
  • string

矩形区域的高度(以像素为单位)。 这可以是绝对像素值 (,例如 100) ,或者相对于视频 (的大小(例如 50%) )。

left
  • string

左边距中的像素数。 这可以是绝对像素值 (,例如 100) ,或者相对于视频 (的大小(例如 50%) )。

top
  • string

上边距中的像素数。 这可以是绝对像素值 (,例如 100) ,或者相对于视频 (的大小(例如 50%) )。

width
  • string

矩形区域的宽度(以像素为单位)。 这可以是绝对像素值 (,例如 100) ,或者相对于视频 (的大小(例如 50%) )。

Rotation

在对输入视频进行编码之前,将旋转(如果有)应用于输入视频。 默认值为“自动”

Name Type Description
Auto
  • string

根据需要自动检测和旋转。

None
  • string

不要旋转视频。 如果输出格式支持它,则有关旋转的任何元数据将保持不变。

Rotate0
  • string

请勿旋转视频,但删除有关旋转的任何元数据。

Rotate180
  • string

顺时针旋转 180 度。

Rotate270
  • string

顺时针旋转 270 度。

Rotate90
  • string

顺时针旋转 90 度。

StandardEncoderPreset

介绍使用标准编码器对输入视频进行编码时要使用的所有设置。

Name Type Description
@odata.type string:
  • #Microsoft.Media.StandardEncoderPreset

派生类型的歧视性。

codecs Codec[]:

编码输入视频时要使用的编解码器列表。

filters

编码前应用于输入媒体的一个或多个筛选操作。

formats Format[]:

要由编码器生成的输出列表。

StretchMode

调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 () 。 默认值为 AutoSize

Name Type Description
AutoFit
  • string

将输出 (与信箱或柱框) 填充以遵循输出分辨率,同时确保输出中的活动视频区域与输入的纵横比相同。 例如,如果输入为 1920x1080,并且编码预设要求 1280x1280,则输出将位于 1280x1280,其中包含 1280x720 的内部矩形,纵横比为 16:9,柱框区域在左侧和右侧宽 280 像素。

AutoSize
  • string

重写输出分辨率,并将其更改为匹配输入的显示纵横比,而无需填充。 例如,如果输入为 1920x1080,而编码预设要求提供 1280x1280,则会重写预设中的值,输出将是 1280x720,这样可以保持 16:9 的输入纵横比。

None
  • string

严格遵循输出分辨率,而不考虑输入视频的像素纵横比或显示纵横比。

systemData

与创建和上次修改资源相关的元数据。

Name Type Description
createdAt
  • string

资源创建时间戳 (UTC) 。

createdBy
  • string

创建资源的标识。

createdByType

创建资源的标识的类型。

lastModifiedAt
  • string

资源上次修改的时间戳 (UTC)

lastModifiedBy
  • string

上次修改资源的标识。

lastModifiedByType

上次修改资源的标识的类型。

Transform

转换封装用于从输入媒体(如转码或提取见解)生成所需输出的规则或说明。 创建转换后,可以通过创建作业将其应用于输入媒体。

Name Type Description
id
  • string

资源的完全限定的资源 ID。 Ex - /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName}

name
  • string

资源的名称

properties.created
  • string

创建转换时的 UTC 日期和时间,格式为“YYYY-MM-DDThh:mm:ssZ”。

properties.description
  • string

转换的可选详细说明。

properties.lastModified
  • string

上次更新转换的 UTC 日期和时间,格式为“YYYY-MM-DDThh:mm:ssZ”。

properties.outputs

转换应该生成的一个或多个 TransformOutput 的数组。

systemData

与此资源相关的系统元数据。

type
  • string

资源类型。 例如“Microsoft.Compute/virtualMachines”或“Microsoft”。存储/storageAccounts”

TransformOutput

描述 TransformOutput 的属性,这些属性是生成所需输出时要应用的规则。

Name Type Description
onError

转换可以定义多个输出。 此属性定义服务在一个输出失败时应执行的操作 - 继续生成其他输出,或者停止其他输出。 总体作业状态不会反映使用“ContinueJob”指定的输出失败。 默认值为“StopProcessingJob”。

preset Preset:

用于描述将用于修改、转码或从源文件中提取见解以生成输出的操作的预设。

relativePriority

设置 TransformOutputs 的相对优先级。 这会设置服务用于处理 TransformOutputs 的优先级。 默认优先级为 Normal。

TransportStreamFormat

介绍生成 MPEG-2 传输流 (ISO/IEC 13818-1) 输出视频文件的属性, (s) 。

Name Type Description
@odata.type string:
  • #Microsoft.Media.TransportStreamFormat

派生类型的歧视性。

filenamePattern
  • string

生成的输出文件的文件名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件名称的扩展宏。 如果输入视频文件的基名 (不包括文件后缀) 长度小于 32 个字符,将使用输入视频文件的基名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {比特率} - 音频/视频比特率。 不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未替换的宏都将从文件名折叠和删除。

outputFiles

要生成的输出文件列表。 列表中的每个条目都是一组要一起复用的音频和视频层标签。

Video

描述编码输入视频的基本属性。

Name Type Description
@odata.type string:
  • #Microsoft.Media.Video

派生类型的歧视性。

keyFrameInterval
  • string

两个关键帧之间的距离。 该值应为 [0.5, 20] 秒范围内的非零,以 ISO 8601 格式指定。 默认值为 2 秒, (PT2S) 。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。

label
  • string

编解码器的可选标签。 标签可用于控制复用行为。

stretchMode

调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 () 。 默认值为 AutoSize

syncMode

视频同步模式

VideoAnalyzerPreset

视频分析器预设,用于从音频和视频中提取见解 (丰富的元数据) ,并输出 JSON 格式化文件。

Name Type Description
@odata.type string:
  • #Microsoft.Media.VideoAnalyzerPreset

派生类型的歧视性。

audioLanguage
  • string

使用“语言标记区域”的 BCP-47 格式输入中的音频有效负载的语言 (例如:“en-US”) 。 如果知道内容的语言,建议指定它。 必须为 AudioAnalysisMode::Basic 显式指定语言,因为基本模式下不包括自动语言检测。 如果未指定语言或将语言设置为 null,自动语言检测将选择检测到的第一种语言并使用所选语言处理整个文件。 它目前不支持在检测到第一种语言后在各语言之间进行动态切换。 自动检测最适用于具有清晰辨别语音的录音。 如果自动检测找不到语言,听录将回退到“en-US”。此处提供了支持的语言列表: https://go.microsoft.com/fwlink/?linkid=2109463

experimentalOptions
  • object

包含预设本身中未公开的参数的键值对的字典

insightsToExtract

定义希望服务生成的见解类型。 允许的值为“AudioInsightsOnly”、“VideoInsightsOnly”和“AllInsights”。 默认值为 AllInsights。 如果将此项设置为 AllInsights,并且输入仅为音频,则只会生成音频见解。 同样,如果输入仅是视频,则仅生成视频见解。 如果希望某些输入仅成为视频,建议不要使用 AudioInsightsOnly;如果希望某些输入仅音频,请使用 VideoInsightsOnly。 处于此类条件的作业会出错。

mode

确定要执行的音频分析操作集。 如果未指定,则会选择标准 AudioAnalysisMode。

VideoOverlay

描述视频覆盖的属性。

Name Type Description
@odata.type string:
  • #Microsoft.Media.VideoOverlay

派生类型的歧视性。

audioGainLevel
  • number

覆盖中的音频增益级别。 该值应位于 [0, 1.0] 范围内。 默认值为 1.0。

cropRectangle

用于裁剪覆盖图像或视频的可选矩形窗口。

end
  • string

结束位置,包含对输入视频的引用,覆盖结束。 该值应采用 ISO 8601 格式。 例如,PT30S 在输入视频中以 30 秒结束覆盖。 如果未指定或值大于输入视频持续时间,则覆盖将应用于输入视频的末尾(如果覆盖媒体持续时间大于输入视频持续时间),否则覆盖将持续到覆盖媒体持续时间。

fadeInDuration
  • string

覆盖逐渐淡入输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定默认行为,则不会在与 PT0S) 相同的 (中淡出。

fadeOutDuration
  • string

覆盖层淡出输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定,则默认行为是没有与 PT0S) 相同的淡出 (。

inputLabel
  • string

要用作覆盖的作业输入的标签。 输入必须指定一个文件。 可以指定 JPG、PNG、GIF 或 BMP 格式的图像文件,或者指定音频文件(如 WAV、MP3、WMA 或 M4A 文件)或视频文件。 请参阅 https://aka.ms/mesformats 支持的音频和视频文件格式的完整列表。

opacity
  • number

覆盖的不透明度。 这是 [0 - 1.0] 范围内的值。 默认值为 1.0,表示覆盖不透明。

position

应用覆盖的输入视频中的位置。

start
  • string

开始位置,其中包含对输入视频的引用,覆盖层将从该位置开始。 该值应采用 ISO 8601 格式。 例如,PT05S 在输入视频中以 5 秒开始覆盖。 如果未指定覆盖层,则从输入视频的开头开始。

VideoSyncMode

视频同步模式

Name Type Description
Auto
  • string

这是默认方法。 根据复用器功能在 Cfr 和 Vfr 之间进行选择。 对于输出格式 MP4,默认模式为 Cfr。

Cfr
  • string

输入帧将根据需要重复和/或丢弃,以准确实现请求的常量帧速率。 当以指定值显式设置输出帧速率时,建议使用

Passthrough
  • string

帧上的演示文稿时间戳从输入文件传递到输出文件编写器。 当输入源具有可变帧速率时,建议在输出中尝试生成多个层以便自适应流式处理,这些层与 GOP 边界对齐。 注意:如果输入中的两个或更多帧具有重复时间戳,则输出也将具有相同的行为

Vfr
  • string

类似于传递模式,但如果输入具有重复时间戳的帧,则只有一个帧传递到输出,而其他帧则被删除。 当输出帧数应等于输入帧数时,建议使用。 例如,输出用于根据输入计算 PSNR 等质量指标