你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Transforms - Create Or Update

创建或更新转换
创建或更新新的转换。

PUT https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.Media/mediaServices/{accountName}/transforms/{transformName}?api-version=2022-07-01

URI 参数

名称 必需 类型 说明
accountName
path True

string

媒体服务帐户名称。

resourceGroupName
path True

string

Azure 订阅中资源组的名称。

subscriptionId
path True

string

Microsoft Azure 订阅的唯一标识符。

transformName
path True

string

转换名称。

api-version
query True

string

要与客户端请求一起使用的 API 的版本。

请求正文

名称 必需 类型 说明
properties.outputs True

TransformOutput[]

转换应该生成的一个或多个 TransformOutput 的数组。

properties.description

string

转换的可选详细说明。

响应

名称 类型 说明
200 OK

Transform

确定

201 Created

Transform

创建

Other Status Codes

ErrorResponse

详细的错误信息。

示例

Create or update a Transform

示例请求

PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/contosoresources/providers/Microsoft.Media/mediaServices/contosomedia/transforms/createdTransform?api-version=2022-07-01

{
  "properties": {
    "description": "Example Transform to illustrate create and update.",
    "outputs": [
      {
        "preset": {
          "@odata.type": "#Microsoft.Media.BuiltInStandardEncoderPreset",
          "presetName": "AdaptiveStreaming"
        }
      }
    ]
  }
}

示例响应

{
  "name": "createdTransform",
  "id": "/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/contosoresources/providers/Microsoft.Media/mediaservices/contosomedia/transforms/createdTransform",
  "type": "Microsoft.Media/mediaservices/transforms",
  "properties": {
    "created": "2022-10-17T23:14:31.7664818Z",
    "description": "Example Transform to illustrate create and update.",
    "lastModified": "2022-10-17T23:14:31.7664818Z",
    "outputs": [
      {
        "onError": "StopProcessingJob",
        "relativePriority": "Normal",
        "preset": {
          "@odata.type": "#Microsoft.Media.BuiltInStandardEncoderPreset",
          "presetName": "AdaptiveStreaming"
        }
      }
    ]
  },
  "systemData": {
    "createdBy": "contoso@microsoft.com",
    "createdByType": "User",
    "createdAt": "2022-10-17T23:14:31.7664818Z",
    "lastModifiedBy": "contoso@microsoft.com",
    "lastModifiedByType": "User",
    "lastModifiedAt": "2022-10-17T23:14:31.7664818Z"
  }
}
{
  "name": "createdTransform",
  "id": "/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/contosoresources/providers/Microsoft.Media/mediaservices/contosomedia/transforms/createdTransform",
  "type": "Microsoft.Media/mediaservices/transforms",
  "properties": {
    "created": "2022-10-17T23:14:31.7664818Z",
    "description": "Example Transform to illustrate create and update.",
    "lastModified": "2022-10-17T23:14:31.7664818Z",
    "outputs": [
      {
        "onError": "StopProcessingJob",
        "relativePriority": "Normal",
        "preset": {
          "@odata.type": "#Microsoft.Media.BuiltInStandardEncoderPreset",
          "presetName": "AdaptiveStreaming"
        }
      }
    ]
  },
  "systemData": {
    "createdBy": "contoso@microsoft.com",
    "createdByType": "User",
    "createdAt": "2022-10-17T23:14:31.7664818Z",
    "lastModifiedBy": "contoso@microsoft.com",
    "lastModifiedByType": "User",
    "lastModifiedAt": "2022-10-17T23:14:31.7664818Z"
  }
}

定义

名称 说明
AacAudio

介绍高级音频编解码器 (AAC) 音频编码设置。

AacAudioProfile

使用 AAC 编码音频时要使用的编码配置文件。

AnalysisResolution

指定分析视频时的最大分辨率。 默认行为为“SourceResolution”,它将在分析时将输入视频保持其原始分辨率。 使用“StandardDefinition”会将输入视频的大小调整为标准定义,同时保留适当的纵横比。 仅当视频分辨率更高时,它才会调整大小。 例如,在处理之前,1920x1080 输入将缩放为 640x360。 切换到“StandardDefinition”将减少处理高分辨率视频所需的时间。 它还可以降低使用此组件的成本, (https://azure.microsoft.com/en-us/pricing/details/media-services/#analytics 有关详细信息) 。 但是,可能无法检测到在调整大小后的视频中最终太小的人脸。

Audio

定义所有音频编解码器的通用属性。

AudioAnalysisMode

确定要执行的音频分析操作集。 如果未指定,将选择标准 AudioAnalysisMode。

AudioAnalyzerPreset

音频分析器预设应用一组预定义的基于 AI 的分析操作,包括语音听录。 目前,该预设支持处理单个音轨的内容。

AudioOverlay

描述音频覆盖的属性。

BlurType

模糊类型

BuiltInStandardEncoderPreset

介绍使用标准编码器对输入视频进行编码的内置预设。

Complexity

可用于配置编码器设置,以控制速度和质量之间的平衡。 示例:将“复杂性”设置为“速度”,以加快编码速度,但降低压缩效率。

CopyAudio

一个编解码器标志,指示编码器复制输入音频比特流。

CopyVideo

一个编解码器标志,指示编码器在不重新编码的情况下复制输入视频比特流。

createdByType

创建资源的标识类型。

DDAudio

介绍杜比数字音频编解码器 (AC3) 音频编码设置。 Dolby 数字音频支持的当前实现是:音频通道编号为 1 ( (单声道) ,2 (立体声) ,6 (5.1 侧) ;音频采样频率速率:32K/44.1K/48K Hz;AC3 规范支持的音频比特率值:32000、40000、48000、56000、64000、80000、 96000、112000、128000、160000、192000、224000、256000、320000、384000、448000、512000、576000、640000 bps。

Deinterlace

描述反交错设置。

DeinterlaceMode

去隔行模式。 默认为 AutoPixelAdaptive。

DeinterlaceParity

反交错的字段奇偶校验,默认为“自动”。

EncoderNamedPreset

用于编码视频的内置预设。

EntropyMode

要用于此层的熵模式。 如果未指定,编码器将选择适合配置文件和级别的模式。

ErrorAdditionalInfo

资源管理错误附加信息。

ErrorDetail

错误详细信息。

ErrorResponse

错误响应

FaceDetectorPreset

描述分析视频时要使用的所有设置,以便检测 (并选择性地编辑) 存在的所有人脸。

FaceRedactorMode

此模式提供在以下设置之间进行选择的功能:1) 分析 - 仅用于检测。此模式生成一个元数据 JSON 文件,用于标记整个视频中人脸的外观。如果可能,为同一人的外观分配相同的 ID。2) 合并 - 此外, (模糊) 检测到的人脸。 3) 修订 - 这可实现 2 次传递过程,允许对检测到的一部分人脸进行选择性编辑。它从以前的分析阶段获取元数据文件,以及源视频,以及用户选择的需要编修的 ID 子集。

Fade

描述应用于输入媒体的淡化效果的属性。

Filters

描述在编码之前应用于输入媒体的所有筛选操作,例如去交错、旋转等。

H264Complexity

告知编码器如何选择其编码设置。 默认值为 Balanced。

H264Layer

介绍在使用 H.264 视频编解码器将输入视频编码为所需输出比特率层时要使用的设置。

H264RateControlMode

视频速率控制模式

H264Video

介绍使用 H.264 编解码器对视频进行编码的所有属性。

H264VideoProfile

我们目前支持 Baseline、Main、High、High422、High444。 默认值为“自动”。

H265Complexity

告知编码器如何选择其编码设置。 质量将提供更高的压缩率,但成本更高,计算时间更长。 速度将生成一个相对较大的文件,但速度更快、更经济。 默认值为“平衡”。

H265Layer

描述在使用 H.265 视频编解码器将输入视频编码为所需输出比特率层时要使用的设置。

H265Video

描述使用 H.265 编解码器对视频进行编码的所有属性。

H265VideoProfile

我们目前支持 Main。 默认值为“自动”。

Image

介绍用于从输入视频生成缩略图的基本属性

ImageFormat

描述输出图像文件的属性。

InsightsType

定义希望服务生成的见解类型。 允许的值为“AudioInsightsOnly”、“VideoInsightsOnly”和“AllInsights”。 默认值为 AllInsights。 如果将此项设置为 AllInsights,并且输入仅为音频,则仅生成音频见解。 同样,如果输入仅视频,则仅生成视频见解。 如果你希望某些输入仅使用视频,建议不要使用 AudioInsightsOnly;或者,如果你希望某些输入仅是音频,请使用 VideoInsightsOnly。 在这种情况下,作业将出错。

InterleaveOutput

设置输出的交错模式,以控制以容器格式存储音频和视频的方式。 示例:将 InterleavedOutput 设置为 NonInterleavedOutput,以在单独的 MP4 文件中生成仅限音频和仅视频的输出。

JpgFormat

描述用于生成 JPEG 缩略图的设置。

JpgImage

介绍用于从输入视频生成一系列 JPEG 图像的属性。

JpgLayer

描述用于从输入视频生成 JPEG 图像的设置。

Mp4Format

描述输出 ISO MP4 文件的属性。

MultiBitrateFormat

介绍用于生成 GOP 对齐多比特率文件集合的属性。 默认行为是为每个视频层生成一个输出文件,该文件与所有音频一起复用。 可以通过指定 outputFiles 集合来控制生成的确切输出文件。

OnErrorType

转换可以定义多个输出。 此属性定义当一个输出失败时服务应执行的操作 - 继续生成其他输出,或者停止其他输出。 总体作业状态不会反映使用“ContinueJob”指定的输出失败。 默认值为“StopProcessingJob”。

OutputFile

表示生成的输出文件。

PngFormat

介绍用于生成 PNG 缩略图的设置。

PngImage

介绍用于从输入视频生成一系列 PNG 图像的属性。

PngLayer

描述用于从输入视频生成 PNG 图像的设置。

PresetConfigurations

编码器的可选配置设置的对象。

Priority

设置转换中 TransformOutputs 的相对优先级。 这将设置服务用于处理 TransformOutput 的优先级。 默认优先级为 Normal。

Rectangle

描述在处理输入媒体之前应用于输入媒体的矩形窗口的属性。

Rotation

在对输入视频进行编码之前,要应用于输入视频的旋转(如果有)。 默认值为 Auto

StandardEncoderPreset

介绍在使用标准编码器对输入视频进行编码时要使用的所有设置。

StretchMode

调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 (s) 。 默认值为 AutoSize

systemData

与资源的创建和上次修改相关的元数据。

Transform

转换封装用于从输入媒体生成所需输出的规则或指令,例如通过转码或提取见解。 创建转换后,可以通过创建作业将其应用于输入媒体。

TransformOutput

描述 TransformOutput 的属性,这些属性是在生成所需输出时要应用的规则。

TransportStreamFormat

介绍用于生成 MPEG-2 传输流的属性 (ISO/IEC 13818-1) 输出视频文件 () 。

Video

介绍用于编码输入视频的基本属性。

VideoAnalyzerPreset

视频分析器预设,用于从音频和视频中提取见解 (丰富的元数据) ,并输出 JSON 格式化文件。

VideoOverlay

描述视频覆盖的属性。

VideoSyncMode

视频同步模式

AacAudio

介绍高级音频编解码器 (AAC) 音频编码设置。

名称 类型 说明
@odata.type string:

#Microsoft.Media.AacAudio

派生类型的鉴别器。

bitrate

integer

输出编码音频的比特率(以比特/秒为单位)。

channels

integer

音频中的通道数。

label

string

编解码器的可选标签。 标签可用于控制复用行为。

profile

AacAudioProfile

使用 AAC 对音频进行编码时要使用的编码配置文件。

samplingRate

integer

用于编码的采样率(以赫茨为单位)。

AacAudioProfile

使用 AAC 编码音频时要使用的编码配置文件。

名称 类型 说明
AacLc

string

指定将输出音频编码为 AAC 低复杂度配置文件 (AAC-LC) 。

HeAacV1

string

指定输出音频将编码为 HE-AAC v1 配置文件。

HeAacV2

string

指定输出音频将编码为 HE-AAC v2 配置文件。

AnalysisResolution

指定分析视频时的最大分辨率。 默认行为为“SourceResolution”,它将在分析时将输入视频保持其原始分辨率。 使用“StandardDefinition”会将输入视频的大小调整为标准定义,同时保留适当的纵横比。 仅当视频分辨率更高时,它才会调整大小。 例如,在处理之前,1920x1080 输入将缩放为 640x360。 切换到“StandardDefinition”将减少处理高分辨率视频所需的时间。 它还可以降低使用此组件的成本, (https://azure.microsoft.com/en-us/pricing/details/media-services/#analytics 有关详细信息) 。 但是,可能无法检测到在调整大小后的视频中最终太小的人脸。

名称 类型 说明
SourceResolution

string

StandardDefinition

string

Audio

定义所有音频编解码器的通用属性。

名称 类型 说明
@odata.type string:

#Microsoft.Media.Audio

派生类型的鉴别器。

bitrate

integer

输出编码音频的比特率(以位/秒为单位)。

channels

integer

音频中的声道数。

label

string

编解码器的可选标签。 标签可用于控制复用行为。

samplingRate

integer

用于以赫为单位编码的采样率。

AudioAnalysisMode

确定要执行的音频分析操作集。 如果未指定,将选择标准 AudioAnalysisMode。

名称 类型 说明
Basic

string

此模式执行语音转文本听录并生成 VTT 字幕文件。 此模式的输出包括一个见解 JSON 文件,该文件仅包含关键字、听录和计时信息。 此模式不包括自动语言检测和说话人分割聚类。

Standard

string

执行基本模式中包含的所有操作,此外还执行语言检测和说话人分割。

AudioAnalyzerPreset

音频分析器预设应用一组预定义的基于 AI 的分析操作,包括语音听录。 目前,该预设支持处理单个音轨的内容。

名称 类型 说明
@odata.type string:

#Microsoft.Media.AudioAnalyzerPreset

派生类型的鉴别器。

audioLanguage

string

使用“语言标记区域”的 BCP-47 格式的输入中的音频有效负载的语言 (例如:“en-US”) 。 如果你知道内容的语言,建议你指定它。 必须为 AudioAnalysisMode::Basic 显式指定语言,因为自动语言检测不包括在基本模式下。 如果未指定语言或将语言设置为 null,自动语言检测将选择检测到的第一种语言并使用所选语言处理整个文件。 它目前不支持在检测到第一种语言后在各语言之间进行动态切换。 自动检测最适用于具有清晰可辨识语音的录音。 如果自动检测找不到该语言,则听录将回退到'en-US'。”此处提供了支持的语言列表: https://go.microsoft.com/fwlink/?linkid=2109463

experimentalOptions

object

包含未在预设本身中公开的参数的键值对的字典

mode

AudioAnalysisMode

确定要执行的音频分析操作集。 如果未指定,将选择标准 AudioAnalysisMode。

AudioOverlay

描述音频覆盖的属性。

名称 类型 说明
@odata.type string:

#Microsoft.Media.AudioOverlay

派生类型的鉴别器。

audioGainLevel

number

覆盖中音频的增益级别。 该值应位于 [0, 1.0] 范围内。 默认值为 1.0。

end

string

结束位置(引用了覆盖结束处的输入视频)。 该值应采用 ISO 8601 格式。 例如,PT30S 在输入视频的 30 秒处结束覆盖。 如果未指定或该值大于输入视频持续时间,则覆盖媒体持续时间大于输入视频持续时间时,将应用覆盖,直到输入视频结束,否则覆盖将持续到覆盖媒体持续时间。

fadeInDuration

string

覆盖淡入输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定,则默认行为是无淡入 (与 PT0S) 相同。

fadeOutDuration

string

覆盖淡出输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定,则默认行为是没有淡出 (与 PT0S) 相同。

inputLabel

string

要用作覆盖的作业输入的标签。 输入必须指定一个文件。 可以指定 JPG、PNG、GIF 或 BMP 格式的图像文件,或者指定音频文件(如 WAV、MP3、WMA 或 M4A 文件)或视频文件。 有关支持的音频和视频文件格式的完整列表,请参阅 https://aka.ms/mesformats

start

string

开始位置(引用了覆盖层开始的输入视频)。 该值应采用 ISO 8601 格式。 例如,PT05S 在 5 秒处开始覆盖输入视频。 如果未指定,覆盖层将从输入视频的开头开始。

BlurType

模糊类型

名称 类型 说明
Black

string

黑色:黑掉筛选器

Box

string

框:调试筛选器,仅限边界框

High

string

高:混淆模糊筛选器

Low

string

低:盒车模糊筛选器

Med

string

Med:高斯模糊筛选器

BuiltInStandardEncoderPreset

介绍使用标准编码器对输入视频进行编码的内置预设。

名称 类型 说明
@odata.type string:

#Microsoft.Media.BuiltInStandardEncoderPreset

派生类型的鉴别器。

configurations

PresetConfigurations

编码器的可选配置设置。 仅 ContentAwareEncoding 和 H265ContentAwareEncoding BuiltInStandardEncoderPreset 支持配置。

presetName

EncoderNamedPreset

用于编码视频的内置预设。

Complexity

可用于配置编码器设置,以控制速度和质量之间的平衡。 示例:将“复杂性”设置为“速度”,以加快编码速度,但降低压缩效率。

名称 类型 说明
Balanced

string

将编码器配置为使用在速度和质量之间实现平衡的设置。

Quality

string

将编码器配置为使用经过优化的设置,以生成更高质量的输出,但代价是总体编码时间变慢。

Speed

string

将编码器配置为使用为加快编码速度而优化的设置。 为了缩短编码时间,会牺牲质量。

CopyAudio

一个编解码器标志,指示编码器复制输入音频比特流。

名称 类型 说明
@odata.type string:

#Microsoft.Media.CopyAudio

派生类型的鉴别器。

label

string

编解码器的可选标签。 标签可用于控制复用行为。

CopyVideo

一个编解码器标志,指示编码器在不重新编码的情况下复制输入视频比特流。

名称 类型 说明
@odata.type string:

#Microsoft.Media.CopyVideo

派生类型的鉴别器。

label

string

编解码器的可选标签。 标签可用于控制复用行为。

createdByType

创建资源的标识类型。

名称 类型 说明
Application

string

Key

string

ManagedIdentity

string

User

string

DDAudio

介绍杜比数字音频编解码器 (AC3) 音频编码设置。 Dolby 数字音频支持的当前实现是:音频通道编号为 1 ( (单声道) ,2 (立体声) ,6 (5.1 侧) ;音频采样频率速率:32K/44.1K/48K Hz;AC3 规范支持的音频比特率值:32000、40000、48000、56000、64000、80000、 96000、112000、128000、160000、192000、224000、256000、320000、384000、448000、512000、576000、640000 bps。

名称 类型 说明
@odata.type string:

#Microsoft.Media.DDAudio

派生类型的鉴别器。

bitrate

integer

输出编码音频的比特率(以比特/秒为单位)。

channels

integer

音频中的通道数。

label

string

编解码器的可选标签。 标签可用于控制复用行为。

samplingRate

integer

用于编码的采样率(以赫茨为单位)。

Deinterlace

描述反交错设置。

名称 类型 说明
mode

DeinterlaceMode

去交错模式。 默认为 AutoPixelAdaptive。

parity

DeinterlaceParity

用于去交错的字段奇偶校验,默认为“自动”。

DeinterlaceMode

去隔行模式。 默认为 AutoPixelAdaptive。

名称 类型 说明
AutoPixelAdaptive

string

对输入视频中的每个帧应用自动像素自适应反交错。

Off

string

禁用源视频的反交错。

DeinterlaceParity

反交错的字段奇偶校验,默认为“自动”。

名称 类型 说明
Auto

string

自动检测字段的顺序

BottomFieldFirst

string

应用底部字段第一个处理输入视频。

TopFieldFirst

string

应用顶部字段第一处理输入视频。

EncoderNamedPreset

用于编码视频的内置预设。

名称 类型 说明
AACGoodQualityAudio

string

生成仅包含以 192 kbps 编码的 AAC 立体声音频的单个 MP4 文件。

AdaptiveStreaming

string

使用 H.264 视频和立体声 AAC 音频生成一组 GOP 对齐的 MP4 文件。 根据输入分辨率、比特率和帧速率自动生成比特率阶梯。 自动生成的预设始终不会超过输入分辨率。 例如,如果输入为 720p,则输出将最高保持 720p。

ContentAwareEncoding

string

使用内容感知编码生成一组符合 GOP 标准的 MP4。 在提供任何输入内容的情况下,服务将对输入内容执行初始的轻量分析,并使用结果来确定最佳层数,以及自适应流式处理适合传送的比特率和分辨率设置。 此预设对于中低复杂度的视频特别有效,这些视频的输出文件的比特率将会较低,但质量仍可为观看者带来良好体验。 输出将包含带有交错式视频和音频的 MP4 文件。

ContentAwareEncodingExperimental

string

公开内容感知编码的实验预设。 在提供任何输入内容的情况下,服务将尝试自动确定最佳层数,以及自适应流式处理适合使用的比特率和分辨率设置。 底层算法将不断演进。 输出将包含带有交错式视频和音频的 MP4 文件。

CopyAllBitrateNonInterleaved

string

将输入资产中的所有视频和音频流复制为非交错视频和音频输出文件。 此预设可用于剪辑现有资产,或将一组关键帧 (GOP) 对齐的 MP4 文件转换为可流式传输的资产。

DDGoodQualityAudio

string

生成仅包含 DD (Digital Dolby) 以 192 kbps 编码的立体声音频的单个 MP4 文件。

H264MultipleBitrate1080p

string

生成一组 8 GOP 对齐的 MP4 文件(范围从 6000 kbps 到 400 kbps)和立体声 AAC 音频。 分辨率从 1080p 开始,下降到 180p。

H264MultipleBitrate720p

string

生成一组 6 GOP 对齐的 MP4 文件(范围从 3400 kbps 到 400 kbps)和立体声 AAC 音频。 分辨率从 720p 开始,下降到 180p。

H264MultipleBitrateSD

string

生成一组 5 GOP 对齐的 MP4 文件(范围从 1900kbps 到 400 kbps)和立体声 AAC 音频。 分辨率从 480p 开始,下降到 240p。

H264SingleBitrate1080p

string

生成 MP4 文件,其中视频以 6750 kbps 的 H.264 编解码器编码,图片高度为 1080 像素,立体声音频以 128 kbps 的 AAC-LC 编解码器进行编码。

H264SingleBitrate720p

string

生成 MP4 文件,其中视频以 4500 kbps 的 H.264 编解码器编码,图片高度为 720 像素,立体声音频使用 AAC-LC 编解码器以 128 kbps 编码。

H264SingleBitrateSD

string

生成 MP4 文件,其中视频以 2200 kbps 的 H.264 编解码器编码,图片高度为 480 像素,立体声音频使用 AAC-LC 编解码器以 128 kbps 编码。

H265AdaptiveStreaming

string

生成一组符合 GOP 的 MP4 文件,其中包含 H.265 视频和立体声 AAC 音频。 根据输入分辨率、比特率和帧速率自动生成比特率阶梯。 自动生成的预设始终不会超过输入分辨率。 例如,如果输入为 720p,则输出将最高保持 720p。

H265ContentAwareEncoding

string

使用内容感知编码生成一组符合 GOP 标准的 MP4。 在提供任何输入内容的情况下,服务将对输入内容执行初始的轻量分析,并使用结果来确定最佳层数,以及自适应流式处理适合传送的比特率和分辨率设置。 此预设对于中低复杂度的视频特别有效,这些视频的输出文件的比特率将会较低,但质量仍可为观看者带来良好体验。 输出将包含带有交错式视频和音频的 MP4 文件。

H265SingleBitrate1080p

string

生成 MP4 文件,其中视频以 3500 kbps 的 H.265 编解码器编码,图片高度为 1080 像素,立体声音频以 128 kbps 的 AAC-LC 编解码器进行编码。

H265SingleBitrate4K

string

生成 MP4 文件,其中视频以 9500 kbps 的 H.265 编解码器编码,图片高度为 2160 像素,立体声音频使用 AAC-LC 编解码器以 128 kbps 编码。

H265SingleBitrate720p

string

生成 MP4 文件,其中视频以 1800 kbps 的 H.265 编解码器编码,图片高度为 720 像素,立体声音频使用 AAC-LC 编解码器以 128 kbps 编码。

EntropyMode

要用于此层的熵模式。 如果未指定,编码器将选择适合配置文件和级别的模式。

名称 类型 说明
Cabac

string

上下文自适应二进制算术编码器 (CABAC) 熵编码。

Cavlc

string

上下文自适应可变长度编码器 (CAVLC) 熵编码。

ErrorAdditionalInfo

资源管理错误附加信息。

名称 类型 说明
info

object

其他信息。

type

string

其他信息类型。

ErrorDetail

错误详细信息。

名称 类型 说明
additionalInfo

ErrorAdditionalInfo[]

错误附加信息。

code

string

错误代码。

details

ErrorDetail[]

错误详细信息。

message

string

错误消息。

target

string

错误目标。

ErrorResponse

错误响应

名称 类型 说明
error

ErrorDetail

错误对象。

FaceDetectorPreset

描述分析视频时要使用的所有设置,以便检测 (并选择性地编辑) 存在的所有人脸。

名称 类型 说明
@odata.type string:

#Microsoft.Media.FaceDetectorPreset

派生类型的鉴别器。

blurType

BlurType

模糊类型

experimentalOptions

object

包含未在预设本身中公开的参数的键值对的字典

mode

FaceRedactorMode

此模式提供在以下设置之间进行选择的功能:1) 分析 - 仅用于检测。此模式生成一个元数据 JSON 文件,用于标记整个视频中人脸的外观。如果可能,为同一人的外观分配相同的 ID。2) 合并 - 此外, (模糊) 检测到的人脸。 3) 修订 - 这可实现 2 次传递过程,允许对检测到的一部分人脸进行选择性编辑。它从以前的分析阶段获取元数据文件,以及源视频,以及用户选择的需要编修的 ID 子集。

resolution

AnalysisResolution

指定分析视频时的最大分辨率。 默认行为为“SourceResolution”,它将在分析时将输入视频保持其原始分辨率。 使用“StandardDefinition”会将输入视频的大小调整为标准定义,同时保留适当的纵横比。 仅当视频分辨率更高时,它才会调整大小。 例如,在处理之前,1920x1080 输入将缩放为 640x360。 切换到“StandardDefinition”将减少处理高分辨率视频所需的时间。 它还可以降低使用此组件的成本, (https://azure.microsoft.com/en-us/pricing/details/media-services/#analytics 有关详细信息) 。 但是,可能无法检测到在调整大小后的视频中最终太小的人脸。

FaceRedactorMode

此模式提供在以下设置之间进行选择的功能:1) 分析 - 仅用于检测。此模式生成一个元数据 JSON 文件,用于标记整个视频中人脸的外观。如果可能,为同一人的外观分配相同的 ID。2) 合并 - 此外, (模糊) 检测到的人脸。 3) 修订 - 这可实现 2 次传递过程,允许对检测到的一部分人脸进行选择性编辑。它从以前的分析阶段获取元数据文件,以及源视频,以及用户选择的需要编修的 ID 子集。

名称 类型 说明
Analyze

string

分析模式检测人脸并输出包含结果的元数据文件。 允许在人脸使用“修订”模式模糊之前编辑元数据文件。

Combined

string

当不需要编辑已分析的人脸时,组合模式会一次性执行分析和修订步骤。

Redact

string

修订模式使用分析模式下的元数据文件,并编修找到的人脸。

Fade

描述应用于输入媒体的淡化效果的属性。

名称 类型 说明
duration

string

视频中淡出效果的持续时间。 该值可以采用 ISO 8601 格式 (例如,PT05S 表示在) 5 秒内淡入/淡出颜色,或帧计数 (例如,10 表示从开始时间) 淡出 10 帧,或相对于流持续时间 (的相对值例如,10% 表示淡出 10% 的流持续时间)

fadeColor

string

淡入/淡出的颜色。它可以位于 CSS Level1 颜色 https://developer.mozilla.org/en-US/docs/Web/CSS/color_value/color_keywords 或 RGB/十六进制值上:例如:rgb (255,0,0) 、0xFF0000 或 #FF0000

start

string

输入视频中开始淡出的位置。 该值可以是 ISO 8601 格式(例如,PT05S 表示在 5 秒处开始),可以是帧计数(例如,10 表示在第 10 帧处开始),也可以是流持续时间的相对值(例如,10% 表示在流持续时间的 10% 处开始)。 默认值为 0

Filters

描述在编码之前应用于输入媒体的所有筛选操作,例如去交错、旋转等。

名称 类型 说明
crop

Rectangle

用于裁剪输入视频的矩形窗口的参数。

deinterlace

Deinterlace

反交错设置。

fadeIn

Fade

描述应用于输入媒体的淡化效果的属性。

fadeOut

Fade

描述应用于输入媒体的淡化效果的属性。

overlays Overlay[]:

要应用于输入视频的覆盖的属性。 这些可以是音频、图像或视频覆盖。

rotation

Rotation

在对输入视频进行编码之前,要应用于输入视频的旋转(如果有)。 默认值为 Auto

H264Complexity

告知编码器如何选择其编码设置。 默认值为 Balanced。

名称 类型 说明
Balanced

string

告知编码器使用在速度和质量之间实现平衡的设置。

Quality

string

告知编码器使用经过优化的设置,以生成更高质量的输出,但代价是总体编码时间变慢。

Speed

string

告知编码器使用经过优化以加快编码速度的设置。 为了缩短编码时间,会牺牲质量。

H264Layer

介绍在使用 H.264 视频编解码器将输入视频编码为所需输出比特率层时要使用的设置。

名称 类型 说明
adaptiveBFrame

boolean

编码此层时是否要使用自适应 B 帧。 如果未指定,则只要视频配置文件允许使用,编码器就会将其打开。

bFrames

integer

编码此层时要使用的 B 帧数。 如果未指定,编码器将根据视频配置文件和级别选择适当的数字。

bitrate

integer

生成此层时对输入视频进行编码的平均比特率(以位/秒为单位)。 这是必填字段。

bufferWindow

string

VBV 缓冲区窗口长度。 该值应采用 ISO 8601 格式。 该值应在 [0.1-100] 秒范围内。 默认值为 5 秒, (例如 PT5S) 。

crf

number

编码此层时要使用的 CRF 值。 在 CRF 模式下设置视频编解码器的 RateControlMode 时,此设置生效。 CRF 值的范围在 0 到 51 之间,其中值越低,质量越好,代价是文件大小越大。 值越高意味着压缩越多,但在某些时候会注意到质量下降。 默认值为 23。

entropyMode

EntropyMode

要用于此层的熵模式。 如果未指定,编码器将选择适合配置文件和级别的模式。

frameRate

string

对此层进行编码) 帧速率 (以帧/秒为单位。 该值可以是 M/N 的形式,其中 M 和 N 是整数 (例如,30000/1001) ,或者采用数字 (例如,30 或 29.97) 。 编码器根据配置文件和级别对允许的帧速率强制实施约束。 如果未指定,编码器将使用与输入视频相同的帧速率。

height

string

此层的输出视频的高度。 该值可以是绝对 ((以像素) 为单位),也可以是相对 ((以百分比) 为单位)。 例如,50% 表示输出视频的高度是输入像素的一半。

label

string

此层的字母数字标签,可用于多路复用不同的视频和音频层,或命名输出文件。

level

string

我们目前支持高达 6.2 的级别。 该值可以是 Auto,也可以是与 H.264 配置文件匹配的数字。 如果未指定,则默认值为“自动”,它允许编码器选择适合此层的级别。

maxBitrate

integer

最大比特率 ((以位/秒为单位)) ,此时应假定 VBV 缓冲区重新填充。 如果未指定,则默认为与比特率相同的值。

profile

H264VideoProfile

我们目前支持 Baseline、Main、High、High422、High444。 默认值为“自动”。

referenceFrames

integer

编码此层时要使用的参考帧数。 如果未指定,编码器将根据编码器复杂性设置确定适当的数字。

slices

integer

编码此层时要使用的切片数。 如果未指定,则默认值为零,这意味着编码器将为每个帧使用单个切片。

width

string

此层的输出视频的宽度。 该值可以是绝对 ((以像素) 为单位),也可以是相对 ((以百分比) 为单位)。 例如,50% 表示输出视频的像素宽度是输入的一半。

H264RateControlMode

视频速率控制模式

名称 类型 说明
ABR

string

命中目标比特率 (ABR) 模式的平均比特率:默认模式。

CBR

string

固定比特率 (CBR) 模式,该模式围绕目标比特率收紧比特率变化。

CRF

string

恒定速率因子 (以恒定主观质量为目标的 CRF) 模式。

H264Video

介绍使用 H.264 编解码器对视频进行编码的所有属性。

名称 类型 说明
@odata.type string:

#Microsoft.Media.H264Video

派生类型的鉴别器。

complexity

H264Complexity

告知编码器如何选择其编码设置。 默认值为“平衡”。

keyFrameInterval

string

两个关键帧之间的距离。 该值应为以 ISO 8601 格式指定的 [0.5, 20] 秒范围内的非零。 默认值为 PT2S) (2 秒。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。

label

string

编解码器的可选标签。 标签可用于控制复用行为。

layers

H264Layer[]

要由编码器生成的输出 H.264 层的集合。

rateControlMode

H264RateControlMode

视频速率控制模式

sceneChangeDetection

boolean

编码器是否应在场景更改时插入关键帧。 如果未指定,则默认值为 false。 仅当编码器配置为生成单个输出视频时,才应将此标志设置为 true。

stretchMode

StretchMode

调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 (s) 。 默认值为 AutoSize

syncMode

VideoSyncMode

视频同步模式

H264VideoProfile

我们目前支持 Baseline、Main、High、High422、High444。 默认值为“自动”。

名称 类型 说明
Auto

string

告知编码器自动确定适当的 H.264 配置文件。

Baseline

string

基线配置文件

High

string

高调。

High422

string

高 4:2:2 配置文件。

High444

string

高 4:4:4 预测配置文件。

Main

string

主配置文件

H265Complexity

告知编码器如何选择其编码设置。 质量将提供更高的压缩率,但成本更高,计算时间更长。 速度将生成一个相对较大的文件,但速度更快、更经济。 默认值为“平衡”。

名称 类型 说明
Balanced

string

告知编码器使用在速度和质量之间实现平衡的设置。

Quality

string

告知编码器使用经过优化的设置,以生成更高质量的输出,但代价是总体编码时间变慢。

Speed

string

告知编码器使用经过优化以加快编码速度的设置。 为了缩短编码时间,会牺牲质量。

H265Layer

描述在使用 H.265 视频编解码器将输入视频编码为所需输出比特率层时要使用的设置。

名称 类型 说明
adaptiveBFrame

boolean

指定编码此层时是否使用自适应 B 帧。 如果未指定,则只要视频配置文件允许使用,编码器就会将其打开。

bFrames

integer

编码此层时要使用的 B 帧数。 如果未指定,编码器将根据视频配置文件和级别选择适当的数字。

bitrate

integer

生成此层时对输入视频进行编码的平均比特率(以位/秒为单位)。 例如:目标比特率为 3000Kbps 或 3Mbps 意味着此值应为 3000000 这是必填字段。

bufferWindow

string

VBV 缓冲区窗口长度。 该值应采用 ISO 8601 格式。 该值应在 [0.1-100] 秒范围内。 默认值为 5 秒, (例如 PT5S) 。

crf

number

编码此层时要使用的 CRF 值。 在 CRF 模式下设置视频编解码器的 RateControlMode 时,此设置生效。 CRF 值的范围在 0 到 51 之间,其中值越低,质量越好,代价是文件大小越大。 值越高意味着压缩越多,但在某些时候会注意到质量下降。 默认值为 28。

frameRate

string

对此层进行编码) 帧速率 (以帧/秒为单位。 该值可以是 M/N 的形式,其中 M 和 N 是整数 (例如,30000/1001) ,或者采用数字 (例如,30 或 29.97) 。 编码器根据配置文件和级别对允许的帧速率强制实施约束。 如果未指定,编码器将使用与输入视频相同的帧速率。

height

string

此层的输出视频的高度。 该值可以是绝对 ((以像素) 为单位),也可以是相对 ((以百分比) 为单位)。 例如,50% 表示输出视频的高度是输入像素的一半。

label

string

此层的字母数字标签,可用于多路复用不同的视频和音频层,或命名输出文件。

level

string

我们目前支持高达 6.2 的级别。 该值可以是 Auto,也可以是与 H.265 配置文件匹配的数字。 如果未指定,则默认值为“自动”,它允许编码器选择适合此层的级别。

maxBitrate

integer

最大比特率 ((以位/秒为单位)) ,此时应假定 VBV 缓冲区重新填充。 如果未指定,则默认为与比特率相同的值。

profile

H265VideoProfile

我们目前支持 Main。 默认值为“自动”。

referenceFrames

integer

编码此层时要使用的参考帧数。 如果未指定,编码器将根据编码器复杂性设置确定适当的数字。

slices

integer

编码此层时要使用的切片数。 如果未指定,则默认值为零,这意味着编码器将为每个帧使用单个切片。

width

string

此层的输出视频的宽度。 该值可以是绝对 ((以像素) 为单位),也可以是相对 ((以百分比) 为单位)。 例如,50% 表示输出视频的像素宽度是输入的一半。

H265Video

描述使用 H.265 编解码器对视频进行编码的所有属性。

名称 类型 说明
@odata.type string:

#Microsoft.Media.H265Video

派生类型的鉴别器。

complexity

H265Complexity

告知编码器如何选择其编码设置。 质量将提供更高的压缩率,但成本更高,计算时间更长。 速度将生成一个相对较大的文件,但速度更快且更经济。 默认值为 Balanced。

keyFrameInterval

string

两个关键帧之间的距离。 该值应在以 ISO 8601 格式指定的 [0.5, 20] 秒范围内为非零。 PT2S) (默认值为 2 秒。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将跟随输入源设置。

label

string

编解码器的可选标签。 标签可用于控制复用行为。

layers

H265Layer[]

编码器要生成的输出 H.265 层的集合。

sceneChangeDetection

boolean

指定编码器是否应在场景更改时插入关键帧。 如果未指定,则默认值为 false。 仅当编码器配置为生成单个输出视频时,才应将此标志设置为 true。

stretchMode

StretchMode

调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 () 。 默认值为 AutoSize

syncMode

VideoSyncMode

视频同步模式

H265VideoProfile

我们目前支持 Main。 默认值为“自动”。

名称 类型 说明
Auto

string

告知编码器自动确定相应的 H.265 配置文件。

Main

string

主配置文件 (https://x265.readthedocs.io/en/default/cli.html?highlight=profile#profile-level-tier)

Main10

string

主 10 配置文件 (https://en.wikipedia.org/wiki/High_Efficiency_Video_Coding#Main_10)

Image

介绍用于从输入视频生成缩略图的基本属性

名称 类型 说明
@odata.type string:

#Microsoft.Media.Image

派生类型的鉴别器。

keyFrameInterval

string

两个关键帧之间的距离。 该值应为以 ISO 8601 格式指定的 [0.5, 20] 秒范围内的非零。 默认值为 PT2S) (2 秒。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。

label

string

编解码器的可选标签。 标签可用于控制复用行为。

range

string

相对于转换输入视频中预设开始时间的位置,该时间将停止生成缩略图。 该值可以是 ISO 8601 格式(例如,PT5M30S 表示从开始时间起 5 分 30 秒停止),也可以是帧计数(例如,300 表示在开始时间帧的第 300 帧停止。如果该值为 1,则表示在开始时间处仅生成一个缩略图),或者是相对于流持续时间的相对值(例如,50% 表示从开始时间起的流持续时间的一半处停止)。 默认值是 100%,这表示在流的末尾处停止。

start

string

输入视频中开始生成缩略图的位置。 该值可以是 ISO 8601 格式(例如,PT05S 表示在 5 秒处开始),可以是帧计数(例如,10 表示在第 10 帧处开始),也可以是流持续时间的相对值(例如,10% 表示在流持续时间的 10% 处开始)。 还支持宏 {Best},它会指示编码器从视频的前几秒中选择最佳的缩略图,并且无论“步距”和“范围”的其他设置如何,都只会生成一个缩略图。 默认值为宏 {Best}。

step

string

生成缩略图的间隔。 该值可以采用 ISO 8601 格式 (例如,PT05S 表示每 5 秒) 一张图像,或者帧计数 (例如,每 30 帧) 一张图像 30,或者流持续时间 (例如,每 10% 流持续时间) 一个图像的 10%。 注意:步骤值将影响第一个生成的缩略图,该缩略图可能不完全是转换预设开始时间指定的缩略图。 这是由于编码器尝试选择开始时间与步骤位置之间的最佳缩略图作为第一个输出。 由于默认值为 10%,这意味着如果流具有较长的持续时间,则生成的第一个缩略图可能远离在开始时间指定的缩略图。 如果预计第一个缩略图接近开始时间,请尝试为 Step 选择合理的值;如果开始时间只需要一个缩略图,则尝试将 Range 值设置为 1。

stretchMode

StretchMode

调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 (s) 。 默认值为 AutoSize

syncMode

VideoSyncMode

视频同步模式

ImageFormat

描述输出图像文件的属性。

名称 类型 说明
@odata.type string:

#Microsoft.Media.ImageFormat

派生类型的鉴别器。

filenamePattern

string

用于创建输出文件的文件命名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件名称的扩展宏。 如果输入视频文件长度小于 32 个字符) ,则不包括文件后缀 (基名称,将使用输入视频文件的基本名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号 (从 1) 开始。 {Bitrate} - 音频/视频比特率(以 kbps 为单位)。 不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未替换的宏都将折叠并从文件名中删除。

InsightsType

定义希望服务生成的见解类型。 允许的值为“AudioInsightsOnly”、“VideoInsightsOnly”和“AllInsights”。 默认值为 AllInsights。 如果将此项设置为 AllInsights,并且输入仅为音频,则仅生成音频见解。 同样,如果输入仅视频,则仅生成视频见解。 如果你希望某些输入仅使用视频,建议不要使用 AudioInsightsOnly;或者,如果你希望某些输入仅是音频,请使用 VideoInsightsOnly。 在这种情况下,作业将出错。

名称 类型 说明
AllInsights

string

生成音频和视频见解。 如果音频或视频见解失败,则失败。

AudioInsightsOnly

string

生成仅限音频的见解。 即使存在,也忽略视频。 如果没有音频,则失败。

VideoInsightsOnly

string

生成仅视频见解。 忽略音频(如果存在)。 如果没有视频,则失败。

InterleaveOutput

设置输出的交错模式,以控制以容器格式存储音频和视频的方式。 示例:将 InterleavedOutput 设置为 NonInterleavedOutput,以在单独的 MP4 文件中生成仅限音频和仅视频的输出。

名称 类型 说明
InterleavedOutput

string

输出包括音频和视频。

NonInterleavedOutput

string

输出为仅视频或仅音频。

JpgFormat

描述用于生成 JPEG 缩略图的设置。

名称 类型 说明
@odata.type string:

#Microsoft.Media.JpgFormat

派生类型的鉴别器。

filenamePattern

string

用于创建输出文件的文件命名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件名称的扩展宏。 如果输入视频文件长度小于 32 个字符) ,则不包括文件后缀 (基名称,将使用输入视频文件的基本名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号 (从 1) 开始。 {Bitrate} - 音频/视频比特率(以 kbps 为单位)。 不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未替换的宏都将折叠并从文件名中删除。

JpgImage

介绍用于从输入视频生成一系列 JPEG 图像的属性。

名称 类型 说明
@odata.type string:

#Microsoft.Media.JpgImage

派生类型的鉴别器。

keyFrameInterval

string

两个关键帧之间的距离。 该值应为以 ISO 8601 格式指定的 [0.5, 20] 秒范围内的非零。 默认值为 PT2S) (2 秒。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。

label

string

编解码器的可选标签。 标签可用于控制复用行为。

layers

JpgLayer[]

要由编码器生成的输出 JPEG 图像层的集合。

range

string

相对于转换输入视频中预设开始时间的位置,该时间将停止生成缩略图。 该值可以是 ISO 8601 格式(例如,PT5M30S 表示从开始时间起 5 分 30 秒停止),也可以是帧计数(例如,300 表示在开始时间帧的第 300 帧停止。如果该值为 1,则表示在开始时间处仅生成一个缩略图),或者是相对于流持续时间的相对值(例如,50% 表示从开始时间起的流持续时间的一半处停止)。 默认值是 100%,这表示在流的末尾处停止。

spriteColumn

integer

设置缩略图子画面图像中使用的列数。 将自动计算行数,并使用子画面中每个缩略图的坐标映射生成 VTT 文件。 注意:此值应为正整数,建议使用适当的值,以便输出图像分辨率不会超出 JPEG 最大像素分辨率限制 65535x65535。

start

string

输入视频中开始生成缩略图的位置。 该值可以是 ISO 8601 格式(例如,PT05S 表示在 5 秒处开始),可以是帧计数(例如,10 表示在第 10 帧处开始),也可以是流持续时间的相对值(例如,10% 表示在流持续时间的 10% 处开始)。 还支持宏 {Best},它会指示编码器从视频的前几秒中选择最佳的缩略图,并且无论“步距”和“范围”的其他设置如何,都只会生成一个缩略图。 默认值为宏 {Best}。

step

string

生成缩略图的间隔。 该值可以采用 ISO 8601 格式 (例如,PT05S 表示每 5 秒) 一张图像,或者帧计数 (例如,每 30 帧) 一张图像 30,或者流持续时间 (例如,每 10% 流持续时间) 一个图像的 10%。 注意:步骤值将影响第一个生成的缩略图,该缩略图可能不完全是转换预设开始时间指定的缩略图。 这是由于编码器尝试选择开始时间与步骤位置之间的最佳缩略图作为第一个输出。 由于默认值为 10%,这意味着如果流具有较长的持续时间,则生成的第一个缩略图可能远离在开始时间指定的缩略图。 如果预计第一个缩略图接近开始时间,请尝试为 Step 选择合理的值;如果开始时间只需要一个缩略图,则尝试将 Range 值设置为 1。

stretchMode

StretchMode

调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 (s) 。 默认值为 AutoSize

syncMode

VideoSyncMode

视频同步模式

JpgLayer

描述用于从输入视频生成 JPEG 图像的设置。

名称 类型 说明
height

string

此层的输出视频的高度。 该值可以是绝对 ((以像素) 为单位),也可以是相对 ((以百分比) 为单位)。 例如,50% 表示输出视频的高度是输入像素的一半。

label

string

此层的字母数字标签,可用于多路复用不同的视频和音频层,或命名输出文件。

quality

integer

JPEG 输出的压缩质量。 范围为 0-100,默认值为 70。

width

string

此层的输出视频的宽度。 该值可以是绝对 ((以像素) 为单位),也可以是相对 ((以百分比) 为单位)。 例如,50% 表示输出视频的像素宽度是输入的一半。

Mp4Format

描述输出 ISO MP4 文件的属性。

名称 类型 说明
@odata.type string:

#Microsoft.Media.Mp4Format

派生类型的鉴别器。

filenamePattern

string

用于创建输出文件的文件命名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件名称的扩展宏。 如果输入视频文件长度小于 32 个字符) ,则不包括文件后缀 (基名称,将使用输入视频文件的基本名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号 (从 1) 开始。 {Bitrate} - 音频/视频比特率(以 kbps 为单位)。 不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未替换的宏都将折叠并从文件名中删除。

outputFiles

OutputFile[]

要生成的输出文件的列表。 列表中的每个条目都是一组音频和视频层标签,这些标签要复用在一起。

MultiBitrateFormat

介绍用于生成 GOP 对齐多比特率文件集合的属性。 默认行为是为每个视频层生成一个输出文件,该文件与所有音频一起复用。 可以通过指定 outputFiles 集合来控制生成的确切输出文件。

名称 类型 说明
@odata.type string:

#Microsoft.Media.MultiBitrateFormat

派生类型的鉴别器。

filenamePattern

string

用于创建输出文件的文件命名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件名称的扩展宏。 如果输入视频文件长度小于 32 个字符) ,则不包括文件后缀 (基名称,将使用输入视频文件的基本名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号 (从 1) 开始。 {Bitrate} - 音频/视频比特率(以 kbps 为单位)。 不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未替换的宏都将折叠并从文件名中删除。

outputFiles

OutputFile[]

要生成的输出文件的列表。 列表中的每个条目都是一组音频和视频层标签,这些标签要复用在一起。

OnErrorType

转换可以定义多个输出。 此属性定义当一个输出失败时服务应执行的操作 - 继续生成其他输出,或者停止其他输出。 总体作业状态不会反映使用“ContinueJob”指定的输出失败。 默认值为“StopProcessingJob”。

名称 类型 说明
ContinueJob

string

告知服务,如果此 TransformOutput 失败,则允许任何其他 TransformOutput 继续。

StopProcessingJob

string

告知服务,如果此 TransformOutput 失败,则可以停止任何其他不完整的 TransformOutput。

OutputFile

表示生成的输出文件。

名称 类型 说明
labels

string[]

描述编码器如何将视频和音频多路复用到输出文件中的标签列表。 例如,如果编码器正在生成两个带有标签 v1 和 v2 的视频层,以及一个带有标签 a1 的视频层,则类似“[v1, a1]”的数组会告知编码器生成一个输出文件,其中包含由 v1 表示的视频轨迹和由 a1 表示的音频轨道。

PngFormat

介绍用于生成 PNG 缩略图的设置。

名称 类型 说明
@odata.type string:

#Microsoft.Media.PngFormat

派生类型的鉴别器。

filenamePattern

string

用于创建输出文件的文件命名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件名称的扩展宏。 如果输入视频文件长度小于 32 个字符) ,则不包括文件后缀 (基名称,将使用输入视频文件的基本名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号 (从 1) 开始。 {Bitrate} - 音频/视频比特率(以 kbps 为单位)。 不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未替换的宏都将折叠并从文件名中删除。

PngImage

介绍用于从输入视频生成一系列 PNG 图像的属性。

名称 类型 说明
@odata.type string:

#Microsoft.Media.PngImage

派生类型的鉴别器。

keyFrameInterval

string

两个关键帧之间的距离。 该值应为以 ISO 8601 格式指定的 [0.5, 20] 秒范围内的非零。 默认值为 PT2S) (2 秒。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将遵循输入源设置。

label

string

编解码器的可选标签。 标签可用于控制复用行为。

layers

PngLayer[]

要由编码器生成的输出 PNG 图像层的集合。

range

string

相对于转换输入视频中预设开始时间的位置,该时间将停止生成缩略图。 该值可以是 ISO 8601 格式(例如,PT5M30S 表示从开始时间起 5 分 30 秒停止),也可以是帧计数(例如,300 表示在开始时间帧的第 300 帧停止。如果该值为 1,则表示在开始时间处仅生成一个缩略图),或者是相对于流持续时间的相对值(例如,50% 表示从开始时间起的流持续时间的一半处停止)。 默认值是 100%,这表示在流的末尾处停止。

start

string

输入视频中开始生成缩略图的位置。 该值可以是 ISO 8601 格式(例如,PT05S 表示在 5 秒处开始),可以是帧计数(例如,10 表示在第 10 帧处开始),也可以是流持续时间的相对值(例如,10% 表示在流持续时间的 10% 处开始)。 还支持宏 {Best},它会指示编码器从视频的前几秒中选择最佳的缩略图,并且无论“步距”和“范围”的其他设置如何,都只会生成一个缩略图。 默认值为宏 {Best}。

step

string

生成缩略图的间隔。 该值可以采用 ISO 8601 格式 (例如,PT05S 表示每 5 秒) 一张图像,或者帧计数 (例如,每 30 帧) 一张图像 30,或者流持续时间 (例如,每 10% 流持续时间) 一个图像的 10%。 注意:步骤值将影响第一个生成的缩略图,该缩略图可能不完全是转换预设开始时间指定的缩略图。 这是由于编码器尝试选择开始时间与步骤位置之间的最佳缩略图作为第一个输出。 由于默认值为 10%,这意味着如果流具有较长的持续时间,则生成的第一个缩略图可能远离在开始时间指定的缩略图。 如果预计第一个缩略图接近开始时间,请尝试为 Step 选择合理的值;如果开始时间只需要一个缩略图,则尝试将 Range 值设置为 1。

stretchMode

StretchMode

调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 (s) 。 默认值为 AutoSize

syncMode

VideoSyncMode

视频同步模式

PngLayer

描述用于从输入视频生成 PNG 图像的设置。

名称 类型 说明
height

string

此层的输出视频的高度。 该值可以是绝对 ((以像素) 为单位),也可以是相对 ((以百分比) 为单位)。 例如,50% 表示输出视频的高度是输入像素的一半。

label

string

此层的字母数字标签,可用于多路复用不同的视频和音频层,或命名输出文件。

width

string

此层的输出视频的宽度。 该值可以是绝对 ((以像素) 为单位),也可以是相对 ((以百分比) 为单位)。 例如,50% 表示输出视频的像素宽度是输入的一半。

PresetConfigurations

编码器的可选配置设置的对象。

名称 类型 说明
complexity

Complexity

可用于配置编码器设置,以控制速度和质量之间的平衡。 示例:将“复杂性”设置为“速度”,以加快编码速度,但降低压缩效率。

interleaveOutput

InterleaveOutput

设置输出的交错模式,以控制以容器格式存储音频和视频的方式。 示例:将 InterleavedOutput 设置为 NonInterleavedOutput,以在单独的 MP4 文件中生成仅限音频和仅视频的输出。

keyFrameIntervalInSeconds

number

关键帧间隔(以秒为单位)。 示例:将 KeyFrameIntervalInSeconds 设置为 2 以减少某些玩家的播放缓冲。

maxBitrateBps

integer

最大比特率(以位/秒为单位) (顶级视频层) 的阈值。 示例:将 MaxBitrateBps 设置为 6000000,以避免为具有较高复杂性的内容生成非常高的比特率输出。

maxHeight

integer

输出视频层的最大高度。 示例:将 MaxHeight 设置为 720,以生成高达 720P 的输出层,即使输入为 4K 也是如此。

maxLayers

integer

输出视频层的最大数目。 示例:将 MaxLayers 设置为 4,确保最多生成 4 个输出层,以控制编码作业的总体成本。

minBitrateBps

integer

最低比特率(以位/秒为单位) (底层视频层) 的阈值。 示例:将 MinBitrateBps 设置为 200000,以具有覆盖低网络带宽的用户的底层。

minHeight

integer

输出视频层的最小高度。 示例:将 MinHeight 设置为 360 以避免输出层的较小分辨率(如 180P)。

Priority

设置转换中 TransformOutputs 的相对优先级。 这将设置服务用于处理 TransformOutput 的优先级。 默认优先级为 Normal。

名称 类型 说明
High

string

用于应优先于其他转换输出。

Low

string

用于可在正常和高优先级 TransformOutputs 之后生成的 TransformOutput。

Normal

string

用于可在普通优先级下生成的 TransformOutput。

Rectangle

描述在处理输入媒体之前应用于输入媒体的矩形窗口的属性。

名称 类型 说明
height

string

矩形区域的高度(以像素为单位)。 这可以是绝对像素值 (例如 100) ,也可以是相对于视频 (大小,例如 50% ) 。

left

string

左边距的像素数。 这可以是绝对像素值 (例如 100) ,也可以是相对于视频 (大小,例如 50% ) 。

top

string

上边距的像素数。 这可以是绝对像素值 (例如 100) ,也可以是相对于视频 (大小,例如 50% ) 。

width

string

矩形区域的宽度(以像素为单位)。 这可以是绝对像素值 (例如 100) ,也可以是相对于视频 (大小,例如 50% ) 。

Rotation

在对输入视频进行编码之前,要应用于输入视频的旋转(如果有)。 默认值为 Auto

名称 类型 说明
Auto

string

根据需要自动检测和旋转。

None

string

不要旋转视频。 如果输出格式支持,则有关旋转的任何元数据将保持不变。

Rotate0

string

不要旋转视频,但删除有关旋转的任何元数据。

Rotate180

string

顺时针旋转 180 度。

Rotate270

string

顺时针旋转 270 度。

Rotate90

string

顺时针旋转 90 度。

StandardEncoderPreset

介绍在使用标准编码器对输入视频进行编码时要使用的所有设置。

名称 类型 说明
@odata.type string:

#Microsoft.Media.StandardEncoderPreset

派生类型的鉴别器。

codecs Codec[]:

编码输入视频时要使用的编解码器列表。

experimentalOptions

object

包含未在预设本身中公开的参数的键值对的字典

filters

Filters

编码前应用于输入媒体的一个或多个筛选操作。

formats Format[]:

编码器要生成的输出列表。

StretchMode

调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 (s) 。 默认值为 AutoSize

名称 类型 说明
AutoFit

string

使用信箱或支柱框) 填充输出 (,以遵循输出分辨率,同时确保输出中的活动视频区域具有与输入相同的纵横比。 例如,如果输入为 1920x1080,编码预设要求为 1280x1280,则输出将为 1280x1280,其中包含一个纵横比为 1280x720 的内部矩形(纵横比为 16:9),柱形框区域在左侧和右侧为 280 像素宽。

AutoSize

string

重写输出分辨率,并更改它以匹配输入的显示纵横比,而无需填充。 例如,如果输入为 1920x1080,而编码预设要求提供 1280x1280,则会重写预设中的值,输出将是 1280x720,这样可以保持 16:9 的输入纵横比。

None

string

严格遵循输出分辨率,而不考虑输入视频的像素纵横比或显示纵横比。

systemData

与资源的创建和上次修改相关的元数据。

名称 类型 说明
createdAt

string

资源创建时间戳 (UTC) 。

createdBy

string

创建资源的标识。

createdByType

createdByType

创建资源的标识类型。

lastModifiedAt

string

资源上次修改的时间戳 (UTC)

lastModifiedBy

string

上次修改资源的标识。

lastModifiedByType

createdByType

上次修改资源的标识类型。

Transform

转换封装用于从输入媒体生成所需输出的规则或指令,例如通过转码或提取见解。 创建转换后,可以通过创建作业将其应用于输入媒体。

名称 类型 说明
id

string

资源的完全限定的资源 ID。 例如 - /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName}

name

string

资源的名称

properties.created

string

创建转换时的 UTC 日期和时间,格式为“YYYY-MM-DDThh:mm:ssZ”。

properties.description

string

转换的可选详细说明。

properties.lastModified

string

上次更新转换的 UTC 日期和时间,格式为“YYYY-MM-DDThh:mm:ssZ”。

properties.outputs

TransformOutput[]

转换应该生成的一个或多个 TransformOutput 的数组。

systemData

systemData

与此资源相关的系统元数据。

type

string

资源类型。 例如“Microsoft.Compute/virtualMachines”或“Microsoft.Storage/storageAccounts”

TransformOutput

描述 TransformOutput 的属性,这些属性是在生成所需输出时要应用的规则。

名称 类型 说明
onError

OnErrorType

转换可以定义多个输出。 此属性定义当一个输出失败时服务应执行的操作 - 继续生成其他输出,或者停止其他输出。 总体作业状态不会反映使用“ContinueJob”指定的输出失败。 默认值为“StopProcessingJob”。

preset Preset:

描述将用于修改、转码或从源文件中提取见解以生成输出的操作的预设。

relativePriority

Priority

设置转换中 TransformOutputs 的相对优先级。 这将设置服务用于处理 TransformOutput 的优先级。 默认优先级为 Normal。

TransportStreamFormat

介绍用于生成 MPEG-2 传输流的属性 (ISO/IEC 13818-1) 输出视频文件 () 。

名称 类型 说明
@odata.type string:

#Microsoft.Media.TransportStreamFormat

派生类型的鉴别器。

filenamePattern

string

用于创建输出文件的文件命名模式。 文件名支持以下宏:{Basename} - 将使用输入视频文件名称的扩展宏。 如果输入视频文件长度小于 32 个字符) ,则不包括文件后缀 (基名称,将使用输入视频文件的基本名称。 如果输入视频文件的基名称长度超过 32 个字符,则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。 仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号 (从 1) 开始。 {Bitrate} - 音频/视频比特率(以 kbps 为单位)。 不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。 任何未替换的宏都将折叠并从文件名中删除。

outputFiles

OutputFile[]

要生成的输出文件的列表。 列表中的每个条目都是一组音频和视频层标签,这些标签要复用在一起。

Video

介绍用于编码输入视频的基本属性。

名称 类型 说明
@odata.type string:

#Microsoft.Media.Video

派生类型的鉴别器。

keyFrameInterval

string

两个关键帧之间的距离。 该值应在以 ISO 8601 格式指定的 [0.5, 20] 秒范围内为非零。 PT2S) (默认值为 2 秒。 请注意,如果设置了 VideoSyncMode.Passthrough,则忽略此设置,其中 KeyFrameInterval 值将跟随输入源设置。

label

string

编解码器的可选标签。 标签可用于控制复用行为。

stretchMode

StretchMode

调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 () 。 默认值为 AutoSize

syncMode

VideoSyncMode

视频同步模式

VideoAnalyzerPreset

视频分析器预设,用于从音频和视频中提取见解 (丰富的元数据) ,并输出 JSON 格式化文件。

名称 类型 说明
@odata.type string:

#Microsoft.Media.VideoAnalyzerPreset

派生类型的鉴别器。

audioLanguage

string

使用“语言标记区域”的 BCP-47 格式的输入中的音频有效负载的语言 (例如:“en-US”) 。 如果你知道内容的语言,建议你指定它。 必须为 AudioAnalysisMode::Basic 显式指定语言,因为自动语言检测不包括在基本模式下。 如果未指定语言或将语言设置为 null,自动语言检测将选择检测到的第一种语言并使用所选语言处理整个文件。 它目前不支持在检测到第一种语言后在各语言之间进行动态切换。 自动检测最适用于具有清晰可辨识语音的录音。 如果自动检测找不到该语言,则听录将回退到'en-US'。”此处提供了支持的语言列表: https://go.microsoft.com/fwlink/?linkid=2109463

experimentalOptions

object

包含未在预设本身中公开的参数的键值对的字典

insightsToExtract

InsightsType

定义希望服务生成的见解类型。 允许的值为“AudioInsightsOnly”、“VideoInsightsOnly”和“AllInsights”。 默认值为 AllInsights。 如果将此项设置为 AllInsights,并且输入仅为音频,则仅生成音频见解。 同样,如果输入仅视频,则仅生成视频见解。 如果你希望某些输入仅使用视频,建议不要使用 AudioInsightsOnly;或者,如果你希望某些输入仅是音频,请使用 VideoInsightsOnly。 在这种情况下,作业将出错。

mode

AudioAnalysisMode

确定要执行的音频分析操作集。 如果未指定,将选择标准 AudioAnalysisMode。

VideoOverlay

描述视频覆盖的属性。

名称 类型 说明
@odata.type string:

#Microsoft.Media.VideoOverlay

派生类型的鉴别器。

audioGainLevel

number

覆盖中音频的增益级别。 该值应位于 [0, 1.0] 范围内。 默认值为 1.0。

cropRectangle

Rectangle

用于裁剪覆盖图像或视频的可选矩形窗口。

end

string

结束位置(引用了覆盖结束处的输入视频)。 该值应采用 ISO 8601 格式。 例如,PT30S 在输入视频的 30 秒处结束覆盖。 如果未指定或该值大于输入视频持续时间,则覆盖媒体持续时间大于输入视频持续时间时,将应用覆盖,直到输入视频结束,否则覆盖将持续到覆盖媒体持续时间。

fadeInDuration

string

覆盖淡入输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定,则默认行为是无淡入 (与 PT0S) 相同。

fadeOutDuration

string

覆盖淡出输入视频的持续时间。 该值应采用 ISO 8601 持续时间格式。 如果未指定,则默认行为是没有淡出 (与 PT0S) 相同。

inputLabel

string

要用作覆盖的作业输入的标签。 输入必须指定一个文件。 可以指定 JPG、PNG、GIF 或 BMP 格式的图像文件,或者指定音频文件(如 WAV、MP3、WMA 或 M4A 文件)或视频文件。 有关支持的音频和视频文件格式的完整列表,请参阅 https://aka.ms/mesformats

opacity

number

覆盖层的不透明度。 这是 [0 - 1.0] 范围内的值。 默认值为 1.0,这意味着覆盖不透明。

position

Rectangle

输入视频中应用覆盖的位置。

start

string

开始位置(引用了覆盖层开始的输入视频)。 该值应采用 ISO 8601 格式。 例如,PT05S 在 5 秒处开始覆盖输入视频。 如果未指定,覆盖层将从输入视频的开头开始。

VideoSyncMode

视频同步模式

名称 类型 说明
Auto

string

这是默认方法。 根据复用器功能在 Cfr 和 Vfr 之间进行选择。 对于输出格式 MP4,默认模式为 Cfr。

Cfr

string

将根据需要重复和/或删除输入帧,以完全达到所请求的恒定帧速率。 当输出帧速率显式设置为指定值时,建议使用

Passthrough

string

帧上的演示文稿时间戳从输入文件传递到输出文件编写器。 当输入源具有可变帧速率,并且尝试在具有对齐 GOP 边界的输出中生成多个自适应流式处理层时,建议使用 。 注意:如果输入中的两个或更多帧具有重复的时间戳,则输出也将具有相同的行为

Vfr

string

类似于传递模式,但如果输入具有重复时间戳的帧,则只有一个帧传递到输出,而其他帧则被删除。 当输出帧数应等于输入帧数时,建议使用。 例如,输出用于根据输入计算质量指标(如 PSNR)