你当前正在访问 Microsoft Azure Global Edition 技术文档网站。如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站，请访问 https://docs.azure.cn。

Transforms - Create Or Update

参考

服务:: Media Services

API 版本:: 2022-07-01

创建或更新转换
创建或更新新的转换。

PUT https://management.azure.com/subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/Microsoft.Media/mediaServices/{accountName}/transforms/{transformName}?api-version=2022-07-01

URI 参数

名称	在	必需	类型	说明
accountName	path	True	string	媒体服务帐户名称。
resourceGroupName	path	True	string	Azure 订阅中资源组的名称。
subscriptionId	path	True	string	Microsoft Azure 订阅的唯一标识符。
transformName	path	True	string	转换名称。
api-version	query	True	string	要与客户端请求一起使用的 API 的版本。

请求正文

名称	必需	类型	说明
properties.outputs	True	TransformOutput[]	转换应该生成的一个或多个 TransformOutput 的数组。
properties.description		string	转换的可选详细说明。

响应

名称	类型	说明
200 OK	Transform	确定
201 Created	Transform	创建
Other Status Codes	ErrorResponse	详细的错误信息。

示例

Create or update a Transform

示例请求

PUT https://management.azure.com/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/contosoresources/providers/Microsoft.Media/mediaServices/contosomedia/transforms/createdTransform?api-version=2022-07-01

{
  "properties": {
    "description": "Example Transform to illustrate create and update.",
    "outputs": [
      {
        "preset": {
          "@odata.type": "#Microsoft.Media.BuiltInStandardEncoderPreset",
          "presetName": "AdaptiveStreaming"
        }
      }
    ]
  }
}


import com.azure.resourcemanager.mediaservices.models.BuiltInStandardEncoderPreset;
import com.azure.resourcemanager.mediaservices.models.EncoderNamedPreset;
import com.azure.resourcemanager.mediaservices.models.TransformOutput;
import java.util.Arrays;

/**
 * Samples for Transforms CreateOrUpdate.
 */
public final class Main {
    /*
     * x-ms-original-file:
     * specification/mediaservices/resource-manager/Microsoft.Media/Encoding/stable/2022-07-01/examples/transforms-
     * create.json
     */
    /**
     * Sample code: Create or update a Transform.
     * 
     * @param manager Entry point to MediaServicesManager.
     */
    public static void createOrUpdateATransform(com.azure.resourcemanager.mediaservices.MediaServicesManager manager) {
        manager.transforms().define("createdTransform").withExistingMediaService("contosoresources", "contosomedia")
            .withDescription("Example Transform to illustrate create and update.")
            .withOutputs(Arrays.asList(new TransformOutput()
                .withPreset(new BuiltInStandardEncoderPreset().withPresetName(EncoderNamedPreset.ADAPTIVE_STREAMING))))
            .create();
    }
}

To use the Azure SDK library in your project, see this documentation. To provide feedback on this code sample, open a GitHub issue

from azure.identity import DefaultAzureCredential
from azure.mgmt.media import AzureMediaServices

"""
# PREREQUISITES
    pip install azure-identity
    pip install azure-mgmt-media
# USAGE
    python transformscreate.py

    Before run the sample, please set the values of the client ID, tenant ID and client secret
    of the AAD application as environment variables: AZURE_CLIENT_ID, AZURE_TENANT_ID,
    AZURE_CLIENT_SECRET. For more info about how to get the value, please see:
    https://docs.microsoft.com/azure/active-directory/develop/howto-create-service-principal-portal
"""


def main():
    client = AzureMediaServices(
        credential=DefaultAzureCredential(),
        subscription_id="00000000-0000-0000-0000-000000000000",
    )

    response = client.transforms.create_or_update(
        resource_group_name="contosoresources",
        account_name="contosomedia",
        transform_name="createdTransform",
        parameters={
            "properties": {
                "description": "Example Transform to illustrate create and update.",
                "outputs": [
                    {
                        "preset": {
                            "@odata.type": "#Microsoft.Media.BuiltInStandardEncoderPreset",
                            "presetName": "AdaptiveStreaming",
                        }
                    }
                ],
            }
        },
    )
    print(response)


# x-ms-original-file: specification/mediaservices/resource-manager/Microsoft.Media/Encoding/stable/2022-07-01/examples/transforms-create.json
if __name__ == "__main__":
    main()

To use the Azure SDK library in your project, see this documentation. To provide feedback on this code sample, open a GitHub issue

package armmediaservices_test

import (
	"context"
	"log"

	"github.com/Azure/azure-sdk-for-go/sdk/azcore/to"
	"github.com/Azure/azure-sdk-for-go/sdk/azidentity"
	"github.com/Azure/azure-sdk-for-go/sdk/resourcemanager/mediaservices/armmediaservices/v3"
)

// Generated from example definition: https://github.com/Azure/azure-rest-api-specs/blob/e7bf3adfa2d5e5cdbb804eec35279501794f461c/specification/mediaservices/resource-manager/Microsoft.Media/Encoding/stable/2022-07-01/examples/transforms-create.json
func ExampleTransformsClient_CreateOrUpdate() {
	cred, err := azidentity.NewDefaultAzureCredential(nil)
	if err != nil {
		log.Fatalf("failed to obtain a credential: %v", err)
	}
	ctx := context.Background()
	clientFactory, err := armmediaservices.NewClientFactory("<subscription-id>", cred, nil)
	if err != nil {
		log.Fatalf("failed to create client: %v", err)
	}
	res, err := clientFactory.NewTransformsClient().CreateOrUpdate(ctx, "contosoresources", "contosomedia", "createdTransform", armmediaservices.Transform{
		Properties: &armmediaservices.TransformProperties{
			Description: to.Ptr("Example Transform to illustrate create and update."),
			Outputs: []*armmediaservices.TransformOutput{
				{
					Preset: &armmediaservices.BuiltInStandardEncoderPreset{
						ODataType:  to.Ptr("#Microsoft.Media.BuiltInStandardEncoderPreset"),
						PresetName: to.Ptr(armmediaservices.EncoderNamedPresetAdaptiveStreaming),
					},
				}},
		},
	}, nil)
	if err != nil {
		log.Fatalf("failed to finish the request: %v", err)
	}
	// You could use response here. We use blank identifier for just demo purposes.
	_ = res
	// If the HTTP response code is 200 as defined in example definition, your response structure would look as follows. Please pay attention that all the values in the output are fake values for just demo purposes.
	// res.Transform = armmediaservices.Transform{
	// 	Name: to.Ptr("createdTransform"),
	// 	Type: to.Ptr("Microsoft.Media/mediaservices/transforms"),
	// 	ID: to.Ptr("/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/contosoresources/providers/Microsoft.Media/mediaservices/contosomedia/transforms/createdTransform"),
	// 	Properties: &armmediaservices.TransformProperties{
	// 		Description: to.Ptr("Example Transform to illustrate create and update."),
	// 		Created: to.Ptr(func() time.Time { t, _ := time.Parse(time.RFC3339Nano, "2022-10-17T23:14:31.766Z"); return t}()),
	// 		LastModified: to.Ptr(func() time.Time { t, _ := time.Parse(time.RFC3339Nano, "2022-10-17T23:14:31.766Z"); return t}()),
	// 		Outputs: []*armmediaservices.TransformOutput{
	// 			{
	// 				OnError: to.Ptr(armmediaservices.OnErrorTypeStopProcessingJob),
	// 				Preset: &armmediaservices.BuiltInStandardEncoderPreset{
	// 					ODataType: to.Ptr("#Microsoft.Media.BuiltInStandardEncoderPreset"),
	// 					PresetName: to.Ptr(armmediaservices.EncoderNamedPresetAdaptiveStreaming),
	// 				},
	// 				RelativePriority: to.Ptr(armmediaservices.PriorityNormal),
	// 		}},
	// 	},
	// 	SystemData: &armmediaservices.SystemData{
	// 		CreatedAt: to.Ptr(func() time.Time { t, _ := time.Parse(time.RFC3339Nano, "2022-10-17T23:14:31.766Z"); return t}()),
	// 		CreatedBy: to.Ptr("contoso@microsoft.com"),
	// 		CreatedByType: to.Ptr(armmediaservices.CreatedByTypeUser),
	// 		LastModifiedAt: to.Ptr(func() time.Time { t, _ := time.Parse(time.RFC3339Nano, "2022-10-17T23:14:31.766Z"); return t}()),
	// 		LastModifiedBy: to.Ptr("contoso@microsoft.com"),
	// 		LastModifiedByType: to.Ptr(armmediaservices.CreatedByTypeUser),
	// 	},
	// }
}

To use the Azure SDK library in your project, see this documentation. To provide feedback on this code sample, open a GitHub issue

const { AzureMediaServices } = require("@azure/arm-mediaservices");
const { DefaultAzureCredential } = require("@azure/identity");

/**
 * This sample demonstrates how to Creates or updates a new Transform.
 *
 * @summary Creates or updates a new Transform.
 * x-ms-original-file: specification/mediaservices/resource-manager/Microsoft.Media/Encoding/stable/2022-07-01/examples/transforms-create.json
 */
async function createOrUpdateATransform() {
  const subscriptionId =
    process.env["MEDIASERVICES_SUBSCRIPTION_ID"] || "00000000-0000-0000-0000-000000000000";
  const resourceGroupName = process.env["MEDIASERVICES_RESOURCE_GROUP"] || "contosoresources";
  const accountName = "contosomedia";
  const transformName = "createdTransform";
  const parameters = {
    description: "Example Transform to illustrate create and update.",
    outputs: [
      {
        preset: {
          odataType: "#Microsoft.Media.BuiltInStandardEncoderPreset",
          presetName: "AdaptiveStreaming",
        },
      },
    ],
  };
  const credential = new DefaultAzureCredential();
  const client = new AzureMediaServices(credential, subscriptionId);
  const result = await client.transforms.createOrUpdate(
    resourceGroupName,
    accountName,
    transformName,
    parameters
  );
  console.log(result);
}

To use the Azure SDK library in your project, see this documentation. To provide feedback on this code sample, open a GitHub issue

using System;
using System.Threading.Tasks;
using Azure;
using Azure.Core;
using Azure.Identity;
using Azure.ResourceManager;
using Azure.ResourceManager.Media;
using Azure.ResourceManager.Media.Models;

// Generated from example definition: specification/mediaservices/resource-manager/Microsoft.Media/Encoding/stable/2022-07-01/examples/transforms-create.json
// this example is just showing the usage of "Transforms_CreateOrUpdate" operation, for the dependent resources, they will have to be created separately.

// get your azure access token, for more details of how Azure SDK get your access token, please refer to https://learn.microsoft.com/en-us/dotnet/azure/sdk/authentication?tabs=command-line
TokenCredential cred = new DefaultAzureCredential();
// authenticate your client
ArmClient client = new ArmClient(cred);

// this example assumes you already have this MediaServicesAccountResource created on azure
// for more information of creating MediaServicesAccountResource, please refer to the document of MediaServicesAccountResource
string subscriptionId = "00000000-0000-0000-0000-000000000000";
string resourceGroupName = "contosoresources";
string accountName = "contosomedia";
ResourceIdentifier mediaServicesAccountResourceId = MediaServicesAccountResource.CreateResourceIdentifier(subscriptionId, resourceGroupName, accountName);
MediaServicesAccountResource mediaServicesAccount = client.GetMediaServicesAccountResource(mediaServicesAccountResourceId);

// get the collection of this MediaTransformResource
MediaTransformCollection collection = mediaServicesAccount.GetMediaTransforms();

// invoke the operation
string transformName = "createdTransform";
MediaTransformData data = new MediaTransformData()
{
    Description = "Example Transform to illustrate create and update.",
    Outputs =
    {
    new MediaTransformOutput(new BuiltInStandardEncoderPreset(EncoderNamedPreset.AdaptiveStreaming))
    },
};
ArmOperation<MediaTransformResource> lro = await collection.CreateOrUpdateAsync(WaitUntil.Completed, transformName, data);
MediaTransformResource result = lro.Value;

// the variable result is a resource, you could call other operations on this instance as well
// but just for demo, we get its data from this resource instance
MediaTransformData resourceData = result.Data;
// for demo we just print out the id
Console.WriteLine($"Succeeded on id: {resourceData.Id}");

To use the Azure SDK library in your project, see this documentation. To provide feedback on this code sample, open a GitHub issue

示例响应

状态代码:: 201

{
  "name": "createdTransform",
  "id": "/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/contosoresources/providers/Microsoft.Media/mediaservices/contosomedia/transforms/createdTransform",
  "type": "Microsoft.Media/mediaservices/transforms",
  "properties": {
    "created": "2022-10-17T23:14:31.7664818Z",
    "description": "Example Transform to illustrate create and update.",
    "lastModified": "2022-10-17T23:14:31.7664818Z",
    "outputs": [
      {
        "onError": "StopProcessingJob",
        "relativePriority": "Normal",
        "preset": {
          "@odata.type": "#Microsoft.Media.BuiltInStandardEncoderPreset",
          "presetName": "AdaptiveStreaming"
        }
      }
    ]
  },
  "systemData": {
    "createdBy": "contoso@microsoft.com",
    "createdByType": "User",
    "createdAt": "2022-10-17T23:14:31.7664818Z",
    "lastModifiedBy": "contoso@microsoft.com",
    "lastModifiedByType": "User",
    "lastModifiedAt": "2022-10-17T23:14:31.7664818Z"
  }
}

状态代码:: 200

{
  "name": "createdTransform",
  "id": "/subscriptions/00000000-0000-0000-0000-000000000000/resourceGroups/contosoresources/providers/Microsoft.Media/mediaservices/contosomedia/transforms/createdTransform",
  "type": "Microsoft.Media/mediaservices/transforms",
  "properties": {
    "created": "2022-10-17T23:14:31.7664818Z",
    "description": "Example Transform to illustrate create and update.",
    "lastModified": "2022-10-17T23:14:31.7664818Z",
    "outputs": [
      {
        "onError": "StopProcessingJob",
        "relativePriority": "Normal",
        "preset": {
          "@odata.type": "#Microsoft.Media.BuiltInStandardEncoderPreset",
          "presetName": "AdaptiveStreaming"
        }
      }
    ]
  },
  "systemData": {
    "createdBy": "contoso@microsoft.com",
    "createdByType": "User",
    "createdAt": "2022-10-17T23:14:31.7664818Z",
    "lastModifiedBy": "contoso@microsoft.com",
    "lastModifiedByType": "User",
    "lastModifiedAt": "2022-10-17T23:14:31.7664818Z"
  }
}

定义

名称	说明
AacAudio	介绍高级音频编解码器 (AAC) 音频编码设置。
AacAudioProfile	使用 AAC 编码音频时要使用的编码配置文件。
AnalysisResolution	指定分析视频时的最大分辨率。默认行为为“SourceResolution”，它将在分析时将输入视频保持其原始分辨率。使用“StandardDefinition”会将输入视频的大小调整为标准定义，同时保留适当的纵横比。仅当视频分辨率更高时，它才会调整大小。例如，在处理之前，1920x1080 输入将缩放为 640x360。切换到“StandardDefinition”将减少处理高分辨率视频所需的时间。它还可以降低使用此组件的成本， (https://azure.microsoft.com/en-us/pricing/details/media-services/#analytics 有关详细信息) 。但是，可能无法检测到在调整大小后的视频中最终太小的人脸。
Audio	定义所有音频编解码器的通用属性。
AudioAnalysisMode	确定要执行的音频分析操作集。如果未指定，将选择标准 AudioAnalysisMode。
AudioAnalyzerPreset	音频分析器预设应用一组预定义的基于 AI 的分析操作，包括语音听录。目前，该预设支持处理单个音轨的内容。
AudioOverlay	描述音频覆盖的属性。
BlurType	模糊类型
BuiltInStandardEncoderPreset	介绍使用标准编码器对输入视频进行编码的内置预设。
Complexity	可用于配置编码器设置，以控制速度和质量之间的平衡。示例：将“复杂性”设置为“速度”，以加快编码速度，但降低压缩效率。
CopyAudio	一个编解码器标志，指示编码器复制输入音频比特流。
CopyVideo	一个编解码器标志，指示编码器在不重新编码的情况下复制输入视频比特流。
createdByType	创建资源的标识类型。
DDAudio	介绍杜比数字音频编解码器 (AC3) 音频编码设置。 Dolby 数字音频支持的当前实现是：音频通道编号为 1 ( (单声道) ,2 (立体声) ,6 (5.1 侧) ;音频采样频率速率：32K/44.1K/48K Hz;AC3 规范支持的音频比特率值：32000、40000、48000、56000、64000、80000、 96000、112000、128000、160000、192000、224000、256000、320000、384000、448000、512000、576000、640000 bps。
Deinterlace	描述反交错设置。
DeinterlaceMode	去隔行模式。默认为 AutoPixelAdaptive。
DeinterlaceParity	反交错的字段奇偶校验，默认为“自动”。
EncoderNamedPreset	用于编码视频的内置预设。
EntropyMode	要用于此层的熵模式。如果未指定，编码器将选择适合配置文件和级别的模式。
ErrorAdditionalInfo	资源管理错误附加信息。
ErrorDetail	错误详细信息。
ErrorResponse	错误响应
FaceDetectorPreset	描述分析视频时要使用的所有设置，以便检测 (并选择性地编辑) 存在的所有人脸。
FaceRedactorMode	此模式提供在以下设置之间进行选择的功能：1) 分析 - 仅用于检测。此模式生成一个元数据 JSON 文件，用于标记整个视频中人脸的外观。如果可能，为同一人的外观分配相同的 ID。2) 合并 - 此外， (模糊) 检测到的人脸。 3) 修订 - 这可实现 2 次传递过程，允许对检测到的一部分人脸进行选择性编辑。它从以前的分析阶段获取元数据文件，以及源视频，以及用户选择的需要编修的 ID 子集。
Fade	描述应用于输入媒体的淡化效果的属性。
Filters	描述在编码之前应用于输入媒体的所有筛选操作，例如去交错、旋转等。
H264Complexity	告知编码器如何选择其编码设置。默认值为 Balanced。
H264Layer	介绍在使用 H.264 视频编解码器将输入视频编码为所需输出比特率层时要使用的设置。
H264RateControlMode	视频速率控制模式
H264Video	介绍使用 H.264 编解码器对视频进行编码的所有属性。
H264VideoProfile	我们目前支持 Baseline、Main、High、High422、High444。默认值为“自动”。
H265Complexity	告知编码器如何选择其编码设置。质量将提供更高的压缩率，但成本更高，计算时间更长。速度将生成一个相对较大的文件，但速度更快、更经济。默认值为“平衡”。
H265Layer	描述在使用 H.265 视频编解码器将输入视频编码为所需输出比特率层时要使用的设置。
H265Video	描述使用 H.265 编解码器对视频进行编码的所有属性。
H265VideoProfile	我们目前支持 Main。默认值为“自动”。
Image	介绍用于从输入视频生成缩略图的基本属性
ImageFormat	描述输出图像文件的属性。
InsightsType	定义希望服务生成的见解类型。允许的值为“AudioInsightsOnly”、“VideoInsightsOnly”和“AllInsights”。默认值为 AllInsights。如果将此项设置为 AllInsights，并且输入仅为音频，则仅生成音频见解。同样，如果输入仅视频，则仅生成视频见解。如果你希望某些输入仅使用视频，建议不要使用 AudioInsightsOnly;或者，如果你希望某些输入仅是音频，请使用 VideoInsightsOnly。在这种情况下，作业将出错。
InterleaveOutput	设置输出的交错模式，以控制以容器格式存储音频和视频的方式。示例：将 InterleavedOutput 设置为 NonInterleavedOutput，以在单独的 MP4 文件中生成仅限音频和仅视频的输出。
JpgFormat	描述用于生成 JPEG 缩略图的设置。
JpgImage	介绍用于从输入视频生成一系列 JPEG 图像的属性。
JpgLayer	描述用于从输入视频生成 JPEG 图像的设置。
Mp4Format	描述输出 ISO MP4 文件的属性。
MultiBitrateFormat	介绍用于生成 GOP 对齐多比特率文件集合的属性。默认行为是为每个视频层生成一个输出文件，该文件与所有音频一起复用。可以通过指定 outputFiles 集合来控制生成的确切输出文件。
OnErrorType	转换可以定义多个输出。此属性定义当一个输出失败时服务应执行的操作 - 继续生成其他输出，或者停止其他输出。总体作业状态不会反映使用“ContinueJob”指定的输出失败。默认值为“StopProcessingJob”。
OutputFile	表示生成的输出文件。
PngFormat	介绍用于生成 PNG 缩略图的设置。
PngImage	介绍用于从输入视频生成一系列 PNG 图像的属性。
PngLayer	描述用于从输入视频生成 PNG 图像的设置。
PresetConfigurations	编码器的可选配置设置的对象。
Priority	设置转换中 TransformOutputs 的相对优先级。这将设置服务用于处理 TransformOutput 的优先级。默认优先级为 Normal。
Rectangle	描述在处理输入媒体之前应用于输入媒体的矩形窗口的属性。
Rotation	在对输入视频进行编码之前，要应用于输入视频的旋转（如果有）。默认值为 Auto
StandardEncoderPreset	介绍在使用标准编码器对输入视频进行编码时要使用的所有设置。
StretchMode	调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 (s) 。默认值为 AutoSize
systemData	与资源的创建和上次修改相关的元数据。
Transform	转换封装用于从输入媒体生成所需输出的规则或指令，例如通过转码或提取见解。创建转换后，可以通过创建作业将其应用于输入媒体。
TransformOutput	描述 TransformOutput 的属性，这些属性是在生成所需输出时要应用的规则。
TransportStreamFormat	介绍用于生成 MPEG-2 传输流的属性 (ISO/IEC 13818-1) 输出视频文件 () 。
Video	介绍用于编码输入视频的基本属性。
VideoAnalyzerPreset	视频分析器预设，用于从音频和视频中提取见解 (丰富的元数据) ，并输出 JSON 格式化文件。
VideoOverlay	描述视频覆盖的属性。
VideoSyncMode	视频同步模式

AacAudio

介绍高级音频编解码器 (AAC) 音频编码设置。

名称	类型	说明
@odata.type	string: #Microsoft.Media.AacAudio	派生类型的鉴别器。
bitrate	integer	输出编码音频的比特率（以比特/秒为单位）。
channels	integer	音频中的通道数。
label	string	编解码器的可选标签。标签可用于控制复用行为。
profile	AacAudioProfile	使用 AAC 对音频进行编码时要使用的编码配置文件。
samplingRate	integer	用于编码的采样率（以赫茨为单位）。

AacAudioProfile

使用 AAC 编码音频时要使用的编码配置文件。

名称	类型	说明
AacLc	string	指定将输出音频编码为 AAC 低复杂度配置文件 (AAC-LC) 。
HeAacV1	string	指定输出音频将编码为 HE-AAC v1 配置文件。
HeAacV2	string	指定输出音频将编码为 HE-AAC v2 配置文件。

AnalysisResolution

指定分析视频时的最大分辨率。默认行为为“SourceResolution”，它将在分析时将输入视频保持其原始分辨率。使用“StandardDefinition”会将输入视频的大小调整为标准定义，同时保留适当的纵横比。仅当视频分辨率更高时，它才会调整大小。例如，在处理之前，1920x1080 输入将缩放为 640x360。切换到“StandardDefinition”将减少处理高分辨率视频所需的时间。它还可以降低使用此组件的成本， (https://azure.microsoft.com/en-us/pricing/details/media-services/#analytics 有关详细信息) 。但是，可能无法检测到在调整大小后的视频中最终太小的人脸。

名称	类型	说明
SourceResolution	string
StandardDefinition	string

Audio

定义所有音频编解码器的通用属性。

名称	类型	说明
@odata.type	string: #Microsoft.Media.Audio	派生类型的鉴别器。
bitrate	integer	输出编码音频的比特率（以位/秒为单位）。
channels	integer	音频中的声道数。
label	string	编解码器的可选标签。标签可用于控制复用行为。
samplingRate	integer	用于以赫为单位编码的采样率。

AudioAnalysisMode

确定要执行的音频分析操作集。如果未指定，将选择标准 AudioAnalysisMode。

名称	类型	说明
Basic	string	此模式执行语音转文本听录并生成 VTT 字幕文件。此模式的输出包括一个见解 JSON 文件，该文件仅包含关键字、听录和计时信息。此模式不包括自动语言检测和说话人分割聚类。
Standard	string	执行基本模式中包含的所有操作，此外还执行语言检测和说话人分割。

AudioAnalyzerPreset

音频分析器预设应用一组预定义的基于 AI 的分析操作，包括语音听录。目前，该预设支持处理单个音轨的内容。

名称	类型	说明
@odata.type	string: #Microsoft.Media.AudioAnalyzerPreset	派生类型的鉴别器。
audioLanguage	string	使用“语言标记区域”的 BCP-47 格式的输入中的音频有效负载的语言 (例如：“en-US”) 。如果你知道内容的语言，建议你指定它。必须为 AudioAnalysisMode：：Basic 显式指定语言，因为自动语言检测不包括在基本模式下。如果未指定语言或将语言设置为 null，自动语言检测将选择检测到的第一种语言并使用所选语言处理整个文件。它目前不支持在检测到第一种语言后在各语言之间进行动态切换。自动检测最适用于具有清晰可辨识语音的录音。如果自动检测找不到该语言，则听录将回退到'en-US'。”此处提供了支持的语言列表： https://go.microsoft.com/fwlink/?linkid=2109463
experimentalOptions	object	包含未在预设本身中公开的参数的键值对的字典
mode	AudioAnalysisMode	确定要执行的音频分析操作集。如果未指定，将选择标准 AudioAnalysisMode。

AudioOverlay

描述音频覆盖的属性。

名称	类型	说明
@odata.type	string: #Microsoft.Media.AudioOverlay	派生类型的鉴别器。
audioGainLevel	number	覆盖中音频的增益级别。该值应位于 [0， 1.0] 范围内。默认值为 1.0。
end	string	结束位置（引用了覆盖结束处的输入视频）。该值应采用 ISO 8601 格式。例如，PT30S 在输入视频的 30 秒处结束覆盖。如果未指定或该值大于输入视频持续时间，则覆盖媒体持续时间大于输入视频持续时间时，将应用覆盖，直到输入视频结束，否则覆盖将持续到覆盖媒体持续时间。
fadeInDuration	string	覆盖淡入输入视频的持续时间。该值应采用 ISO 8601 持续时间格式。如果未指定，则默认行为是无淡入 (与 PT0S) 相同。
fadeOutDuration	string	覆盖淡出输入视频的持续时间。该值应采用 ISO 8601 持续时间格式。如果未指定，则默认行为是没有淡出 (与 PT0S) 相同。
inputLabel	string	要用作覆盖的作业输入的标签。输入必须指定一个文件。可以指定 JPG、PNG、GIF 或 BMP 格式的图像文件，或者指定音频文件（如 WAV、MP3、WMA 或 M4A 文件）或视频文件。有关支持的音频和视频文件格式的完整列表，请参阅 https://aka.ms/mesformats 。
start	string	开始位置（引用了覆盖层开始的输入视频）。该值应采用 ISO 8601 格式。例如，PT05S 在 5 秒处开始覆盖输入视频。如果未指定，覆盖层将从输入视频的开头开始。

BlurType

模糊类型

名称	类型	说明
Black	string	黑色：黑掉筛选器
Box	string	框：调试筛选器，仅限边界框
High	string	高：混淆模糊筛选器
Low	string	低：盒车模糊筛选器
Med	string	Med：高斯模糊筛选器

BuiltInStandardEncoderPreset

介绍使用标准编码器对输入视频进行编码的内置预设。

名称	类型	说明
@odata.type	string: #Microsoft.Media.BuiltInStandardEncoderPreset	派生类型的鉴别器。
configurations	PresetConfigurations	编码器的可选配置设置。仅 ContentAwareEncoding 和 H265ContentAwareEncoding BuiltInStandardEncoderPreset 支持配置。
presetName	EncoderNamedPreset	用于编码视频的内置预设。

Complexity

可用于配置编码器设置，以控制速度和质量之间的平衡。示例：将“复杂性”设置为“速度”，以加快编码速度，但降低压缩效率。

名称	类型	说明
Balanced	string	将编码器配置为使用在速度和质量之间实现平衡的设置。
Quality	string	将编码器配置为使用经过优化的设置，以生成更高质量的输出，但代价是总体编码时间变慢。
Speed	string	将编码器配置为使用为加快编码速度而优化的设置。为了缩短编码时间，会牺牲质量。

CopyAudio

一个编解码器标志，指示编码器复制输入音频比特流。

名称	类型	说明
@odata.type	string: #Microsoft.Media.CopyAudio	派生类型的鉴别器。
label	string	编解码器的可选标签。标签可用于控制复用行为。

CopyVideo

一个编解码器标志，指示编码器在不重新编码的情况下复制输入视频比特流。

名称	类型	说明
@odata.type	string: #Microsoft.Media.CopyVideo	派生类型的鉴别器。
label	string	编解码器的可选标签。标签可用于控制复用行为。

createdByType

创建资源的标识类型。

名称	类型	说明
Application	string
Key	string
ManagedIdentity	string
User	string

DDAudio

介绍杜比数字音频编解码器 (AC3) 音频编码设置。 Dolby 数字音频支持的当前实现是：音频通道编号为 1 ( (单声道) ,2 (立体声) ,6 (5.1 侧) ;音频采样频率速率：32K/44.1K/48K Hz;AC3 规范支持的音频比特率值：32000、40000、48000、56000、64000、80000、 96000、112000、128000、160000、192000、224000、256000、320000、384000、448000、512000、576000、640000 bps。

名称	类型	说明
@odata.type	string: #Microsoft.Media.DDAudio	派生类型的鉴别器。
bitrate	integer	输出编码音频的比特率（以比特/秒为单位）。
channels	integer	音频中的通道数。
label	string	编解码器的可选标签。标签可用于控制复用行为。
samplingRate	integer	用于编码的采样率（以赫茨为单位）。

Deinterlace

描述反交错设置。

名称	类型	说明
mode	DeinterlaceMode	去交错模式。默认为 AutoPixelAdaptive。
parity	DeinterlaceParity	用于去交错的字段奇偶校验，默认为“自动”。

DeinterlaceMode

去隔行模式。默认为 AutoPixelAdaptive。

名称	类型	说明
AutoPixelAdaptive	string	对输入视频中的每个帧应用自动像素自适应反交错。
Off	string	禁用源视频的反交错。

DeinterlaceParity

反交错的字段奇偶校验，默认为“自动”。

名称	类型	说明
Auto	string	自动检测字段的顺序
BottomFieldFirst	string	应用底部字段第一个处理输入视频。
TopFieldFirst	string	应用顶部字段第一处理输入视频。

EncoderNamedPreset

用于编码视频的内置预设。

名称	类型	说明
AACGoodQualityAudio	string	生成仅包含以 192 kbps 编码的 AAC 立体声音频的单个 MP4 文件。
AdaptiveStreaming	string	使用 H.264 视频和立体声 AAC 音频生成一组 GOP 对齐的 MP4 文件。根据输入分辨率、比特率和帧速率自动生成比特率阶梯。自动生成的预设始终不会超过输入分辨率。例如，如果输入为 720p，则输出将最高保持 720p。
ContentAwareEncoding	string	使用内容感知编码生成一组符合 GOP 标准的 MP4。在提供任何输入内容的情况下，服务将对输入内容执行初始的轻量分析，并使用结果来确定最佳层数，以及自适应流式处理适合传送的比特率和分辨率设置。此预设对于中低复杂度的视频特别有效，这些视频的输出文件的比特率将会较低，但质量仍可为观看者带来良好体验。输出将包含带有交错式视频和音频的 MP4 文件。
ContentAwareEncodingExperimental	string	公开内容感知编码的实验预设。在提供任何输入内容的情况下，服务将尝试自动确定最佳层数，以及自适应流式处理适合使用的比特率和分辨率设置。底层算法将不断演进。输出将包含带有交错式视频和音频的 MP4 文件。
CopyAllBitrateNonInterleaved	string	将输入资产中的所有视频和音频流复制为非交错视频和音频输出文件。此预设可用于剪辑现有资产，或将一组关键帧 (GOP) 对齐的 MP4 文件转换为可流式传输的资产。
DDGoodQualityAudio	string	生成仅包含 DD (Digital Dolby) 以 192 kbps 编码的立体声音频的单个 MP4 文件。
H264MultipleBitrate1080p	string	生成一组 8 GOP 对齐的 MP4 文件（范围从 6000 kbps 到 400 kbps）和立体声 AAC 音频。分辨率从 1080p 开始，下降到 180p。
H264MultipleBitrate720p	string	生成一组 6 GOP 对齐的 MP4 文件（范围从 3400 kbps 到 400 kbps）和立体声 AAC 音频。分辨率从 720p 开始，下降到 180p。
H264MultipleBitrateSD	string	生成一组 5 GOP 对齐的 MP4 文件（范围从 1900kbps 到 400 kbps）和立体声 AAC 音频。分辨率从 480p 开始，下降到 240p。
H264SingleBitrate1080p	string	生成 MP4 文件，其中视频以 6750 kbps 的 H.264 编解码器编码，图片高度为 1080 像素，立体声音频以 128 kbps 的 AAC-LC 编解码器进行编码。
H264SingleBitrate720p	string	生成 MP4 文件，其中视频以 4500 kbps 的 H.264 编解码器编码，图片高度为 720 像素，立体声音频使用 AAC-LC 编解码器以 128 kbps 编码。
H264SingleBitrateSD	string	生成 MP4 文件，其中视频以 2200 kbps 的 H.264 编解码器编码，图片高度为 480 像素，立体声音频使用 AAC-LC 编解码器以 128 kbps 编码。
H265AdaptiveStreaming	string	生成一组符合 GOP 的 MP4 文件，其中包含 H.265 视频和立体声 AAC 音频。根据输入分辨率、比特率和帧速率自动生成比特率阶梯。自动生成的预设始终不会超过输入分辨率。例如，如果输入为 720p，则输出将最高保持 720p。
H265ContentAwareEncoding	string	使用内容感知编码生成一组符合 GOP 标准的 MP4。在提供任何输入内容的情况下，服务将对输入内容执行初始的轻量分析，并使用结果来确定最佳层数，以及自适应流式处理适合传送的比特率和分辨率设置。此预设对于中低复杂度的视频特别有效，这些视频的输出文件的比特率将会较低，但质量仍可为观看者带来良好体验。输出将包含带有交错式视频和音频的 MP4 文件。
H265SingleBitrate1080p	string	生成 MP4 文件，其中视频以 3500 kbps 的 H.265 编解码器编码，图片高度为 1080 像素，立体声音频以 128 kbps 的 AAC-LC 编解码器进行编码。
H265SingleBitrate4K	string	生成 MP4 文件，其中视频以 9500 kbps 的 H.265 编解码器编码，图片高度为 2160 像素，立体声音频使用 AAC-LC 编解码器以 128 kbps 编码。
H265SingleBitrate720p	string	生成 MP4 文件，其中视频以 1800 kbps 的 H.265 编解码器编码，图片高度为 720 像素，立体声音频使用 AAC-LC 编解码器以 128 kbps 编码。

EntropyMode

要用于此层的熵模式。如果未指定，编码器将选择适合配置文件和级别的模式。

名称	类型	说明
Cabac	string	上下文自适应二进制算术编码器 (CABAC) 熵编码。
Cavlc	string	上下文自适应可变长度编码器 (CAVLC) 熵编码。

ErrorAdditionalInfo

资源管理错误附加信息。

名称	类型	说明
info	object	其他信息。
type	string	其他信息类型。

ErrorDetail

错误详细信息。

名称	类型	说明
additionalInfo	ErrorAdditionalInfo[]	错误附加信息。
code	string	错误代码。
details	ErrorDetail[]	错误详细信息。
message	string	错误消息。
target	string	错误目标。

ErrorResponse

错误响应

名称	类型	说明
error	ErrorDetail	错误对象。

FaceDetectorPreset

描述分析视频时要使用的所有设置，以便检测 (并选择性地编辑) 存在的所有人脸。

名称	类型	说明
@odata.type	string: #Microsoft.Media.FaceDetectorPreset	派生类型的鉴别器。
blurType	BlurType	模糊类型
experimentalOptions	object	包含未在预设本身中公开的参数的键值对的字典
mode	FaceRedactorMode	此模式提供在以下设置之间进行选择的功能：1) 分析 - 仅用于检测。此模式生成一个元数据 JSON 文件，用于标记整个视频中人脸的外观。如果可能，为同一人的外观分配相同的 ID。2) 合并 - 此外， (模糊) 检测到的人脸。 3) 修订 - 这可实现 2 次传递过程，允许对检测到的一部分人脸进行选择性编辑。它从以前的分析阶段获取元数据文件，以及源视频，以及用户选择的需要编修的 ID 子集。
resolution	AnalysisResolution	指定分析视频时的最大分辨率。默认行为为“SourceResolution”，它将在分析时将输入视频保持其原始分辨率。使用“StandardDefinition”会将输入视频的大小调整为标准定义，同时保留适当的纵横比。仅当视频分辨率更高时，它才会调整大小。例如，在处理之前，1920x1080 输入将缩放为 640x360。切换到“StandardDefinition”将减少处理高分辨率视频所需的时间。它还可以降低使用此组件的成本， (https://azure.microsoft.com/en-us/pricing/details/media-services/#analytics 有关详细信息) 。但是，可能无法检测到在调整大小后的视频中最终太小的人脸。

FaceRedactorMode

此模式提供在以下设置之间进行选择的功能：1) 分析 - 仅用于检测。此模式生成一个元数据 JSON 文件，用于标记整个视频中人脸的外观。如果可能，为同一人的外观分配相同的 ID。2) 合并 - 此外， (模糊) 检测到的人脸。 3) 修订 - 这可实现 2 次传递过程，允许对检测到的一部分人脸进行选择性编辑。它从以前的分析阶段获取元数据文件，以及源视频，以及用户选择的需要编修的 ID 子集。

名称	类型	说明
Analyze	string	分析模式检测人脸并输出包含结果的元数据文件。允许在人脸使用“修订”模式模糊之前编辑元数据文件。
Combined	string	当不需要编辑已分析的人脸时，组合模式会一次性执行分析和修订步骤。
Redact	string	修订模式使用分析模式下的元数据文件，并编修找到的人脸。

Fade

描述应用于输入媒体的淡化效果的属性。

名称	类型	说明
duration	string	视频中淡出效果的持续时间。该值可以采用 ISO 8601 格式 (例如，PT05S 表示在) 5 秒内淡入/淡出颜色，或帧计数 (例如，10 表示从开始时间) 淡出 10 帧，或相对于流持续时间 (的相对值例如，10% 表示淡出 10% 的流持续时间)
fadeColor	string	淡入/淡出的颜色。它可以位于 CSS Level1 颜色 https://developer.mozilla.org/en-US/docs/Web/CSS/color_value/color_keywords 或 RGB/十六进制值上：例如：rgb (255,0,0) 、0xFF0000 或 #FF0000
start	string	输入视频中开始淡出的位置。该值可以是 ISO 8601 格式（例如，PT05S 表示在 5 秒处开始），可以是帧计数（例如，10 表示在第 10 帧处开始），也可以是流持续时间的相对值（例如，10% 表示在流持续时间的 10% 处开始）。默认值为 0

Filters

描述在编码之前应用于输入媒体的所有筛选操作，例如去交错、旋转等。

名称	类型	说明
crop	Rectangle	用于裁剪输入视频的矩形窗口的参数。
deinterlace	Deinterlace	反交错设置。
fadeIn	Fade	描述应用于输入媒体的淡化效果的属性。
fadeOut	Fade	描述应用于输入媒体的淡化效果的属性。
overlays	Overlay[]: AudioOverlay[] VideoOverlay[]	要应用于输入视频的覆盖的属性。这些可以是音频、图像或视频覆盖。
rotation	Rotation	在对输入视频进行编码之前，要应用于输入视频的旋转（如果有）。默认值为 Auto

H264Complexity

告知编码器如何选择其编码设置。默认值为 Balanced。

名称	类型	说明
Balanced	string	告知编码器使用在速度和质量之间实现平衡的设置。
Quality	string	告知编码器使用经过优化的设置，以生成更高质量的输出，但代价是总体编码时间变慢。
Speed	string	告知编码器使用经过优化以加快编码速度的设置。为了缩短编码时间，会牺牲质量。

H264Layer

介绍在使用 H.264 视频编解码器将输入视频编码为所需输出比特率层时要使用的设置。

名称	类型	说明
adaptiveBFrame	boolean	编码此层时是否要使用自适应 B 帧。如果未指定，则只要视频配置文件允许使用，编码器就会将其打开。
bFrames	integer	编码此层时要使用的 B 帧数。如果未指定，编码器将根据视频配置文件和级别选择适当的数字。
bitrate	integer	生成此层时对输入视频进行编码的平均比特率（以位/秒为单位）。这是必填字段。
bufferWindow	string	VBV 缓冲区窗口长度。该值应采用 ISO 8601 格式。该值应在 [0.1-100] 秒范围内。默认值为 5 秒， (例如 PT5S) 。
crf	number	编码此层时要使用的 CRF 值。在 CRF 模式下设置视频编解码器的 RateControlMode 时，此设置生效。 CRF 值的范围在 0 到 51 之间，其中值越低，质量越好，代价是文件大小越大。值越高意味着压缩越多，但在某些时候会注意到质量下降。默认值为 23。
entropyMode	EntropyMode	要用于此层的熵模式。如果未指定，编码器将选择适合配置文件和级别的模式。
frameRate	string	对此层进行编码) 帧速率 (以帧/秒为单位。该值可以是 M/N 的形式，其中 M 和 N 是整数 (例如，30000/1001) ，或者采用数字 (例如，30 或 29.97) 。编码器根据配置文件和级别对允许的帧速率强制实施约束。如果未指定，编码器将使用与输入视频相同的帧速率。
height	string	此层的输出视频的高度。该值可以是绝对 (（以像素) 为单位），也可以是相对 (（以百分比) 为单位）。例如，50% 表示输出视频的高度是输入像素的一半。
label	string	此层的字母数字标签，可用于多路复用不同的视频和音频层，或命名输出文件。
level	string	我们目前支持高达 6.2 的级别。该值可以是 Auto，也可以是与 H.264 配置文件匹配的数字。如果未指定，则默认值为“自动”，它允许编码器选择适合此层的级别。
maxBitrate	integer	最大比特率 (（以位/秒为单位）) ，此时应假定 VBV 缓冲区重新填充。如果未指定，则默认为与比特率相同的值。
profile	H264VideoProfile	我们目前支持 Baseline、Main、High、High422、High444。默认值为“自动”。
referenceFrames	integer	编码此层时要使用的参考帧数。如果未指定，编码器将根据编码器复杂性设置确定适当的数字。
slices	integer	编码此层时要使用的切片数。如果未指定，则默认值为零，这意味着编码器将为每个帧使用单个切片。
width	string	此层的输出视频的宽度。该值可以是绝对 (（以像素) 为单位），也可以是相对 (（以百分比) 为单位）。例如，50% 表示输出视频的像素宽度是输入的一半。

H264RateControlMode

视频速率控制模式

名称	类型	说明
ABR	string	命中目标比特率 (ABR) 模式的平均比特率：默认模式。
CBR	string	固定比特率 (CBR) 模式，该模式围绕目标比特率收紧比特率变化。
CRF	string	恒定速率因子 (以恒定主观质量为目标的 CRF) 模式。

H264Video

介绍使用 H.264 编解码器对视频进行编码的所有属性。

名称	类型	说明
@odata.type	string: #Microsoft.Media.H264Video	派生类型的鉴别器。
complexity	H264Complexity	告知编码器如何选择其编码设置。默认值为“平衡”。
keyFrameInterval	string	两个关键帧之间的距离。该值应为以 ISO 8601 格式指定的 [0.5， 20] 秒范围内的非零。默认值为 PT2S) (2 秒。请注意，如果设置了 VideoSyncMode.Passthrough，则忽略此设置，其中 KeyFrameInterval 值将遵循输入源设置。
label	string	编解码器的可选标签。标签可用于控制复用行为。
layers	H264Layer[]	要由编码器生成的输出 H.264 层的集合。
rateControlMode	H264RateControlMode	视频速率控制模式
sceneChangeDetection	boolean	编码器是否应在场景更改时插入关键帧。如果未指定，则默认值为 false。仅当编码器配置为生成单个输出视频时，才应将此标志设置为 true。
stretchMode	StretchMode	调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 (s) 。默认值为 AutoSize
syncMode	VideoSyncMode	视频同步模式

H264VideoProfile

我们目前支持 Baseline、Main、High、High422、High444。默认值为“自动”。

名称	类型	说明
Auto	string	告知编码器自动确定适当的 H.264 配置文件。
Baseline	string	基线配置文件
High	string	高调。
High422	string	高 4：2：2 配置文件。
High444	string	高 4：4：4 预测配置文件。
Main	string	主配置文件

H265Complexity

告知编码器如何选择其编码设置。质量将提供更高的压缩率，但成本更高，计算时间更长。速度将生成一个相对较大的文件，但速度更快、更经济。默认值为“平衡”。

名称	类型	说明
Balanced	string	告知编码器使用在速度和质量之间实现平衡的设置。
Quality	string	告知编码器使用经过优化的设置，以生成更高质量的输出，但代价是总体编码时间变慢。
Speed	string	告知编码器使用经过优化以加快编码速度的设置。为了缩短编码时间，会牺牲质量。

H265Layer

描述在使用 H.265 视频编解码器将输入视频编码为所需输出比特率层时要使用的设置。

名称	类型	说明
adaptiveBFrame	boolean	指定编码此层时是否使用自适应 B 帧。如果未指定，则只要视频配置文件允许使用，编码器就会将其打开。
bFrames	integer	编码此层时要使用的 B 帧数。如果未指定，编码器将根据视频配置文件和级别选择适当的数字。
bitrate	integer	生成此层时对输入视频进行编码的平均比特率（以位/秒为单位）。例如：目标比特率为 3000Kbps 或 3Mbps 意味着此值应为 3000000 这是必填字段。
bufferWindow	string	VBV 缓冲区窗口长度。该值应采用 ISO 8601 格式。该值应在 [0.1-100] 秒范围内。默认值为 5 秒， (例如 PT5S) 。
crf	number	编码此层时要使用的 CRF 值。在 CRF 模式下设置视频编解码器的 RateControlMode 时，此设置生效。 CRF 值的范围在 0 到 51 之间，其中值越低，质量越好，代价是文件大小越大。值越高意味着压缩越多，但在某些时候会注意到质量下降。默认值为 28。
frameRate	string	对此层进行编码) 帧速率 (以帧/秒为单位。该值可以是 M/N 的形式，其中 M 和 N 是整数 (例如，30000/1001) ，或者采用数字 (例如，30 或 29.97) 。编码器根据配置文件和级别对允许的帧速率强制实施约束。如果未指定，编码器将使用与输入视频相同的帧速率。
height	string	此层的输出视频的高度。该值可以是绝对 (（以像素) 为单位），也可以是相对 (（以百分比) 为单位）。例如，50% 表示输出视频的高度是输入像素的一半。
label	string	此层的字母数字标签，可用于多路复用不同的视频和音频层，或命名输出文件。
level	string	我们目前支持高达 6.2 的级别。该值可以是 Auto，也可以是与 H.265 配置文件匹配的数字。如果未指定，则默认值为“自动”，它允许编码器选择适合此层的级别。
maxBitrate	integer	最大比特率 (（以位/秒为单位）) ，此时应假定 VBV 缓冲区重新填充。如果未指定，则默认为与比特率相同的值。
profile	H265VideoProfile	我们目前支持 Main。默认值为“自动”。
referenceFrames	integer	编码此层时要使用的参考帧数。如果未指定，编码器将根据编码器复杂性设置确定适当的数字。
slices	integer	编码此层时要使用的切片数。如果未指定，则默认值为零，这意味着编码器将为每个帧使用单个切片。
width	string	此层的输出视频的宽度。该值可以是绝对 (（以像素) 为单位），也可以是相对 (（以百分比) 为单位）。例如，50% 表示输出视频的像素宽度是输入的一半。

H265Video

描述使用 H.265 编解码器对视频进行编码的所有属性。

名称	类型	说明
@odata.type	string: #Microsoft.Media.H265Video	派生类型的鉴别器。
complexity	H265Complexity	告知编码器如何选择其编码设置。质量将提供更高的压缩率，但成本更高，计算时间更长。速度将生成一个相对较大的文件，但速度更快且更经济。默认值为 Balanced。
keyFrameInterval	string	两个关键帧之间的距离。该值应在以 ISO 8601 格式指定的 [0.5， 20] 秒范围内为非零。 PT2S) (默认值为 2 秒。请注意，如果设置了 VideoSyncMode.Passthrough，则忽略此设置，其中 KeyFrameInterval 值将跟随输入源设置。
label	string	编解码器的可选标签。标签可用于控制复用行为。
layers	H265Layer[]	编码器要生成的输出 H.265 层的集合。
sceneChangeDetection	boolean	指定编码器是否应在场景更改时插入关键帧。如果未指定，则默认值为 false。仅当编码器配置为生成单个输出视频时，才应将此标志设置为 true。
stretchMode	StretchMode	调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 () 。默认值为 AutoSize
syncMode	VideoSyncMode	视频同步模式

H265VideoProfile

我们目前支持 Main。默认值为“自动”。

名称	类型	说明
Auto	string	告知编码器自动确定相应的 H.265 配置文件。
Main	string	主配置文件 (https://x265.readthedocs.io/en/default/cli.html?highlight=profile#profile-level-tier)
Main10	string	主 10 配置文件 (https://en.wikipedia.org/wiki/High_Efficiency_Video_Coding#Main_10)

Image

介绍用于从输入视频生成缩略图的基本属性

名称	类型	说明
@odata.type	string: #Microsoft.Media.Image	派生类型的鉴别器。
keyFrameInterval	string	两个关键帧之间的距离。该值应为以 ISO 8601 格式指定的 [0.5， 20] 秒范围内的非零。默认值为 PT2S) (2 秒。请注意，如果设置了 VideoSyncMode.Passthrough，则忽略此设置，其中 KeyFrameInterval 值将遵循输入源设置。
label	string	编解码器的可选标签。标签可用于控制复用行为。
range	string	相对于转换输入视频中预设开始时间的位置，该时间将停止生成缩略图。该值可以是 ISO 8601 格式（例如，PT5M30S 表示从开始时间起 5 分 30 秒停止），也可以是帧计数（例如，300 表示在开始时间帧的第 300 帧停止。如果该值为 1，则表示在开始时间处仅生成一个缩略图），或者是相对于流持续时间的相对值（例如，50% 表示从开始时间起的流持续时间的一半处停止）。默认值是 100%，这表示在流的末尾处停止。
start	string	输入视频中开始生成缩略图的位置。该值可以是 ISO 8601 格式（例如，PT05S 表示在 5 秒处开始），可以是帧计数（例如，10 表示在第 10 帧处开始），也可以是流持续时间的相对值（例如，10% 表示在流持续时间的 10% 处开始）。还支持宏 {Best}，它会指示编码器从视频的前几秒中选择最佳的缩略图，并且无论“步距”和“范围”的其他设置如何，都只会生成一个缩略图。默认值为宏 {Best}。
step	string	生成缩略图的间隔。该值可以采用 ISO 8601 格式 (例如，PT05S 表示每 5 秒) 一张图像，或者帧计数 (例如，每 30 帧) 一张图像 30，或者流持续时间 (例如，每 10% 流持续时间) 一个图像的 10%。注意：步骤值将影响第一个生成的缩略图，该缩略图可能不完全是转换预设开始时间指定的缩略图。这是由于编码器尝试选择开始时间与步骤位置之间的最佳缩略图作为第一个输出。由于默认值为 10%，这意味着如果流具有较长的持续时间，则生成的第一个缩略图可能远离在开始时间指定的缩略图。如果预计第一个缩略图接近开始时间，请尝试为 Step 选择合理的值;如果开始时间只需要一个缩略图，则尝试将 Range 值设置为 1。
stretchMode	StretchMode	调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 (s) 。默认值为 AutoSize
syncMode	VideoSyncMode	视频同步模式

ImageFormat

描述输出图像文件的属性。

名称	类型	说明
@odata.type	string: #Microsoft.Media.ImageFormat	派生类型的鉴别器。
filenamePattern	string	用于创建输出文件的文件命名模式。文件名支持以下宏：{Basename} - 将使用输入视频文件名称的扩展宏。如果输入视频文件长度小于 32 个字符) ，则不包括文件后缀 (基名称，将使用输入视频文件的基本名称。如果输入视频文件的基名称长度超过 32 个字符，则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号 (从 1) 开始。 {Bitrate} - 音频/视频比特率（以 kbps 为单位）。不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。任何未替换的宏都将折叠并从文件名中删除。

InsightsType

定义希望服务生成的见解类型。允许的值为“AudioInsightsOnly”、“VideoInsightsOnly”和“AllInsights”。默认值为 AllInsights。如果将此项设置为 AllInsights，并且输入仅为音频，则仅生成音频见解。同样，如果输入仅视频，则仅生成视频见解。如果你希望某些输入仅使用视频，建议不要使用 AudioInsightsOnly;或者，如果你希望某些输入仅是音频，请使用 VideoInsightsOnly。在这种情况下，作业将出错。

名称	类型	说明
AllInsights	string	生成音频和视频见解。如果音频或视频见解失败，则失败。
AudioInsightsOnly	string	生成仅限音频的见解。即使存在，也忽略视频。如果没有音频，则失败。
VideoInsightsOnly	string	生成仅视频见解。忽略音频（如果存在）。如果没有视频，则失败。

InterleaveOutput

设置输出的交错模式，以控制以容器格式存储音频和视频的方式。示例：将 InterleavedOutput 设置为 NonInterleavedOutput，以在单独的 MP4 文件中生成仅限音频和仅视频的输出。

名称	类型	说明
InterleavedOutput	string	输出包括音频和视频。
NonInterleavedOutput	string	输出为仅视频或仅音频。

JpgFormat

描述用于生成 JPEG 缩略图的设置。

名称	类型	说明
@odata.type	string: #Microsoft.Media.JpgFormat	派生类型的鉴别器。
filenamePattern	string	用于创建输出文件的文件命名模式。文件名支持以下宏：{Basename} - 将使用输入视频文件名称的扩展宏。如果输入视频文件长度小于 32 个字符) ，则不包括文件后缀 (基名称，将使用输入视频文件的基本名称。如果输入视频文件的基名称长度超过 32 个字符，则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号 (从 1) 开始。 {Bitrate} - 音频/视频比特率（以 kbps 为单位）。不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。任何未替换的宏都将折叠并从文件名中删除。

JpgImage

介绍用于从输入视频生成一系列 JPEG 图像的属性。

名称	类型	说明
@odata.type	string: #Microsoft.Media.JpgImage	派生类型的鉴别器。
keyFrameInterval	string	两个关键帧之间的距离。该值应为以 ISO 8601 格式指定的 [0.5， 20] 秒范围内的非零。默认值为 PT2S) (2 秒。请注意，如果设置了 VideoSyncMode.Passthrough，则忽略此设置，其中 KeyFrameInterval 值将遵循输入源设置。
label	string	编解码器的可选标签。标签可用于控制复用行为。
layers	JpgLayer[]	要由编码器生成的输出 JPEG 图像层的集合。
range	string	相对于转换输入视频中预设开始时间的位置，该时间将停止生成缩略图。该值可以是 ISO 8601 格式（例如，PT5M30S 表示从开始时间起 5 分 30 秒停止），也可以是帧计数（例如，300 表示在开始时间帧的第 300 帧停止。如果该值为 1，则表示在开始时间处仅生成一个缩略图），或者是相对于流持续时间的相对值（例如，50% 表示从开始时间起的流持续时间的一半处停止）。默认值是 100%，这表示在流的末尾处停止。
spriteColumn	integer	设置缩略图子画面图像中使用的列数。将自动计算行数，并使用子画面中每个缩略图的坐标映射生成 VTT 文件。注意：此值应为正整数，建议使用适当的值，以便输出图像分辨率不会超出 JPEG 最大像素分辨率限制 65535x65535。
start	string	输入视频中开始生成缩略图的位置。该值可以是 ISO 8601 格式（例如，PT05S 表示在 5 秒处开始），可以是帧计数（例如，10 表示在第 10 帧处开始），也可以是流持续时间的相对值（例如，10% 表示在流持续时间的 10% 处开始）。还支持宏 {Best}，它会指示编码器从视频的前几秒中选择最佳的缩略图，并且无论“步距”和“范围”的其他设置如何，都只会生成一个缩略图。默认值为宏 {Best}。
step	string	生成缩略图的间隔。该值可以采用 ISO 8601 格式 (例如，PT05S 表示每 5 秒) 一张图像，或者帧计数 (例如，每 30 帧) 一张图像 30，或者流持续时间 (例如，每 10% 流持续时间) 一个图像的 10%。注意：步骤值将影响第一个生成的缩略图，该缩略图可能不完全是转换预设开始时间指定的缩略图。这是由于编码器尝试选择开始时间与步骤位置之间的最佳缩略图作为第一个输出。由于默认值为 10%，这意味着如果流具有较长的持续时间，则生成的第一个缩略图可能远离在开始时间指定的缩略图。如果预计第一个缩略图接近开始时间，请尝试为 Step 选择合理的值;如果开始时间只需要一个缩略图，则尝试将 Range 值设置为 1。
stretchMode	StretchMode	调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 (s) 。默认值为 AutoSize
syncMode	VideoSyncMode	视频同步模式

JpgLayer

描述用于从输入视频生成 JPEG 图像的设置。

名称	类型	说明
height	string	此层的输出视频的高度。该值可以是绝对 (（以像素) 为单位），也可以是相对 (（以百分比) 为单位）。例如，50% 表示输出视频的高度是输入像素的一半。
label	string	此层的字母数字标签，可用于多路复用不同的视频和音频层，或命名输出文件。
quality	integer	JPEG 输出的压缩质量。范围为 0-100，默认值为 70。
width	string	此层的输出视频的宽度。该值可以是绝对 (（以像素) 为单位），也可以是相对 (（以百分比) 为单位）。例如，50% 表示输出视频的像素宽度是输入的一半。

Mp4Format

描述输出 ISO MP4 文件的属性。

名称	类型	说明
@odata.type	string: #Microsoft.Media.Mp4Format	派生类型的鉴别器。
filenamePattern	string	用于创建输出文件的文件命名模式。文件名支持以下宏：{Basename} - 将使用输入视频文件名称的扩展宏。如果输入视频文件长度小于 32 个字符) ，则不包括文件后缀 (基名称，将使用输入视频文件的基本名称。如果输入视频文件的基名称长度超过 32 个字符，则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号 (从 1) 开始。 {Bitrate} - 音频/视频比特率（以 kbps 为单位）。不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。任何未替换的宏都将折叠并从文件名中删除。
outputFiles	OutputFile[]	要生成的输出文件的列表。列表中的每个条目都是一组音频和视频层标签，这些标签要复用在一起。

MultiBitrateFormat

介绍用于生成 GOP 对齐多比特率文件集合的属性。默认行为是为每个视频层生成一个输出文件，该文件与所有音频一起复用。可以通过指定 outputFiles 集合来控制生成的确切输出文件。

名称	类型	说明
@odata.type	string: #Microsoft.Media.MultiBitrateFormat	派生类型的鉴别器。
filenamePattern	string	用于创建输出文件的文件命名模式。文件名支持以下宏：{Basename} - 将使用输入视频文件名称的扩展宏。如果输入视频文件长度小于 32 个字符) ，则不包括文件后缀 (基名称，将使用输入视频文件的基本名称。如果输入视频文件的基名称长度超过 32 个字符，则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号 (从 1) 开始。 {Bitrate} - 音频/视频比特率（以 kbps 为单位）。不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。任何未替换的宏都将折叠并从文件名中删除。
outputFiles	OutputFile[]	要生成的输出文件的列表。列表中的每个条目都是一组音频和视频层标签，这些标签要复用在一起。

OnErrorType

转换可以定义多个输出。此属性定义当一个输出失败时服务应执行的操作 - 继续生成其他输出，或者停止其他输出。总体作业状态不会反映使用“ContinueJob”指定的输出失败。默认值为“StopProcessingJob”。

名称	类型	说明
ContinueJob	string	告知服务，如果此 TransformOutput 失败，则允许任何其他 TransformOutput 继续。
StopProcessingJob	string	告知服务，如果此 TransformOutput 失败，则可以停止任何其他不完整的 TransformOutput。

OutputFile

表示生成的输出文件。

名称	类型	说明
labels	string[]	描述编码器如何将视频和音频多路复用到输出文件中的标签列表。例如，如果编码器正在生成两个带有标签 v1 和 v2 的视频层，以及一个带有标签 a1 的视频层，则类似“[v1， a1]”的数组会告知编码器生成一个输出文件，其中包含由 v1 表示的视频轨迹和由 a1 表示的音频轨道。

PngFormat

介绍用于生成 PNG 缩略图的设置。

名称	类型	说明
@odata.type	string: #Microsoft.Media.PngFormat	派生类型的鉴别器。
filenamePattern	string	用于创建输出文件的文件命名模式。文件名支持以下宏：{Basename} - 将使用输入视频文件名称的扩展宏。如果输入视频文件长度小于 32 个字符) ，则不包括文件后缀 (基名称，将使用输入视频文件的基本名称。如果输入视频文件的基名称长度超过 32 个字符，则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号 (从 1) 开始。 {Bitrate} - 音频/视频比特率（以 kbps 为单位）。不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。任何未替换的宏都将折叠并从文件名中删除。

PngImage

介绍用于从输入视频生成一系列 PNG 图像的属性。

名称	类型	说明
@odata.type	string: #Microsoft.Media.PngImage	派生类型的鉴别器。
keyFrameInterval	string	两个关键帧之间的距离。该值应为以 ISO 8601 格式指定的 [0.5， 20] 秒范围内的非零。默认值为 PT2S) (2 秒。请注意，如果设置了 VideoSyncMode.Passthrough，则忽略此设置，其中 KeyFrameInterval 值将遵循输入源设置。
label	string	编解码器的可选标签。标签可用于控制复用行为。
layers	PngLayer[]	要由编码器生成的输出 PNG 图像层的集合。
range	string	相对于转换输入视频中预设开始时间的位置，该时间将停止生成缩略图。该值可以是 ISO 8601 格式（例如，PT5M30S 表示从开始时间起 5 分 30 秒停止），也可以是帧计数（例如，300 表示在开始时间帧的第 300 帧停止。如果该值为 1，则表示在开始时间处仅生成一个缩略图），或者是相对于流持续时间的相对值（例如，50% 表示从开始时间起的流持续时间的一半处停止）。默认值是 100%，这表示在流的末尾处停止。
start	string	输入视频中开始生成缩略图的位置。该值可以是 ISO 8601 格式（例如，PT05S 表示在 5 秒处开始），可以是帧计数（例如，10 表示在第 10 帧处开始），也可以是流持续时间的相对值（例如，10% 表示在流持续时间的 10% 处开始）。还支持宏 {Best}，它会指示编码器从视频的前几秒中选择最佳的缩略图，并且无论“步距”和“范围”的其他设置如何，都只会生成一个缩略图。默认值为宏 {Best}。
step	string	生成缩略图的间隔。该值可以采用 ISO 8601 格式 (例如，PT05S 表示每 5 秒) 一张图像，或者帧计数 (例如，每 30 帧) 一张图像 30，或者流持续时间 (例如，每 10% 流持续时间) 一个图像的 10%。注意：步骤值将影响第一个生成的缩略图，该缩略图可能不完全是转换预设开始时间指定的缩略图。这是由于编码器尝试选择开始时间与步骤位置之间的最佳缩略图作为第一个输出。由于默认值为 10%，这意味着如果流具有较长的持续时间，则生成的第一个缩略图可能远离在开始时间指定的缩略图。如果预计第一个缩略图接近开始时间，请尝试为 Step 选择合理的值;如果开始时间只需要一个缩略图，则尝试将 Range 值设置为 1。
stretchMode	StretchMode	调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 (s) 。默认值为 AutoSize
syncMode	VideoSyncMode	视频同步模式

PngLayer

描述用于从输入视频生成 PNG 图像的设置。

名称	类型	说明
height	string	此层的输出视频的高度。该值可以是绝对 (（以像素) 为单位），也可以是相对 (（以百分比) 为单位）。例如，50% 表示输出视频的高度是输入像素的一半。
label	string	此层的字母数字标签，可用于多路复用不同的视频和音频层，或命名输出文件。
width	string	此层的输出视频的宽度。该值可以是绝对 (（以像素) 为单位），也可以是相对 (（以百分比) 为单位）。例如，50% 表示输出视频的像素宽度是输入的一半。

PresetConfigurations

编码器的可选配置设置的对象。

名称	类型	说明
complexity	Complexity	可用于配置编码器设置，以控制速度和质量之间的平衡。示例：将“复杂性”设置为“速度”，以加快编码速度，但降低压缩效率。
interleaveOutput	InterleaveOutput	设置输出的交错模式，以控制以容器格式存储音频和视频的方式。示例：将 InterleavedOutput 设置为 NonInterleavedOutput，以在单独的 MP4 文件中生成仅限音频和仅视频的输出。
keyFrameIntervalInSeconds	number	关键帧间隔（以秒为单位）。示例：将 KeyFrameIntervalInSeconds 设置为 2 以减少某些玩家的播放缓冲。
maxBitrateBps	integer	最大比特率（以位/秒为单位） (顶级视频层) 的阈值。示例：将 MaxBitrateBps 设置为 6000000，以避免为具有较高复杂性的内容生成非常高的比特率输出。
maxHeight	integer	输出视频层的最大高度。示例：将 MaxHeight 设置为 720，以生成高达 720P 的输出层，即使输入为 4K 也是如此。
maxLayers	integer	输出视频层的最大数目。示例：将 MaxLayers 设置为 4，确保最多生成 4 个输出层，以控制编码作业的总体成本。
minBitrateBps	integer	最低比特率（以位/秒为单位） (底层视频层) 的阈值。示例：将 MinBitrateBps 设置为 200000，以具有覆盖低网络带宽的用户的底层。
minHeight	integer	输出视频层的最小高度。示例：将 MinHeight 设置为 360 以避免输出层的较小分辨率（如 180P）。

Priority

设置转换中 TransformOutputs 的相对优先级。这将设置服务用于处理 TransformOutput 的优先级。默认优先级为 Normal。

名称	类型	说明
High	string	用于应优先于其他转换输出。
Low	string	用于可在正常和高优先级 TransformOutputs 之后生成的 TransformOutput。
Normal	string	用于可在普通优先级下生成的 TransformOutput。

Rectangle

描述在处理输入媒体之前应用于输入媒体的矩形窗口的属性。

名称	类型	说明
height	string	矩形区域的高度（以像素为单位）。这可以是绝对像素值 (例如 100) ，也可以是相对于视频 (大小，例如 50% ) 。
left	string	左边距的像素数。这可以是绝对像素值 (例如 100) ，也可以是相对于视频 (大小，例如 50% ) 。
top	string	上边距的像素数。这可以是绝对像素值 (例如 100) ，也可以是相对于视频 (大小，例如 50% ) 。
width	string	矩形区域的宽度（以像素为单位）。这可以是绝对像素值 (例如 100) ，也可以是相对于视频 (大小，例如 50% ) 。

Rotation

在对输入视频进行编码之前，要应用于输入视频的旋转（如果有）。默认值为 Auto

名称	类型	说明
Auto	string	根据需要自动检测和旋转。
None	string	不要旋转视频。如果输出格式支持，则有关旋转的任何元数据将保持不变。
Rotate0	string	不要旋转视频，但删除有关旋转的任何元数据。
Rotate180	string	顺时针旋转 180 度。
Rotate270	string	顺时针旋转 270 度。
Rotate90	string	顺时针旋转 90 度。

StandardEncoderPreset

介绍在使用标准编码器对输入视频进行编码时要使用的所有设置。

名称	类型	说明
@odata.type	string: #Microsoft.Media.StandardEncoderPreset	派生类型的鉴别器。
codecs	Codec[]: AacAudio[] Audio[] CopyAudio[] CopyVideo[] DDAudio[] H264Video[] H265Video[] Image[] JpgImage[] PngImage[] Video[]	编码输入视频时要使用的编解码器列表。
experimentalOptions	object	包含未在预设本身中公开的参数的键值对的字典
filters	Filters	编码前应用于输入媒体的一个或多个筛选操作。
formats	Format[]: ImageFormat[] JpgFormat[] Mp4Format[] MultiBitrateFormat[] PngFormat[] TransportStreamFormat[]	编码器要生成的输出列表。

StretchMode

调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 (s) 。默认值为 AutoSize

名称	类型	说明
AutoFit	string	使用信箱或支柱框) 填充输出 (，以遵循输出分辨率，同时确保输出中的活动视频区域具有与输入相同的纵横比。例如，如果输入为 1920x1080，编码预设要求为 1280x1280，则输出将为 1280x1280，其中包含一个纵横比为 1280x720 的内部矩形（纵横比为 16：9），柱形框区域在左侧和右侧为 280 像素宽。
AutoSize	string	重写输出分辨率，并更改它以匹配输入的显示纵横比，而无需填充。例如，如果输入为 1920x1080，而编码预设要求提供 1280x1280，则会重写预设中的值，输出将是 1280x720，这样可以保持 16:9 的输入纵横比。
None	string	严格遵循输出分辨率，而不考虑输入视频的像素纵横比或显示纵横比。

systemData

与资源的创建和上次修改相关的元数据。

名称	类型	说明
createdAt	string	资源创建时间戳 (UTC) 。
createdBy	string	创建资源的标识。
createdByType	createdByType	创建资源的标识类型。
lastModifiedAt	string	资源上次修改的时间戳 (UTC)
lastModifiedBy	string	上次修改资源的标识。
lastModifiedByType	createdByType	上次修改资源的标识类型。

Transform

转换封装用于从输入媒体生成所需输出的规则或指令，例如通过转码或提取见解。创建转换后，可以通过创建作业将其应用于输入媒体。

名称	类型	说明
id	string	资源的完全限定的资源 ID。例如 - /subscriptions/{subscriptionId}/resourceGroups/{resourceGroupName}/providers/{resourceProviderNamespace}/{resourceType}/{resourceName}
name	string	资源的名称
properties.created	string	创建转换时的 UTC 日期和时间，格式为“YYYY-MM-DDThh:mm:ssZ”。
properties.description	string	转换的可选详细说明。
properties.lastModified	string	上次更新转换的 UTC 日期和时间，格式为“YYYY-MM-DDThh:mm:ssZ”。
properties.outputs	TransformOutput[]	转换应该生成的一个或多个 TransformOutput 的数组。
systemData	systemData	与此资源相关的系统元数据。
type	string	资源类型。例如“Microsoft.Compute/virtualMachines”或“Microsoft.Storage/storageAccounts”

TransformOutput

描述 TransformOutput 的属性，这些属性是在生成所需输出时要应用的规则。

名称	类型	说明
onError	OnErrorType	转换可以定义多个输出。此属性定义当一个输出失败时服务应执行的操作 - 继续生成其他输出，或者停止其他输出。总体作业状态不会反映使用“ContinueJob”指定的输出失败。默认值为“StopProcessingJob”。
preset	Preset: AudioAnalyzerPreset BuiltInStandardEncoderPreset FaceDetectorPreset StandardEncoderPreset VideoAnalyzerPreset	描述将用于修改、转码或从源文件中提取见解以生成输出的操作的预设。
relativePriority	Priority	设置转换中 TransformOutputs 的相对优先级。这将设置服务用于处理 TransformOutput 的优先级。默认优先级为 Normal。

TransportStreamFormat

介绍用于生成 MPEG-2 传输流的属性 (ISO/IEC 13818-1) 输出视频文件 () 。

名称	类型	说明
@odata.type	string: #Microsoft.Media.TransportStreamFormat	派生类型的鉴别器。
filenamePattern	string	用于创建输出文件的文件命名模式。文件名支持以下宏：{Basename} - 将使用输入视频文件名称的扩展宏。如果输入视频文件长度小于 32 个字符) ，则不包括文件后缀 (基名称，将使用输入视频文件的基本名称。如果输入视频文件的基名称长度超过 32 个字符，则基名称将截断为总长度的前 32 个字符。 {Extension} - 此格式的相应扩展。 {Label} - 分配给编解码器/层的标签。 {Index} - 缩略图的唯一索引。仅适用于缩略图。 {AudioStream} - 字符串“Audio”加上音频流编号 (从 1) 开始。 {Bitrate} - 音频/视频比特率（以 kbps 为单位）。不适用于缩略图。 {Codec} - 音频/视频编解码器的类型。 {Resolution} - 视频分辨率。任何未替换的宏都将折叠并从文件名中删除。
outputFiles	OutputFile[]	要生成的输出文件的列表。列表中的每个条目都是一组音频和视频层标签，这些标签要复用在一起。

Video

介绍用于编码输入视频的基本属性。

名称	类型	说明
@odata.type	string: #Microsoft.Media.Video	派生类型的鉴别器。
keyFrameInterval	string	两个关键帧之间的距离。该值应在以 ISO 8601 格式指定的 [0.5， 20] 秒范围内为非零。 PT2S) (默认值为 2 秒。请注意，如果设置了 VideoSyncMode.Passthrough，则忽略此设置，其中 KeyFrameInterval 值将跟随输入源设置。
label	string	编解码器的可选标签。标签可用于控制复用行为。
stretchMode	StretchMode	调整大小模式 - 如何调整输入视频的大小以适应所需的输出分辨率 () 。默认值为 AutoSize
syncMode	VideoSyncMode	视频同步模式

VideoAnalyzerPreset

视频分析器预设，用于从音频和视频中提取见解 (丰富的元数据) ，并输出 JSON 格式化文件。

名称	类型	说明
@odata.type	string: #Microsoft.Media.VideoAnalyzerPreset	派生类型的鉴别器。
audioLanguage	string	使用“语言标记区域”的 BCP-47 格式的输入中的音频有效负载的语言 (例如：“en-US”) 。如果你知道内容的语言，建议你指定它。必须为 AudioAnalysisMode：：Basic 显式指定语言，因为自动语言检测不包括在基本模式下。如果未指定语言或将语言设置为 null，自动语言检测将选择检测到的第一种语言并使用所选语言处理整个文件。它目前不支持在检测到第一种语言后在各语言之间进行动态切换。自动检测最适用于具有清晰可辨识语音的录音。如果自动检测找不到该语言，则听录将回退到'en-US'。”此处提供了支持的语言列表： https://go.microsoft.com/fwlink/?linkid=2109463
experimentalOptions	object	包含未在预设本身中公开的参数的键值对的字典
insightsToExtract	InsightsType	定义希望服务生成的见解类型。允许的值为“AudioInsightsOnly”、“VideoInsightsOnly”和“AllInsights”。默认值为 AllInsights。如果将此项设置为 AllInsights，并且输入仅为音频，则仅生成音频见解。同样，如果输入仅视频，则仅生成视频见解。如果你希望某些输入仅使用视频，建议不要使用 AudioInsightsOnly;或者，如果你希望某些输入仅是音频，请使用 VideoInsightsOnly。在这种情况下，作业将出错。
mode	AudioAnalysisMode	确定要执行的音频分析操作集。如果未指定，将选择标准 AudioAnalysisMode。

VideoOverlay

描述视频覆盖的属性。

名称	类型	说明
@odata.type	string: #Microsoft.Media.VideoOverlay	派生类型的鉴别器。
audioGainLevel	number	覆盖中音频的增益级别。该值应位于 [0， 1.0] 范围内。默认值为 1.0。
cropRectangle	Rectangle	用于裁剪覆盖图像或视频的可选矩形窗口。
end	string	结束位置（引用了覆盖结束处的输入视频）。该值应采用 ISO 8601 格式。例如，PT30S 在输入视频的 30 秒处结束覆盖。如果未指定或该值大于输入视频持续时间，则覆盖媒体持续时间大于输入视频持续时间时，将应用覆盖，直到输入视频结束，否则覆盖将持续到覆盖媒体持续时间。
fadeInDuration	string	覆盖淡入输入视频的持续时间。该值应采用 ISO 8601 持续时间格式。如果未指定，则默认行为是无淡入 (与 PT0S) 相同。
fadeOutDuration	string	覆盖淡出输入视频的持续时间。该值应采用 ISO 8601 持续时间格式。如果未指定，则默认行为是没有淡出 (与 PT0S) 相同。
inputLabel	string	要用作覆盖的作业输入的标签。输入必须指定一个文件。可以指定 JPG、PNG、GIF 或 BMP 格式的图像文件，或者指定音频文件（如 WAV、MP3、WMA 或 M4A 文件）或视频文件。有关支持的音频和视频文件格式的完整列表，请参阅 https://aka.ms/mesformats 。
opacity	number	覆盖层的不透明度。这是 [0 - 1.0] 范围内的值。默认值为 1.0，这意味着覆盖不透明。
position	Rectangle	输入视频中应用覆盖的位置。
start	string	开始位置（引用了覆盖层开始的输入视频）。该值应采用 ISO 8601 格式。例如，PT05S 在 5 秒处开始覆盖输入视频。如果未指定，覆盖层将从输入视频的开头开始。

VideoSyncMode

视频同步模式

名称	类型	说明
Auto	string	这是默认方法。根据复用器功能在 Cfr 和 Vfr 之间进行选择。对于输出格式 MP4，默认模式为 Cfr。
Cfr	string	将根据需要重复和/或删除输入帧，以完全达到所请求的恒定帧速率。当输出帧速率显式设置为指定值时，建议使用
Passthrough	string	帧上的演示文稿时间戳从输入文件传递到输出文件编写器。当输入源具有可变帧速率，并且尝试在具有对齐 GOP 边界的输出中生成多个自适应流式处理层时，建议使用。注意：如果输入中的两个或更多帧具有重复的时间戳，则输出也将具有相同的行为
Vfr	string	类似于传递模式，但如果输入具有重复时间戳的帧，则只有一个帧传递到输出，而其他帧则被删除。当输出帧数应等于输入帧数时，建议使用。例如，输出用于根据输入计算质量指标（如 PSNR）