Удостоверение преобразования в потоке данных сопоставления

ПРИМЕНИМО К: Фабрика данных Azure Azure Synapse Analytics

Совет

Data Factory в Microsoft Fabric — это следующее поколение Фабрика данных Azure с более простой архитектурой, встроенным ИИ и новыми функциями. Если вы не знакомы с интеграцией данных, начните с Fabric Data Factory. Существующие рабочие нагрузки ADF могут обновляться до Fabric для доступа к новым возможностям в области обработки и анализа данных, аналитики в режиме реального времени и отчетов.

Потоки данных доступны как в конвейерах Фабрика данных Azure, так и в Azure Synapse Analytics конвейерах. Эта статья относится к сопоставлению потоков данных. Если вы не знакомы с преобразованиями, ознакомьтесь с вводной статьей "Преобразование данных с помощью сопоставления потоков данных".

Совет

Преобразование Assert в настоящее время не поддерживается в Dataflow 2-го поколения. Список поддерживаемых преобразований и их эквивалентов см. в руководстве по потоку данных 2-го поколения для сопоставления пользователей потока данных.

Преобразование Assert позволяет создавать пользовательские правила внутри потоков сопоставления данных для проверки качества и данных. Вы можете создавать правила, определяющие, соответствуют ли значения ожидаемому домену значений. Кроме того, можно создать правила, которые проверяют уникальность строк. Преобразование Assert помогает определить, соответствует ли каждая строка в данных набору критериев. Преобразование Assert также позволяет задать пользовательские сообщения об ошибках, если правила проверки данных не выполнены.

Тип утверждения

Настройка

На панели конфигурации преобразования утверждений выберите тип утверждения, укажите уникальное имя утверждения, необязательное описание и определите выражение и необязательный фильтр. Панель предварительного просмотра данных указывает, какие строки не прошли проверки. Кроме того, можно протестировать каждый тег строки в нисходящем направлении, используя isError() и hasError() для строк, которые не прошли утверждение.

Параметры утверждения

Тип утверждения

Ожидается значение, равное true: результат выражения должен быть логическим значением true. Используйте этот параметр для проверки диапазонов значений домена в данных.
Ожидается уникальный экземпляр: задайте столбец или выражение в качестве правила уникальности данных. Используйте этот параметр для тега повторяющихся строк.
Ожидается: этот параметр доступен только при выборе второго входящего потока. Функция Exists проверяет оба потока и определяет, существуют ли строки в обоих потоках на основе заданных вами столбцов или выражений. Чтобы добавить второй поток для EXISTS, выберите Additional streams.

Конфигурация утверждения

Сбой потока данных

Выберите fail data flow, если вы хотите, чтобы действие потока данных завершилось сбоем сразу же после нарушения правила утверждения.

ID проверки

Идентификатор assert — это свойство, в котором вы вводите (строковое) имя для утверждения. Вы можете использовать идентификатор позже в потоке данных с помощью hasError() или вывода кода сбоя утверждения. Идентификаторы утверждений должны быть уникальными в каждом потоке данных.

Описание утверждения

Введите строковое описание для утверждения. Здесь также можно использовать выражения и значения столбцов контекста строк.

Фильтр

Фильтр — это необязательное свойство, с помощью которого можно ограничить утверждение только подмножеством строк по значению выражения.

Выражение

Введите выражение для вычисления для каждого из ваших утверждений. Для каждого преобразования утверждения можно использовать несколько утверждений. Для каждого типа утверждения требуется выражение, которое ADF необходимо оценить, чтобы проверить, прошло ли утверждение.

Игнорировать значения NULL

По умолчанию преобразование assert включает NULLs в оценку строковых утверждений. С помощью этого свойства можно пропускать значения NULL.

Прямые сбои утверждений строк

При сбое утверждения можно при необходимости направлять эти строки ошибок в файл в Azure с помощью вкладки "Ошибки" преобразования приемника. Кроме того, в преобразовании приемника есть возможность полностью не выводить строки с ошибками утверждения, игнорируя строки ошибок.

Примеры

source(output(
		AddressID as integer,
		AddressLine1 as string,
		AddressLine2 as string,
		City as string,
		StateProvince as string,
		CountryRegion as string,
		PostalCode as string,
		rowguid as string,
		ModifiedDate as timestamp
	),
	allowSchemaDrift: true,
	validateSchema: false,
	isolationLevel: 'READ_UNCOMMITTED',
	format: 'table') ~> source1
source(output(
		CustomerID as integer,
		AddressID as integer,
		AddressType as string,
		rowguid as string,
		ModifiedDate as timestamp
	),
	allowSchemaDrift: true,
	validateSchema: false,
	isolationLevel: 'READ_UNCOMMITTED',
	format: 'table') ~> source2
source1, source2 assert(expectExists(AddressLine1 == AddressLine1, false, 'nonUS', true(), 'only valid for U.S. addresses')) ~> Assert1

Скрипт потока данных

Примеры

source1, source2 assert(expectTrue(CountryRegion == 'United States', false, 'nonUS', null, 'only valid for U.S. addresses'),
	expectExists(source1@AddressID == source2@AddressID, false, 'assertExist', StateProvince == 'Washington', toString(source1@AddressID) + ' already exists in Washington'),
	expectUnique(source1@AddressID, false, 'uniqueness', null, toString(source1@AddressID) + ' is not unique')) ~> Assert1

Используйте Преобразование выбора для выбора и проверки столбцов.
Используйте Преобразование производного столбца для преобразования значений столбцов.

Обратная связь

Были ли сведения на этой странице полезными?

Last updated on 2026-04-28

Удостоверение преобразования в потоке данных сопоставления

Настройка

Тип утверждения

Сбой потока данных

ID проверки

Описание утверждения

Фильтр

Выражение

Игнорировать значения NULL

Прямые сбои утверждений строк

Примеры

Скрипт потока данных

Примеры

Связанный контент

Обратная связь

Дополнительные ресурсы