Compartir vía


Transformación Limpieza de DQS

Se aplica a: SQL Server SSIS Integration Runtime en Azure Data Factory

La transformación Limpieza de DQS usa Data Quality Services (DQS) para corregir datos de un origen de datos conectado aplicando reglas aprobadas que se crearon para el origen de datos conectado o un origen de datos similar. Para obtener más información acerca de las reglas de corrección de datos, vea DQS Knowledge Bases and Domains. Para obtener más información acerca de DQS, vea Data Quality Services Concepts.

Para determinar si es necesario corregir los datos, la transformación Limpieza de DQS procesa los datos de una columna de entrada cuando se cumplen las condiciones siguientes:

  • La columna está seleccionada para la corrección de datos.

  • El tipo de datos de la columna se admite para la corrección de datos.

  • La columna está asignada a un dominio que tiene un tipo de datos compatible.

La transformación también incluye una salida de error que puede configurar para controlar los errores de fila. Para configurar la salida de error, use el Editor de transformación Limpieza de DQS.

Puede incluir la Fuzzy Grouping Transformation en el flujo de datos para identificar filas de datos que probablemente estén duplicadas.

Proyectos y valores de calidad de los datos

Al procesar datos con la transformación Limpieza de DQS, un proyecto de limpieza se crea en el servidor Data Quality Server. Utilice Data Quality Client para administrar el proyecto. Además, puede utilizar Data Quality Client para importar los valores del proyecto en un dominio de base de conocimiento de DQS. Puede importar los valores solo a un dominio (o dominio vinculado) que la transformación Limpieza de DQS se configurara para usar.

Cuadro de diálogo Editor de transformación Limpieza de DQS

Use el cuadro de diálogo Editor de transformación Limpieza de DQS para corregir datos con Data Quality Services (DQS). Para más información, consulte Data Quality Services Concepts.

¿Qué desea hacer?

Abrir el Editor de transformación Limpieza de DQS

  1. Agregue la transformación Limpieza de DQS al paquete de Integration Services, en SQL Server Data Tools (SSDT).

  2. Haga clic con el botón derecho en el componente y, después, haga clic en Editar.

Establecer opciones en la pestaña Administrador de conexiones

Administrador de conexiones de calidad de datos
Seleccione un administrador de conexiones DQS existente de la lista, o bien haga clic en Nuevopara crear una conexión.

Nuevo
Cree un administrador de conexiones con el cuadro de diálogo Administrador de conexiones de limpieza de DQS . Vea Set the options in the DQS Cleansing Connection Manager dialog box.

Base de conocimiento de calidad de datos
Seleccione una base de conocimiento de DQS existente para el origen de datos conectado. Para obtener más información acerca de la base de conocimiento de DQS, vea DQS Knowledge Bases and Domains.

Cifrar conexión
Especifique si quiere cifrar la conexión para cifrar la transferencia de datos entre el servidor DQS y Integration Services.

Dominios disponibles
Enumera los dominios disponibles para la base de conocimiento seleccionada. Hay dos tipos de dominios: dominios únicos y dominios compuestos que contienen dos o más dominios únicos.

Para obtener información acerca de cómo asignar columnas a dominios compuestos, vea Map Columns to Composite Domains.

Para obtener más información acerca de los dominios, vea DQS Knowledge Bases and Domains.

Configurar la salida de errores
Especifica cómo se han de administrar los errores de fila. Pueden producirse errores cuando la transformación corrige los datos del origen de datos conectado, debido a restricciones de validación o valores de datos inesperados.

Los valores válidos son los siguientes:

  • Error de componente, que indica que los errores de transformación y los datos de entrada no se insertan en la base de datos de Data Quality Services. Este es el valor predeterminado.

  • Redirigir fila, que indica que los datos de entrada no se insertan en la base de datos de Data Quality Services y se redirigen a la salida de error.

Establecer opciones en la pestaña Asignación

Para obtener información acerca de cómo asignar columnas a dominios compuestos, vea Map Columns to Composite Domains.

Columnas de entrada disponibles
Enumera las columnas del origen de datos conectado. Seleccione una o varias columnas que contengan los datos que desee corregir.

Columna de entrada
Muestra una columna de entrada que ha seleccionado en el área Columnas de entrada disponibles .

Dominio
Seleccione un dominio para asignar a la columna de entrada.

Alias de origen
Muestra la columna de origen que contiene el valor original de la columna.

Haga clic en este campo para modificar el nombre de columna.

Alias de salida
Muestra la columna devuelta por el Editor de transformación Limpieza de DQS. La columna contiene el valor original de la columna o el valor corregido.

Haga clic en este campo para modificar el nombre de columna.

Alias de estado
Muestra la columna que contiene información de estado sobre los datos corregidos. Haga clic en este campo para modificar el nombre de columna.

Establecer opciones en la pestaña Avanzadas

Estandarizar salida
Indica si los datos se van a generar en el formato estandarizado según el formato de salida que se haya definido para los dominios. Para más información sobre el formato estandarizado, vea Limpieza de datos.

Confidence
Indica si se debe incluir el nivel de confianza para los datos corregidos. El nivel de confianza indica el grado de certeza de DQS para la corrección o sugerencia. Para más información sobre los niveles de confianza, vea Limpieza de datos.

Motivo
Indica si se debe incluir el motivo de la corrección de los datos.

Datos anexados
Indica si se van a generar datos adicionales que se hayan recibido de un proveedor de datos de referencia existente. Para obtener más información, consulte Reference Data Services in DQS.

Esquema de datos anexados
Indica si se va a generar el esquema de datos. Para más información, vea Adjuntar un dominio o un dominio compuesto a datos de referencia.

Set the options in the DQS Cleansing Connection Manager Dialog Box

Nombre del servidor
Seleccione o escriba el nombre del servidor DQS al que desee conectarse. Para obtener más información acerca del servidor, vea DQS Administration.

Probar conexión
Haga clic para confirmar que la conexión especificada es viable.

También puede abrir el cuadro de diálogo Administrador de conexiones de limpieza de DQS desde el área de conexiones; para ello, haga lo siguiente:

  1. En SQL Server Data Tools (SSDT), abra un nuevo proyecto existente de Integration Services o cree uno nuevo.

  2. Haga clic con el botón derecho en el área de conexiones, haga clic en Nueva conexióny, después, en DQS.

  3. Haga clic en Agregar.