Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
En este tema se describe cómo limpiar los datos mediante el conocimiento de los proveedores de datos de referencia. Aunque todos los pasos de la ejecución de una actividad de limpieza siguen siendo los mismos para limpiar sus datos utilizando el conocimiento de los proveedores de datos de referencia, como se explica en Limpieza de datos utilizando el conocimiento interno de DQS, este tema proporciona información específica para la limpieza de datos mediante el servicio de datos de referencia en los Servicios de Calidad de Datos (DQS).
Cuando se usa la característica de servicio de datos de referencia en DQS para limpiar los datos, el proceso de limpieza de DQS envía los valores de dominio asignados al proveedor de servicios de datos de referencia como una solicitud por lotes. El servicio de datos de referencia responde con la siguiente información:
Corrección sugerida
Confianza
Información adicional sobre el dominio mapeado. Los datos de referencia también pueden estandarizar, analizar o enriquecer el origen con datos adicionales. Esta información se proporciona en campos adicionales en la respuesta.
Después de obtener la respuesta del servicio de datos de referencia, se produce lo siguiente en DQS durante la actividad de limpieza:
En función de los valores umbral de corrección automática y confianza mínima especificados durante la asignación de los dominios con el servicio de datos de referencia, los valores de dominio se corrigen o sugieren automáticamente en función del nivel de confianza.
Nota:
Los valores de umbral que especifique durante la asignación de un dominio a un servicio de datos de referencia se aplican mientras se limpian los datos mediante el conocimiento del servicio de datos de referencia y no los especificados en la pestaña Configuración general de la sección Configuración . Para obtener información sobre cómo especificar valores de umbral para la limpieza de datos de referencia, consulte el paso 9 en Adjuntar un dominio o un dominio compuesto a datos de referencia.
Los valores de dominio se clasifican en lo siguiente: Sugerido, Nuevo, No válido, Corregido y Correcto.
Los datos adicionales se anexan al origen y la información está disponible junto con los datos limpios para la exportación.
Antes de empezar
Prerrequisitos
Debe haber mapeado los dominios requeridos en una base de conocimiento de DQS al servicio de datos de referencia correspondiente. Además, la base de conocimiento debe contener conocimiento sobre el tipo de datos que desea limpiar. Por ejemplo, si desea limpiar los datos de origen que contienen direcciones de EE. UU., debe asignar los dominios a un proveedor de servicios de datos de referencia que proporcione datos de alta calidad para direcciones de EE. UU. Para obtener más información, consulte Adjuntar un dominio o un dominio compuesto a datos de referencia.
Seguridad
Permisos
Debe tener el rol dqs_kb_editor o dqs_kb_operator en la base de datos DQS_MAIN para realizar la limpieza de datos.
Limpieza de los datos mediante el conocimiento de datos de referencia
Continuaremos con el mismo ejemplo de uso de los dominios asignados en el tema anterior, Adjuntar un dominio o un dominio compuesto a datos de referencia, con el servicio Melissa Data en Azure Marketplace. Ahora, usaremos los mismos dominios para limpiar algunas direcciones de ejemplo de EE. UU. Los pasos para depurar los datos son los mismos que se describen en Depurar datos utilizando el conocimiento interno de DQS. Sin embargo, le llamaremos la atención siempre que sea necesario durante el proceso.
Cree un proyecto de calidad de datos y seleccione la actividad Limpieza . Consulte Creación de un proyecto de calidad de datos.
En la página Mapa , asigne los siguientes 4 dominios con las columnas adecuadas en los datos de origen: Línea de dirección, Ciudad, Estado y Zip. Haga clic en Next.
Nota:
Como ha asignado los 4 dominios dentro del dominio compuesto Comprobación de direcciones, la limpieza de datos ahora se realizará a nivel de dominio compuesto y no a nivel de dominio individual.
En la página Limpiar , ejecute el proceso de limpieza asistida por el equipo haciendo clic en Iniciar. Una vez finalizado el proceso de limpieza, haga clic en Siguiente.
Nota:
En la página Limpiar , DQS muestra información sobre los dominios adjuntos al servicio de datos de referencia de las dos maneras siguientes:
- Se muestra un mensaje debajo del botón Inicio: "Domain1<>, <Domain2>,... <DomainN> se limpia mediante el proveedor de servicios de datos de referencia". En este ejemplo, se mostrará el mensaje siguiente: "Comprobación de direcciones de dominio se limpia mediante el proveedor de servicios de datos de referencia".
- Un icono,
, se muestra en el área de Perfilador frente a los dominios adjuntos al proveedor de servicios de datos de referencia. En este ejemplo, el icono se mostrará en el dominio compuesto Comprobación de direcciones.
En la página Administrar y ver resultados , revise los valores de dominio. El servicio de datos de referencia puede mostrar más de una sugerencia, si está disponible, para un valor en función del número máximo de sugerencias especificadas en el cuadro Candidatos sugeridos durante la asignación del dominio al servicio de datos de referencia. Por ejemplo, se muestran dos sugerencias para la siguiente dirección de EE. UU.:
Valor original:
Línea de dirección Ciudad Estado Código postal 1 Camino Msft Redmond 98052 Valores sugeridos:
Línea de dirección Ciudad Estado Código postal 1 Microsoft Way Redmond WA 98052 Apartado de Correos 1 Redmond WA 98073
Nota:
En el caso de los dominios compuestos, DQS también resalta los dominios individuales en un color diferente que se corrigieron durante el proceso de limpieza asistido por ordenador. Por ejemplo, en este caso, se corrigieron los dominios Línea de dirección y Estado, y por tanto, se resaltaron en cian.
Una vez que haya terminado de revisar todos los valores de dominio, haga clic en Siguiente para exportar los datos.
En la página Exportar , observará que, aparte de la información regular sobre la actividad de limpieza de cada dominio (Origen, Motivo, Confianza y Estado), hay información adicional proporcionada por el servicio de datos de referencia de Melissa Data sobre sus datos de dirección, como latitud y longitud de su dirección, nombre del condado, tipo de dirección (highrise, street, etc.), y así sucesivamente.
Exporte los datos al destino necesario (SQL Server, CSV o Excel) y haga clic en Finalizar para cerrar el proyecto.
Importante
Si usa la versión de 64 bits de Excel, no puede exportar los datos limpios a un archivo de Excel; Solo puede exportar a una base de datos de SQL Server o a un archivo .csv.