Compartir a través de


Conceptos de Data Quality Services

En este tema se proporciona un breve resumen de los conceptos de Data Quality Services (DQS) en administración del conocimiento, proyectos de calidad de datos y administración de calidad de datos.

En este tema

  • Conceptos de administración del conocimiento

  • Conceptos de proyectos de calidad de los datos

  • Conceptos de administración de calidad de datos

Conceptos de administración del conocimiento

La base de conocimientos de DQS es un repositorio de metadatos que crea el administrador de datos o el profesional de TI para usarlo en la mejora de la calidad de datos mediante la limpieza y la coincidencia de datos. La administración del conocimiento de DQS incluye los procesos usados para crear y administrar la base de conocimiento, tanto de un modo asistido por el equipo como de forma interactiva.

Detección de conocimiento

La detección de conocimiento es un proceso asistido por equipo que analiza las muestras de los datos de su organización para compilar el conocimiento acerca de los datos. Una vez que se tienen los resultados del análisis, se puede validar y mejorar el conocimiento; tras ello, se aplica para llevar a cabo la limpieza, coincidencia y generación de perfiles de los datos. Para obtener más información, vea Bases de conocimiento y dominios de DQS.

Administración de dominios

El proceso de administración de dominios permite cambiar o aumentar el conocimiento que se ha generado mediante el proceso de detección de conocimiento. Puede modificar, actualizar y revisar interactivamente el conocimiento de una base de conocimiento. Una base de conocimiento consta de dominios de datos que contienen valores de dominio y su estado, reglas de dominio, relaciones basadas en términos y datos de referencia. En la administración de dominios, puede cambiar las propiedades de dominio, adjuntar datos de referencia a un dominio, administrar reglas de dominio, administrar valores de dominio y especificar relaciones de datos, así como crear, eliminar, importar o exportar dominios. También puede usar dominios compuestos que agregan varios dominios individuales. Para obtener más información, vea Bases de conocimiento y dominios de DQS.

Directiva de coincidencia

Una directiva de coincidencia contiene las reglas de coincidencia empleadas para realizar la eliminación de datos duplicados. El proceso de la directiva de coincidencia permite crear reglas de coincidencia, optimizarla según los resultados de coincidencia y generar perfiles de datos, así como agregar la directiva a la base de conocimiento. Para obtener más información, vea Coincidencia de datos.

Reference Data Services

Puede usar los datos de referencia para validar, corregir y enriquecer los datos, aprovechando los servicios de compañías que garantizan la calidad de sus datos de referencia. Puede usar los servicios de Windows Azure MarketPlace para conectar con proveedores de datos de referencia o puede usar una conexión directa a un proveedor. Para obtener más información, vea Servicios de datos de referencia en DQS.

Para obtener más información sobre la administración de conocimiento en DQS, vea Bases de conocimiento y dominios de DQS.

Icono de flecha usado con el vínculo Volver al principio[Arriba]

Conceptos de proyectos de calidad de los datos

El administrador de datos realiza las operaciones de calidad de los datos (limpiar y buscar coincidencias) mediante un proyecto de calidad de datos en la aplicación de Cliente de calidad de datos.

Limpieza de datos

La limpieza de datos en DQS se realiza en función del conocimiento en una base de conocimiento de DQS. La limpieza de datos de DQS es un proceso de dos pasos:

  • Limpieza asistida por PC: DQS utiliza el conocimiento de la base de conocimiento seleccionada para el proyecto de limpieza con el fin de proponer correcciones o sugerencias a los valores de un origen de datos.

  • Limpieza interactiva: el administrador de datos puede realizar el proceso de limpieza interactiva para cambiar o aumentar las correcciones de datos que ha propuesto el proceso de limpieza de datos asistido por PC. El administrador de datos lleva a cabo esta operación mediante niveles de confianza y estadísticas que se han identificado mediante el proceso de limpieza de datos o bien especificando sus propios cambios en el proyecto.

Después de limpiar los datos, el administrador de datos puede exportar los datos procesados a una base de datos SQL Server, a un archivo .csv o un archivo de Excel. Para obtener más información, vea Limpieza de datos.

Búsqueda de coincidencias de datos

El proceso de búsqueda de coincidencias permite al administrador de datos comparar los datos a fin de que los datos similares, pero ligeramente distintos, se puedan alinear mediante un proceso de eliminación de datos duplicados. DQS realiza la eliminación de datos duplicados basándose en reglas de coincidencia que están incluidas en la base de conocimiento. El administrador de datos especifica los parámetros para el proceso de búsqueda de coincidencias desde un proyecto de calidad de datos. Para obtener más información, vea Coincidencia de datos.

Generación de perfiles y notificaciones

La generación de perfiles de datos proporciona a los administradores de datos estadísticas en tiempo real e información sobre los datos que va a procesar DQS para las actividades de limpieza o búsqueda de coincidencias mientras se ejecuta un proyecto de calidad de datos. La generación de perfiles de datos ayuda a evaluar la eficacia de las actividades de limpieza y búsqueda de coincidencias en un proyecto de calidad de datos, y las notificaciones ayudan al usuario con las acciones que pueden realizar para mejorar estas actividades. Para obtener más información, vea Generación de perfiles de datos y notificaciones de DQS.

Para obtener más información acerca de los proyectos de calidad de datos de DQS, vea Proyectos de calidad de datos (DQS).

Icono de flecha usado con el vínculo Volver al principio[Arriba]

Conceptos de administración de calidad de datos

Un administrador de DQS puede realizar una serie de tareas administrativas mediante la aplicación de Cliente de calidad de datos.

Supervisión de actividades

La supervisión de actividades muestra la situación y el estado de cada actividad realizada en un intervalo de datos, proporciona datos para cada actividad y permite a los administradores de DQS controlar una actividad. Para obtener más información, vea Supervisar las actividades de DQS.

Configuración

La opción de configuración le permite:

Seguridad de DQS

En el mecanismo de seguridad de SQL Server se usan roles para proteger DQS. Hay tres roles de DQS que determinan el nivel de acceso de un usuario en la aplicación de Cliente de calidad de datos: dqs_administrator, dqs_kb_editor y dqs_kb_operator. No puede conceder roles a los usuarios mediante la aplicación de Cliente de calidad de datos; esto se realiza mediante SQL Server Management Studio. Para obtener más información, vea Seguridad de DQS.

Para obtener más información acerca de la administración de DQS, vea Administración de DQS.

Icono de flecha usado con el vínculo Volver al principio[Arriba]

Vea también

Conceptos

Data Quality Services