Origen XML

Se aplica a:SQL Server SSIS Integration Runtime en Azure Data Factory

El origen XML lee un archivo de datos XML y rellena las columnas de la salida de origen con los datos.

Los datos de los archivos XML suelen incluir relaciones jerárquicas. Por ejemplo, un archivo de datos XML puede representar catálogos y elementos en catálogos. Para que los datos puedan entrar en el flujo de datos, se debe determinar la relación de los elementos del archivo de datos XML y se debe generar una salida para cada elemento del archivo.

Esquemas

El origen XML utiliza un esquema para interpretar los datos XML. Se puede usar un archivo de Definición de esquema XML (XSD) o esquemas insertados para traducir los datos XML a un formato tabular. Si configura el origen XML en el cuadro de diálogo Editor de origen de XML , la interfaz de usuario puede generar un XSD a partir del archivo de datos XML especificado.

Nota

No se admiten DTD.

Los esquemas solo admiten un único espacio de nombres; no admiten colecciones de esquemas.

Nota

El origen XML no valida los datos del archivo XML con el XSD.

origen de XML, editor de

Los datos de los archivos XML suelen incluir relaciones jerárquicas. El cuadro de diálogo Editor de origen de XML utiliza el esquema especificado para generar las salidas del origen XML. Puede especificar un archivo XSD, usar un esquema insertado o generar un XSD del archivo de datos XML especificado. El esquema debe estar disponible en tiempo de diseño.

El origen XML genera estructuras tabulares a partir de los datos XML creando una salida para cada elemento que contenga otros elementos de los archivos XML. Por ejemplo, si los datos XML representan catálogos y elementos en catálogos, el origen XML crea una salida para catálogos y una salida para cada tipo de elemento de un catálogo. La salida de cada elemento contendrá columnas de salida para los atributos de ese elemento.

Para proporcionar información sobre la relación jerárquica de los datos en las salidas, el origen XML agrega a las salidas una columna que identifica el elemento primario para cada elemento secundario. Volviendo al ejemplo de los catálogos con distintos tipos de elementos, cada elemento tendría un valor de columna que identifica el catálogo al que pertenece.

El origen XML crea una salida para cada elemento, pero no es necesario utilizar todas las salidas. Puede eliminar cualquier salida que no desea utilizar o simplemente no conectarla a un componente de nivel inferior.

El origen XML también genera los nombres de las salidas para asegurarse de que no son ambiguos. Estos nombres pueden ser largos y es posible que no identifiquen las salidas de una manera útil. Puede cambiar los nombres de las salidas, con tal de que todos los nombres sean únicos. También puede modificar el tipo de datos y la longitud de las columnas de salida.

Para cada salida, el origen XML agrega una salida de error. De manera predeterminada, las columnas de salidas de error tienen el tipo de datos de cadena Unicode (DT_WSTR) con una longitud de 255, pero puede configurar las columnas en las salidas de error modificando su tipo de datos y su longitud.

Si el archivo de datos XML contiene elementos que no están en el XSD, estos elementos se omitirán y no se generará ninguna salida para ellos. Por otra parte, si en el archivo de datos XML falta algún elemento representado en el XSD, la salida contendrá columnas con valores NULL.

Cuando se extraen los datos del archivo de datos XML, se convierten a un tipo de datos de Integration Services. Pero el código del origen XML no puede convertir los datos XML en los tipos de datos DT_TIME2 o DT_DBTIMESTAMP2, ya que el origen no los admite. Para obtener más información, vea Integration Services Data Types.

Aunque el XSD o esquema insertado puede especificar el tipo de datos de los elementos, si no lo hace, el cuadro de diálogo Editor de origen de XML asignará el tipo de datos String Unicode (DT_WSTR) a la columna de la salida que contiene el elemento y establecerá la longitud de la columna en 255 caracteres.

Si el esquema especifica la longitud máxima de un elemento, la longitud de la columna de salida se establece en este valor. Si la longitud máxima es mayor que la longitud admitida por el tipo de datos de Integration Services al que se convierte el elemento, los datos se truncan en la longitud máxima del tipo de datos. Por ejemplo, si una cadena tiene una longitud de 5000, se trunca en 4000 caracteres porque la longitud máxima del tipo de datos DT_WSTR es 4000 caracteres; de igual modo, los datos BYTE se truncan en 8000 caracteres, la longitud máxima del tipo de datos DT_BYTES. Si el esquema no especifica la longitud máxima, la longitud predeterminada de las columnas con cualquiera de los tipos de datos se establece en 255. El truncamiento de datos en el origen de XML se controla de la misma manera que el truncamiento en otros componentes de flujo de datos. Para más información, vea Control de errores en los datos.

Puede modificar el tipo de datos y la longitud de columna. Para obtener más información, vea Integration Services Data Types.

Configuración del origen XML

El origen XML admite tres modos de acceso a datos distintos. Puede especificar la ubicación del archivo de datos XML, la variable que contiene la ubicación del archivo o la variable que contiene los datos XML.

El origen XML incluye las propiedades personalizadas XMLData y XMLSchemaDefinition , que se pueden actualizar a través de expresiones de propiedad al cargar el paquete. Para más información, vea Expresiones de Integration Services (SSIS), Usar expresiones de propiedad en paquetes y Propiedades personalizadas del origen XML.

El origen XML admite varias salidas normales y varias salidas de error.

SQL Server Integration Services incluye el cuadro de diálogo Editor de origen de XML para configurar el origen XML. Este cuadro de diálogo está disponible en el Diseñador de SSIS.

Puede establecer propiedades a través del Diseñador de SSIS o mediante programación.

El cuadro de diálogo Editor avanzado indica las propiedades que se pueden establecer mediante programación. Para obtener más información acerca de las propiedades que puede establecer a través del cuadro de diálogo Editor avanzado o mediante programación, haga clic en uno de los temas siguientes:

Para obtener más información sobre cómo establecer valores de propiedades, haga clic en uno de los temas siguientes:

Editor de origen de XML (página Administrador de conexiones)

Utilice la página Administrador de conexiones del Editor de origen de XML para especificar un archivo XML y el XSD que transforma los datos XML.

Opciones estáticas

Modo de acceso a datos
Especifique el método para seleccionar datos del origen.

Value Descripción
Ubicación del archivo XML Recupera datos de un archivo XML.
Archivo XML de variable Especifica el nombre de archivo XML en una variable.

Información relacionada: Usar variables en paquetes
Datos XML de variable Recupera datos XML de una variable.

Utilizar esquema insertado
Especifique si los datos de origen XML contienen el esquema XSD que define y valida su estructura y sus datos.

Ubicación de XSD
Especifique la ruta de acceso y el nombre de archivo del archivo de esquema XSD, o busque el archivo haciendo clic en Examinar.

Browse
Use el cuadro de diálogo Abrir para buscar el archivo de esquema XSD.

Generar XSD
Use el cuadro de diálogo Guardar como para seleccionar una ubicación para el archivo de esquema XSD generado automáticamente. El editor deduce el esquema de la estructura de los datos XML.

Opciones dinámicas del modo de acceso a datos

Modo de acceso a datos = Ubicación del archivo XML

Ubicación de XML
Especifique la ruta de acceso y el nombre de archivo del archivo de datos XML, o busque el archivo haciendo clic en Examinar.

Browse
Use el cuadro de diálogo Abrir para buscar el archivo de datos XML.

Modo de acceso a datos = Datos XML de variable

Nombre de la variable
Seleccione la variable que contiene la ruta de acceso y el nombre del archivo XML.

Modo de acceso a datos = Datos XML de variable

Nombre de la variable
Seleccione la variable que contiene los datos XML.

Editor de origen de XML (página Columnas)

Use el nodo Columnas del cuadro de diálogo Editor de origen de XML para asignar una columna de salida a una columna externa (origen).

Opciones

Columnas externas disponibles
Muestra la lista de columnas externas disponibles en el origen de datos. Esta tabla no se puede usar para agregar o quitar columnas.

Columna externa
Vea las columnas externas (origen) en el orden en que la tarea las leerá. Puede cambiar este orden si elimina primero las columnas seleccionadas en la tabla que aparece en el editor y luego selecciona las columnas externas de la lista en un orden diferente.

Columna de salida
Permite proporcionar un nombre único para cada columna de salida. El nombre predeterminado es el nombre de la columna externa (origen) seleccionada; sin embargo, puede elegir un nombre único y descriptivo. El nombre que indique se mostrará en el Diseñador SSIS .

Editor de origen de XML (página Salida de error)

Utilice la página Salida de error del cuadro de diálogo Editor de origen de XML para seleccionar las opciones de control de errores y para establecer las propiedades en las columnas de salida de errores.

Opciones

Entrada/salida
Muestra el nombre del origen de datos.

Columna
Muestra las columnas externas (origen) que se han seleccionado en la página Administrador de conexiones del cuadro de diálogo Editor de origen de XML.

Error
Permite especificar qué debe ocurrir cuando se produce un error: omitir el error, redirigir la fila o hacer que el componente no funcione.

Temas relacionados:Control de errores en los datos

Truncamiento
Permite especificar qué debe ocurrir cuando se produce un truncamiento: omitir el error, redirigir la fila o hacer que el componente no funcione.

Descripción
Muestra la descripción del error.

Establecer este valor en las celdas seleccionadas
Permite especificar qué debe ocurrir en todas las celdas seleccionadas cuando se produce un error o un truncamiento: omitir el error, redirigir la fila o hacer que el componente no funcione.

Aplicar
Aplica la opción de control de errores a las celdas seleccionadas.

Extraer datos mediante el origen de XML