Integrar datos heterogéneos

Artículo
12/15/2008

Actualizado: 14 de abril de 2006

Muchas empresas y organizaciones tienen almacenada en bases de datos información de muchos proveedores. Integrar estos datos es a menudo un componente clave para que los sistemas puedan trabajar de forma conjunta en una organización. La réplica permite integrar datos heterogéneos de dos maneras:

Utilice Oracle como un origen de datos que se puede replicar en bases de datos de Microsoft SQL Server, IBM y Oracle.
Utilice SQL Server como un origen de datos que se puede replicar en bases de datos de IBM y Oracle.

El tipo de configuración de la réplica utilizada para integrar datos heterogéneos depende del origen y destino o destinos de los datos:

En el siguiente diagrama se ilustra la réplica de datos de SQL Server en IBM DB2 y Oracle.
En el siguiente diagrama se ilustra la réplica de datos de una base de datos Oracle en otras bases de datos. Los datos se replican primero en una base de datos de SQL Server y después pueden replicarse en otras, incluidas bases de datos de SQL Server, IBM DB2 y Oracle.

Ejemplo de Adventure Works Cycles

Adventure Works Cycles es una compañía ficticia que se utiliza para mostrar situaciones y conceptos de bases de datos. Para obtener más información, vea Ejemplos y bases de datos de ejemplo.

Adventure Works Cycles ha adquirido recientemente la empresa mexicana Importadores Neptuno con el fin de ampliar sus infraestructuras y favorecer así el crecimiento previsto de la compañía. Importadores Neptuno utiliza una base de datos Oracle para almacenar sus datos financieros y de fabricación. No obstante, es necesario compartir aspectos esenciales de dicha información a fin de mantener datos precisos de inventario y programación en la aplicación MRP (Planeamiento de recursos de fabricación) de Adventure Works Cycles.

Si bien no existe ningún plan actualmente para migrar las bases de datos de Importadores Neptuno, Adventure Works Cycles necesita transmitir y recibir datos a diario, y transferir dicha información a sus bases de datos de proceso de transacciones en línea (OLTP) y proceso analítico en línea (OLAP) de SQL Server. Adventure Works Cycles replicará los datos de la base de datos Oracle en las bases de datos de SQL Server de la oficina central.

Requisitos habituales en esta situación

Las aplicaciones concebidas para integrar datos heterogéneos suelen tener los siguientes requisitos, que una solución de réplica adecuada debe satisfacer:

El sistema debe permitir que los datos se repliquen entre bases de datos de diferentes fabricantes.
El sistema debe mantener la coherencia transaccional.
El procesamiento de réplica debe producir una sobrecarga mínima en el servidor de origen.
El sistema debe tener una latencia reducida si es necesaria la réplica de cambios incrementales.
El sistema debe tener un rendimiento alto si es necesaria la réplica de cambios incrementales: debe controlar la réplica de un gran número de transacciones.
Los datos requeridos en los servidores de destino pueden ser un subconjunto de los datos disponibles en el servidor de origen.

Tipo de réplica que se debe utilizar en este escenario

SQL Server utiliza una metáfora del sector editorial para describir los componentes del sistema de réplica. Los componentes incluyen publicador, distribuidor, suscriptores, publicaciones y artículos, y suscripciones.

En el primer diagrama anterior, la base de datos Oracle es el publicador. Algunos o todos los datos de la base de datos Oracle se incluyen en la publicación, donde cada tabla de datos es un artículo. Los datos se replican en el primer servidor SQL Server (que está configurado como distribuidor) y a continuación se distribuyen al otro servidor SQL Server y a las bases de datos de IBM y Oracle. Cada una de estas bases de datos es un suscriptor de la publicación que recibe esquemas y datos como suscripción.
En el segundo diagrama, la base de datos de SQL Server es el publicador, y las bases de datos de IBM y Oracle son los suscriptores.

Para obtener más información acerca de los componentes del sistema, vea Información general del modelo de publicación de réplica.

SQL Server ofrece diferentes tipos de réplica para distintos requisitos de aplicación: réplica de instantáneas, réplica transaccional y réplica de mezcla. La mejor implementación para este escenario son las características de réplica heterogénea de la réplica de instantáneas y/o la réplica transaccional, que se adaptan perfectamente para controlar los requisitos indicados en la sección anterior:

Si la aplicación requiere la réplica de cambios incrementales a medida que se producen, utilice la réplica transaccional.
Para la publicación de Oracle, la réplica transaccional realiza un seguimiento de los cambios en el publicador utilizando desencadenadores y tablas de seguimiento de cambios. Para obtener más información acerca de la réplica transaccional, vea Información general de la réplica transaccional, Cómo funciona la réplica transaccional y Flujo de trabajo de la réplica transaccional para publicadores de Oracle.
Si la aplicación requiere que los datos se repliquen una sola vez (por ejemplo, al migrar datos), o que se actualicen de forma periódica en lugar de incremental, utilice la réplica de instantáneas.
Puesto que la réplica de instantáneas no realiza un seguimiento de los cambios incrementales ni los entrega, los desencadenadores no se utilizan en tablas publicadas. Para obtener más información acerca de la réplica de instantáneas, vea Información general de la réplica transaccional y Cómo funciona la réplica transaccional.

Por diseño, la réplica transaccional y la réplica de instantáneas satisfacen los requisitos principales de este escenario:

Réplica entre bases de datos de distintos fabricantes
Coherencia transaccional
Sobrecarga mínima

La réplica transaccional satisface requisitos adicionales para sistemas que necesitan actualizaciones incrementales:

Latencia baja
Rendimiento alto

La opción principal que debe tenerse en cuenta en este caso es el filtrado. La réplica transaccional y la réplica de instantáneas permiten filtrar columnas y filas, de manera que las tablas de los suscriptores contengan sólo los datos requeridos por la aplicación. Para obtener más información, vea Filtrar datos publicados.

Pasos para implementar esta situación

Para implementar esta situación, es preciso crear en primer lugar una publicación y suscripciones, y a continuación inicializar cada suscripción. Haga clic en los vínculos siguientes para obtener más información.

Publicación de Oracle:
- Información general de la publicación de Oracle
- Configurar un publicador de Oracle
Suscriptores de IBM DB2 y Oracle:

Cuando la suscripción se haya inicializado y los datos fluyan entre el publicador y los suscriptores, es posible que necesite consultar los siguientes temas para obtener información sobre tareas habituales de administración y supervisión:

Compartir a través de

Integrar datos heterogéneos

Ejemplo de Adventure Works Cycles

Requisitos habituales en esta situación

Tipo de réplica que se debe utilizar en este escenario

Pasos para implementar esta situación

Vea también

Otros recursos

Ayuda e información

Recursos adicionales