Editar

Compartir a través de


Traslado de datos de archivo de sistemas centrales a Azure

Azure Data Factory
Azure Storage
Archivos de Azure
Azure Blob Storage
Azure Data Box

Esta arquitectura de referencia muestra cómo mover datos de sistemas centrales y de rango medio a Azure. En esta arquitectura, los datos archivados se administran y usan solo en el sistema central. Azure solo se usa como medio de almacenamiento.

Architecture

Diagrama que muestra una arquitectura para el archivado de los datos del sistema central en Azure.

Descargue un archivo Visio de esta arquitectura.

Para decidir qué método usar para mover datos entre el sistema central y el almacenamiento de Azure, tenga en cuenta la frecuencia de recuperación de los datos y la cantidad de datos. Hay disponibles soluciones de Microsoft y de terceros:

  • Soluciones de Microsoft.

    • El conector FTP de Azure Data Factory.
    • La actividad de copia de Data Factory, que puede copiar datos en cualquier solución de almacenamiento de Azure.
    • JCL del sistema central a un blob de Azure mediante Java, una solución personalizada para mover datos desde el sistema central a Azure mediante el lenguaje de control de trabajos (JCL). Para más información, póngase en contacto con datasqlninja@microsoft.com.
  • Soluciones de archivado de terceros. Soluciones que se pueden integrar fácilmente con sistemas centrales, sistemas de rango medio y servicios de Azure.

Flujo de trabajo

  1. El conector FTP de Azure Data Factory mueve los datos del sistema central a Azure Blob Storage. Esta solución requiere una máquina virtual intermedia en la que se instala un entorno de ejecución de integración autohospedado.

  2. La actividad de copia de Data Factory se conecta a la base de datos Db2 para copiar los datos en el almacenamiento de Azure. Esta solución también requiere una máquina virtual intermedia en la que se instala un entorno de ejecución de integración autohospedado.

  3. La solución personalizada JCL del sistema central a un blob de Azure mediante Java mueve los datos entre el sistema central y Blob Storage, y viceversa. Esta solución se basa en Java y se ejecuta en servicios del sistema Unix en el sistema central. Para obtener esta solución, póngase en contacto con datasqlninja@microsoft.com.

    1. Debe completar una única configuración de la solución. Esta configuración implica obtener las claves de acceso de Blob Storage y mover los artefactos necesarios al sistema central.

    2. Un envío JCL mueve los archivos entre el sistema central y Blob Storage, y viceversa.

    3. Los archivos se almacenan en formato binario en Azure. Puede configurar la solución personalizada para convertir EBCDIC en ASCII para tipos de datos simples.

  4. Opcionalmente, Azure Data Box puede ayudarle a transferir físicamente datos del sistema central a Azure. Esta opción es adecuada cuando es necesario migrar una gran cantidad de datos y los métodos en línea de la transmisión tardan demasiado tiempo. (Por ejemplo, si la migración tarda semanas).

  5. Las soluciones de archivado de terceros proporcionan una interacción sencilla con el sistema central o el entorno de rango medio.

    Estas soluciones interactúan con el sistema central y controlan varios parámetros del sistema central, como los tipos de datos, los tipos de registro, los tipos de almacenamiento y los métodos de acceso. Sirven como puente entre Azure y el sistema central. Algunas soluciones de terceros conectan una unidad de almacenamiento al sistema central y ayudan a transferir datos a Azure.

  6. Los datos se sincronizan y archivan periódicamente mediante la solución de archivado de terceros. Una vez que los datos estén disponibles mediante la solución de terceros, la solución puede insertarlos fácilmente en Azure mediante los conectores disponibles.

  7. Los datos se almacenan en Azure.

  8. Según sea necesario, los datos se recuperan de Azure de nuevo al sistema central o de rango medio.

Componentes

  • Azure Storage proporciona almacenamiento en la nube seguro y escalable de forma masiva para sus datos, aplicaciones y cargas de trabajo. Azure Files proporciona recursos compartidos de archivos en la nube sin servidor de forma sencilla y segura. Estos componentes se utilizan para la sincronización y la retención de datos.
  • Azure Data Factory es un servicio híbrido de integración de datos que le permite crear, programar y orquestar flujos de trabajo de ETL y ELT.
  • Azure Data Box es un dispositivo físico que puede usar para mover los datos locales a Azure.

Alternativas

Puede usar el método clásico para mover los datos fuera del sistema central o de rango medio mediante FTP. Data Factory proporciona un conector FTP que puede usar para archivar los datos en Azure.

Detalles del escenario

Los sistemas centrales y de rango medio generan, procesan y almacenan grandes cantidades de datos. Cuando estos datos son antiguos, no suelen ser útiles. Sin embargo, las reglas de cumplimiento y reglamentarias a veces requieren que estos datos se almacenen durante un determinado número de años, por lo que el archivado es crítico. Al archivar estos datos, puede reducir los costos y optimizar los recursos. El archivado de datos también ayuda con el análisis de datos y proporciona un historial de los datos.

Posibles casos de uso

El archivado de datos en la nube puede ayudarle a:

  • Liberar recursos de almacenamiento en sistemas centrales y de rango medio.
  • Optimizar el rendimiento de las consultas almacenando solo los datos pertinentes en el sistema activo.
  • Reducir los costos operativos mediante el almacenamiento de datos de una manera más económica.
  • Usar los datos archivados para el análisis para crear nuevas oportunidades y tomar mejores decisiones empresariales.

Recomendaciones

En función de cómo se usen los datos, es posible que desee convertirlos en ASCII desde binarios y, a continuación, cargarlos en Azure. Esto facilita el análisis en Azure.

Consideraciones

  • Los tipos de datos complejos del sistema central se deben controlar durante el archivado.
  • Los expertos en la materia de la aplicación pueden identificar qué datos se deben archivar.
  • Para determinar la cantidad de tiempo entre sincronizaciones, tenga en cuenta factores como la importancia crítica empresarial, las necesidades de cumplimiento y la frecuencia de acceso a los datos.

Soluciones de archivado de terceros

Algunas soluciones de terceros están disponibles en Azure Marketplace. Cada una de estas soluciones requiere una única configuración. La configuración de estas soluciones es una de las principales tareas de implementación de esta arquitectura.

Almacenamiento de Azure

Azure tiene una variedad de opciones para diferentes requisitos técnicos y de aplicación, como el acceso frecuente frente al poco frecuente, y los datos estructurados frente a los datos no estructurados. Puede establecer varias configuraciones de ciclo de vida del almacenamiento en Azure Storage. Puede definir las reglas para administrar el ciclo de vida. Para obtener información general, consulte Configuración de una directiva de administración del ciclo de vida.

Recuperación de los datos

La recuperación de los datos archivados es un aspecto importante de las soluciones de archivado. Algunas de las soluciones de terceros proporcionan una experiencia perfecta para recuperar los datos archivados. Es tan sencillo como ejecutar un comando local. El agente de terceros obtiene automáticamente los datos de Azure y los ingiere de nuevo en el sistema central.

Optimización de costos

Use la calculadora de precios de Azure para estimar el costo de la implementación de esta solución.

Colaboradores

Microsoft mantiene este artículo. Originalmente lo escribieron los siguientes colaboradores.

Autor principal:

Otros colaboradores:

Pasos siguientes

Para más información, póngase en contacto con Ingeniería de datos de Azure: modernización de sistemas centrales y de rango medio.

Consulte estos recursos: