Elija la configuración de Integration Runtime adecuada para el escenario.

Integration Runtime (IR) es la infraestructura de proceso que Microsoft Purview usa para impulsar el examen de datos en diferentes entornos de red. En este artículo se presentan los diferentes tipos de entorno de ejecución de integración disponibles en Microsoft Purview y se proporcionan instrucciones sobre cómo elegir la configuración de Integration Runtime adecuada para su escenario.

Tipos de entornos de ejecución de integración

Purview proporciona los siguientes tipos de entornos de ejecución de integración:

  • Azure integration runtime: el entorno de ejecución de integración de Azure es un proceso elástico y totalmente administrado que puede usar para examinar orígenes de datos Azure o no Azure. El Azure IR admite conexiones a almacenes de datos y servicios de proceso con puntos de conexión accesibles públicamente. Es el entorno de ejecución de integración predeterminado el que no necesita crear nada para empezar.

  • Entorno de ejecución de integración de Virtual Network administrado: puede crear un entorno de ejecución de integración de Virtual Network administrado, que reside en un Virtual Network administrado de Purview. Puede usar puntos de conexión privados para conectarse de forma segura a los orígenes de datos admitidos y examinarlos. Obtenga más información en Managed Virtual Network and managed private endpoints (Puntos de conexión privados administrados y Virtual Network administrados).

  • Entorno de ejecución de integración autohospedado: el entorno de ejecución de integración autohospedado se puede usar para examinar orígenes de datos en una red local o una red virtual. Puede instalarlo en una máquina local o en una máquina virtual dentro de la red privada. Obtenga más información en Creación y administración de entornos de ejecución de integración autohospedados.

  • Runtime de integración autohospedado compatible con Kubernetes: este entorno de ejecución de integración se hospeda en un clúster de Kubernetes y se puede usar para examinar orígenes de datos en una red local o en una red virtual. La compatibilidad con Kubernetes mejora el rendimiento general y permite que el entorno de ejecución de integración se escale con el trabajo. Obtenga más información en Creación y administración de entornos de ejecución de integración autohospedados compatibles con Kubernetes.

  • Entorno de ejecución de integración de AWS: el entorno de ejecución de integración de AWS es un proceso totalmente administrado y elástico hospedado por Microsoft Purview en AWS. Es aplicable al examen de orígenes de datos de Amazon como S3, RDS.

Elección del entorno de ejecución de integración correcto

Elija el entorno de ejecución de integración adecuado para sus necesidades. Tenga en cuenta la arquitectura y los requisitos existentes para la integración de datos. Piense también en cómo satisfacer las crecientes necesidades empresariales y cualquier aumento futuro de la carga de trabajo.

Las siguientes consideraciones pueden ayudarle a tomar una decisión:

  1. ¿Qué tipos de origen de datos desea examinar?

    Consulte la sección Orígenes de datos admitidos para obtener información sobre los tipos de IR admitidos para los orígenes de datos que desea examinar.

  2. ¿Cuál es el control de acceso de red en el origen de datos?

    Los distintos orígenes de datos tienen diferentes configuraciones de firewall de red para protegerlos del acceso aleatorio a través de Internet. Esta configuración se aplica a los almacenes de datos locales, en la nube y SaaS. En la tabla siguiente se enumeran algunas opciones comunes de firewall. Elija el tipo de IR admitido según su escenario.

    Firewall de origen de datos Azure IR Ir de Virtual Network administrado SHIR SHIR compatible con Kubernetes
    Permitir el acceso público
    Permitir Azure servicio o servicio de confianza
    Permitir el acceso desde una red virtual Azure específica ✓ (con compatibilidad con puntos de conexión privados administrados)
    Permitir intervalo IP/IP específico
    Otro acceso a la red local o privada
  3. ¿Cuál es la configuración de firewall de Microsoft Purview?

    Purview proporciona diferentes opciones de firewall de red. Obtenga más información en Configuración del firewall de Microsoft Purview. Elija el tipo de IR admitido según su escenario.

    Firewall de Purview Azure IR Ir de Virtual Network administrado SHIR SHIR compatible con Kubernetes
    Habilitado desde todas las redes
    Deshabilitado de todas las redes ✓ (se requiere un punto de conexión privado administrado) ✓ (es necesario crear un punto de conexión privado desde la red) ✓ (es necesario crear un punto de conexión privado desde la red)
  4. ¿Qué nivel de seguridad necesita durante la transmisión de datos?

    La ubicación del entorno de ejecución de integración define la ubicación de su proceso back-end y dónde se realizan las operaciones de examen. Para la consideración de residencia de datos:

    • Cuando se usa Azure IR, Purview detecta automáticamente la ubicación del origen de datos y usa ir en esa región. Si Purview no puede detectar la región, usa la región de la cuenta de Purview.

    • Cuando se usa Managed Virtual Network IR, se ejecuta en la región que configure para la red virtual administrada.

    • Al usar SHIR, puede decidir completamente la ubicación en las máquinas virtuales locales o Azure.

      Para protegerse contra, por ejemplo, los ataques man-in-the-middle durante la transmisión de datos, use un punto de conexión privado y un vínculo privado para garantizar la seguridad de los datos.

    • Puede crear puntos de conexión privados administrados en los almacenes de datos al usar Managed Virtual Network IR. El servicio Purview mantiene los puntos de conexión privados dentro de la red virtual administrada.

    • También puede crear puntos de conexión privados en la red virtual y shir puede usarlos para acceder a almacenes de datos.

  5. ¿Qué nivel de mantenimiento puede proporcionar?

    Mantener la infraestructura, los servidores y el equipo es una de las tareas importantes del departamento de TI de una empresa. Por lo general, se requiere mucho tiempo y esfuerzo.

    • Al usar Azure IR y Managed Virtual Network IR, no es necesario preocuparse por el mantenimiento, como actualizaciones, revisiones y versiones. El servicio Purview se encarga de todos los esfuerzos de mantenimiento.
    • Dado que SHIR está instalado en las máquinas y el SHIR compatible con Kubernetes se encuentra en los clústeres de Kubernetes, debe administrar el mantenimiento.
  6. Rendimiento y escalabilidad

    Use el Virtual Network Azure entorno de ejecución de ejecución de integración autohospedado compatible con Kubernetes y el entorno de ejecución de ejecución de integración autohospedado totalmente administrado y escalado automático siempre que corresponda. Mediante el uso de elasticidad, pueden proporcionar un mejor rendimiento y escalabilidad, especialmente al examinar sistemas de datos a gran escala.

Hibernación del entorno de ejecución de integración de red virtual administrada

Si el entorno de ejecución de integración está inactivo (no hay exámenes en el entorno de ejecución de integración durante más de 90 días), el Virtual Network Integration Runtime administrado entra automáticamente en hibernación. Su estado se muestra como Hibernado al seleccionar el entorno de ejecución de integración.

¿Qué significa este cambio para usted?

  1. Al ejecutar la conexión de prueba en un entorno de ejecución de integración en hibernación, se produce un error en la conexión de prueba. Verá un mensaje para probar la conexión después de 15 minutos. En este momento, el Virtual Network administrado vuelve a un estado normal. Después de esto, puede ejecutar las conexiones y exámenes de prueba con normalidad.

  2. Cuando ejecuta un examen directamente mediante las opciones Ejecutar examen ahora o Editar examen sin ejecutar una conexión de prueba primero desde un Integration Runtime hibernado, o ejecuta un examen a través de la API, verá un mensaje que indica que este examen tarda hasta 15 minutos adicionales. Este tiempo adicional es para que el Integration Runtime hibernado se active y se inicie el proceso de examen. Verá el estado del examen como Queued_Waking IR ascendente en lugar del estado en cola que ve en caso de examen normal. Después del primer examen, puede ejecutar todos los exámenes siguientes con normalidad.

Orígenes de datos admitidos

En la tabla siguiente se muestran todos los orígenes de datos que admite el examen de Purview y los tipos de integration runtime admitidos.

Categoría Almacén de datos admitido Azure IR/AWS IR Ir de Virtual Network administrado SHIR Kubernetes SHIR
Azure Varios orígenes
Azure Blob Storage ✓ (incluido el punto de conexión privado administrado)
Azure Cosmos DB (API for NoSQL) ✓ (incluido el punto de conexión privado administrado)
Azure Data Explorer ✓ (solo v2)
Azure Data Lake Storage Gen1 ✓ (solo v2)
Azure Data Lake Storage Gen2 ✓ (incluido el punto de conexión privado administrado)
Azure Database for MySQL ✓ (incluido el punto de conexión privado administrado)
Azure Database for PostgreSQL ✓ (incluido el punto de conexión privado administrado)
Azure Metastore de Hive de Databricks
Unity Catalog para Azure Databricks ✓ (solo v2, incluido el punto de conexión privado administrado)
Grupo de Azure Dedicated SQL (anteriormente SQL DW) ✓ (incluido el punto de conexión privado administrado)
Azure Files ✓ (incluido el punto de conexión privado administrado)
Base de datos SQL de Azure ✓ (incluido el punto de conexión privado administrado)
Azure SQL Managed Instance ✓ (incluido el punto de conexión privado administrado)
Azure Synapse Analytics (área de trabajo) ✓ (incluido el punto de conexión privado administrado)
Base de datos Amazon RDS
Amazon Redshift
Cassandra ✓ (solo v2)
Db2
Google BigQuery
Base de datos de metastore de Hive
MongoDB
MySQL ✓ (solo v2)
Oracle
PostgreSQL ✓ (solo v2)
Almacenamiento de datos empresarial SAP
SAP HANA
Copo de nieve ✓ (solo v2, incluido el punto de conexión privado administrado)
SQL Server
SQL Server en Azure-Arc
Teradata
Archivo Amazon S3
HDFS
Servicios y aplicaciones Dataverse ✓ (solo v2)
Erwin
Looker ✓ (solo v2)
Tejido ✓ (solo v2)
Power BI ✓ (solo v2)
Sensor Qlik ✓ (solo v2)
Salesforce ✓ (solo v2)
SAP ECC
SAP S/4HANA
Tableau ✓ (solo v2)