Salidas de Azure Stream Analytics

Un trabajo de Azure Stream Analytics consta de una entrada, una consulta y una salida. Puede enviar datos transformados a varios tipos de salida. En este artículo se enumeran las salidas admitidas de Stream Analytics. Al diseñar la consulta de Stream Analytics, consulte el nombre de la salida mediante la cláusula INTO. Puede usar una única salida por trabajo o varias salidas por trabajo de streaming agregando varias cláusulas INTO a la consulta.

Para crear, editar y probar salidas de trabajos de Stream Analytics, puede usar Azure Portal, Azure PowerShell, API de .NET, API REST, Visual Studio y Visual Studio Code.

Nota:

Para obtener la mejor experiencia de desarrollo local, use las herramientas Stream Analytics para Visual Studio Code. Las herramientas de Stream Analytics para Visual Studio 2019 (versión 2.6.3000.0) tienen brechas de características conocidas y no se mejorarán en el futuro.

Algunos tipos de salida admiten la creación de particiones , como se muestra en la tabla siguiente.

Todas las salidas admiten el procesamiento por lotes, pero solo algunas admiten establecer explícitamente el tamaño del lote de salida. Para obtener más información, consulte la sección Tamaños de lote de salida.

Tipo de salida	Partición	Seguridad
Azure Data Explorer	Sí	Identidad administrada
Funciones de Azure	Sí	Clave de acceso
Azure Synapse Analytics	Sí	Autenticación de usuario de SQL, Identidad administrada
Blob Storage y Azure Data Lake Gen 2	Sí	Clave de acceso, Identidad administrada
Azure Cosmos DB	Sí	Clave de acceso, Identidad administrada
Azure Data Lake Storage Gen 2	Sí	Identidad administrada de usuario de Microsoft Entra
Azure Event Hubs	Sí, debe establecer la columna de clave de partición en la configuración de salida.	Clave de acceso, Identidad administrada
Kafka (versión preliminar)	Sí, debe establecer la columna de clave de partición en la configuración de salida.	Clave de acceso, Identidad administrada
Base de datos de Azure para PostgreSQL	Sí	Autenticación de nombre de usuario y contraseña
Power BI	No	Usuario de Microsoft Entra, Identidad administrada
Las colas de Azure Service Bus	Sí	Clave de acceso, Identidad administrada
Temas de Azure Service Bus	Sí	Clave de acceso, Identidad administrada
Azure SQL Database	Sí, opcional.	Autenticación de usuario de SQL, Identidad administrada
Almacenamiento de tablas de Azure	Sí	Clave de cuenta

Importante

Azure Stream Analytics usa la API "Insert o Replace" según el diseño. Esta operación reemplaza a una entidad existente o inserta una nueva entidad si no existe en la tabla.

Partición

Stream Analytics admite particiones para todas las salidas, excepto Power BI. Para más información sobre las claves de partición y el número de escritores de salida, consulte el artículo sobre el tipo de salida específico que le interesa. Los artículos para los tipos de salida están vinculados en la sección anterior.

Para obtener un ajuste más avanzado de las particiones, puede controlar el número de escritores de salida mediante la cláusula INTO <partition count> (vea INTO) en la consulta. Este control puede ayudarle a lograr una topología de trabajo deseada. Si el adaptador de salida no tiene particiones, la falta de datos de una partición de entrada provocará un retraso hasta la cantidad de tiempo de llegada tardía. En tales casos, la salida se combina en un único sistema de escritura, lo que puede provocar cuellos de botella en la canalización. Para más información sobre la directiva de llegada tardía, consulte Consideraciones sobre el orden de eventos de Azure Stream Analytics.

Tamaño del lote de salida

Todas las salidas admiten el procesamiento por lotes, pero solo algunas admiten establecer explícitamente el tamaño del lote. Azure Stream Analytics usa lotes de tamaño variable para procesar eventos y escribir en las salidas. Normalmente, el motor de Stream Analytics no escribe un mensaje a la vez y usa lotes para mejorar la eficacia. Cuando la tasa de eventos entrantes y salientes es alta, Stream Analytics usa lotes más grandes. Cuando la tasa de salida es baja, usa lotes más pequeños para mantener baja latencia.

Comportamiento de la división de archivos Avro y Parquet

Una consulta de Stream Analytics puede generar varios esquemas para una salida determinada. La lista de columnas proyectadas y su tipo pueden cambiar por fila. Por diseño, los formatos Avro y Parquet no admiten esquemas de variables en un solo archivo.

Es posible que se produzcan los comportamientos siguientes al dirigir una secuencia con esquemas de variables a una salida mediante estos formatos:

Si se puede detectar el cambio de esquema, se cierra el archivo de salida actual y se inicializa uno nuevo en el nuevo esquema. La división de archivos como tal ralentiza gravemente la salida cuando se producen cambios de esquema con frecuencia. Este comportamiento puede afectar gravemente al rendimiento general del trabajo.
Si no se puede detectar el cambio de esquema, es más probable que se rechace la fila y el trabajo se bloquee, ya que la fila no se puede generar. Las columnas anidadas, o matrices de varios tipos, son situaciones que no se detectarán y se rechazarán.

Tenga en cuenta que las salidas que usan el formato Avro o Parquet están fuertemente tipadas, o su esquema se crea durante la escritura, y que las consultas de escritura destinadas a ellas se escriben como tales (conversiones y proyecciones explícitas para un esquema uniforme).

Si necesita generar varios esquemas, considere crear varias salidas y dividir los registros en cada destino mediante una WHERE cláusula.

Propiedades de la ventana de procesamiento por lotes con salida de Parquet

Cuando se usa la implementación de plantillas de Azure Resource Manager o la API REST, se establecen dos propiedades de ventana de procesamiento por lotes:

timeWindow

Tiempo de espera máximo por lote. Establezca el valor como una cadena de Timespan. Por ejemplo, use 00:02:00 durante dos minutos. Después de este tiempo, el lote se escribe en la salida aunque no se cumpla el requisito de filas mínimas. El valor predeterminado es un minuto y el máximo permitido es de dos horas. Si la salida del blob tiene una frecuencia de patrón de ruta de acceso, el tiempo de espera no puede ser mayor que el intervalo de tiempo de la partición.
sizeWindow

Número de filas mínimas por lote. En el caso de Parquet, cada lote crea un archivo. El valor predeterminado actual es 2000 filas y el máximo permitido es 10 000 filas.

La versión de API 2017-04-01-preview o posterior admite estas propiedades de ventana de procesamiento por lotes. Este es un ejemplo de la carga JSON para una llamada a la API REST:

"type": "stream",
      "serialization": {
        "type": "Parquet",
        "properties": {}
      },
      "timeWindow": "00:02:00",
      "sizeWindow": "2000",
      "datasource": {
        "type": "Microsoft.Storage/Blob",
        "properties": {
          "storageAccounts" : [
          {
            "accountName": "{accountName}",
            "accountKey": "{accountKey}",
          }
          ],

Pasos siguientes

Inicio rápido: Creación de un trabajo de Stream Analytics mediante Azure Portal

Comentarios

Resultoulle útil esta páxina?

Last updated on 2026-02-24