Nota
L'accés a aquesta pàgina requereix autorització. Pots provar d'iniciar sessió o canviar de directori.
L'accés a aquesta pàgina requereix autorització. Pots provar de canviar directoris.
Puede usar Azure Data Explorer como salida para analizar grandes volúmenes de datos diversos de cualquier origen de datos, como sitios web, aplicaciones e Internet de las cosas (IoT). El Explorador de datos de Azure es un servicio de exploración de datos altamente escalable y rápido para datos de telemetría y registro. Ayuda a controlar los muchos flujos de datos que emite el software moderno, por lo que puede recopilar, almacenar y analizar datos. Estos datos se usan para el diagnóstico, la supervisión, la creación de informes, el aprendizaje automático y las funcionalidades de análisis adicionales.
Azure Data Explorer admite varios métodos de ingesta, incluidos conectores a servicios comunes como Azure Event Hubs, ingesta mediante programación a través de SDK como .NET y Python, y acceso directo al motor con fines de exploración. Azure Data Explorer se integra con los servicios de análisis y modelado para análisis y visualización adicionales de datos.
Para más información sobre Azure Data Explorer, consulte ¿Qué es Azure Data Explorer?
Para más información sobre cómo crear un clúster de Azure Data Explorer mediante Azure Portal, consulte Inicio rápido: Creación de un clúster y una base de datos de Azure Data Explorer.
Nota:
Azure Data Explorer de Azure Stream Analytics admite la salida a Azure Synapse Data Explorer. Para escribir en los clústeres en Azure Synapse Data Explorer, especifique la dirección URL del clúster en el panel de configuración para la salida de Azure Data Explorer en el trabajo de Azure Stream Analytics.
Configuración de salida
En la tabla siguiente se enumeran los nombres de propiedad y sus descripciones para crear una salida de Azure Data Explorer.
| Nombre de la propiedad | Description |
|---|---|
| Alias de salida | Nombre amigable que se usa en las consultas para enviar la salida a esta base de datos. |
| Subscription | La suscripción de Azure que desea usar para el clúster. |
| Clúster | Nombre único que identifica el clúster. El nombre de dominio <region.kusto.windows.net> se anexa al nombre del clúster que usted proporcione. El nombre solo puede contener letras minúsculas y números. Debe contener de 4 a 22 caracteres. |
| Base de datos | Nombre de la base de datos donde se envía la salida. El nombre de la base de datos debe ser único dentro del clúster. |
| Autenticación | Una identidad administrada de Microsoft Entra ID, que permite al clúster acceder fácilmente a otros recursos protegidos de Microsoft Entra, como Azure Key Vault. La plataforma Azure administra la identidad y no es necesario que lleve a cabo el aprovisionamiento ni la rotación de los secretos. La configuración de identidad administrada solo se admite actualmente para habilitar claves administradas por el cliente para el clúster. |
| Tabla | Nombre de tabla donde se escribe la salida. El nombre de la tabla distingue mayúsculas de minúsculas. El esquema de esta tabla debe coincidir exactamente con el número de campos y sus tipos que genera el resultado del trabajo. |
Partitioning
La partición debe habilitarse y se basa en la cláusula PARTITION BY de la consulta. Cuando la opción Heredar particiones está habilitada, sigue la creación de particiones de entrada para consultas totalmente paralelizables.
Cuándo usar Azure Stream Analytics y Azure Data Explorer
Entre las características de Azure Stream Analytics se incluyen:
- Motor de procesamiento de flujos: análisis continuo y en tiempo real de streaming
- Basado en tareas
- Ventana de retrospección de 1 milisegundo a 7 días para análisis temporal en memoria y procesamiento de flujos
- Ingesta desde Azure Event Hubs y Azure IoT Hub con latencia de subsegundos
Entre las características de Azure Data Explorer se incluyen las siguientes:
- Motor analítico: análisis interactivo en tiempo real a petición
- Transmisión de la ingesta de datos en un almacén de datos persistente, junto con las funcionalidades de consulta
- Ingesta de datos de Event Hubs, IoT Hub, Azure Blob Storage, Azure Data Lake Storage, Kafka, Logstash, Spark y Azure Data Factory
- Latencia de 10 segundos a 5 minutos para cargas de trabajo de alto rendimiento
- Transformación de datos simples a través de una directiva de actualización durante la ingesta
Puede aumentar significativamente el ámbito de análisis en tiempo real mediante Azure Stream Analytics y Azure Data Explorer juntos. Estos son algunos escenarios:
- Stream Analytics identifica anomalías en tiempo real y Azure Data Explorer ayuda a determinar cómo y por qué se produjeron a través de la exploración interactiva.
- Stream Analytics deserializa los flujos de datos entrantes para su uso en Azure Data Explorer (por ejemplo, ingiere el formato Protobuf mediante un deserializador personalizado o formatos binarios personalizados).
- Stream Analytics puede agregar, filtrar, enriquecer y transformar flujos de datos entrantes para su uso en Azure Data Explorer.
Otros escenarios y limitaciones
- El nombre de las columnas y el tipo de datos debe coincidir entre la consulta SQL de Azure Stream Analytics y la tabla de Azure Data Explorer. En la comparación se distinguen mayúsculas de minúsculas.
- Se omiten las columnas que existen en los clústeres de Azure Data Explorer, pero que faltan en Azure Stream Analytics. Las columnas que faltan en Azure Stream Analytics generan un error.
- El orden de las columnas de la consulta de Azure Stream Analytics no importa. El esquema de la tabla de Azure Data Explorer determina el orden.
- Azure Data Explorer tiene una directiva de agregación (procesamiento por lotes) para la ingesta de datos diseñada para optimizar el proceso de ingesta. La directiva está configurada en 5 minutos, 1000 elementos o 1 GB de datos de forma predeterminada, por lo que puede experimentar una latencia. Para reducir la latencia, habilite la ingesta de streaming en el clúster y, después, la tabla o la base de datos siguiendo los pasos descritos en Configuración de la ingesta de streaming en el clúster de Azure Data Explorer. Para ver las opciones de agregación, consulte la directiva IngestionBatching.