Utilizar el editor sin código de Azure Stream Analytics para transformar y almacenar datos en una base de datos Azure SQL
Este artículo describe cómo puede utilizar el editor sin código para crear fácilmente un trabajo de Stream Analytics, que lee continuamente datos de una instancia de Event Hubs (concentrador de eventos), transforma los datos y, a continuación, escribe los resultados en una base de datos Azure SQL.
Requisitos previos
Tus recursos Azure Event Hubs y Azure SQL Database deben ser de acceso público y no estar detrás de un firewall o protegidos en una Azure Virtual Network. Los datos de Event Hubs deben serializarse en formato JSON, CSV o Avro.
Si quiere probar los pasos de este artículo, siga estos pasos.
Cree un centro de eventos si aún no tiene uno. Genere datos en el centro de eventos. En la página Instancia de centro de eventos, seleccione Generar datos (versión preliminar) en el menú de la izquierda, seleccione Datos de inventario para Conjunto de datos y, a continuación, seleccione Enviar para enviar algunos datos de muestra al centro de eventos. Este paso es necesario si desea probar los pasos de este artículo.
Crear una base de datos Azure SQL. A continuación se indican algunos puntos importantes a tener en cuenta mientras se crea la base de datos.
En la página Básicos, seleccione Crear nueva para Servidor. A continuación, en la página Crear servidor de SQL Database, seleccione Usar autenticación SQL y especifique el ID de usuario y la contraseña de administrador.
En la página Redes, siga estos pasos:
- Habilite Punto de conexión público.
- Seleccione Sí en Permitir que los servicios y recursos de Azure accedan a este servidor.
- Seleccione Sí para Agregar dirección IP de cliente actual.
En la página Configuración adicional, seleccione Ninguna para Utilizar datos existentes.
En el artículo, omita los pasos de las secciones Consultar la base de datos y Limpiar recursos.
Si desea probar los pasos, cree una tabla en la base de datos SQL mediante el Editor de consultas (versión preliminar).
create table stocks ( symbol varchar(4), price decimal )
Utilizar el editor sin código para crear un trabajo de Stream Analytics
En esta sección, se crea un trabajo Azure Stream Analytics mediante el editor sin código. El trabajo transforma el flujo de datos desde una instancia de Event Hubs (centro de eventos) y almacena los datos resultantes en una base de datos Azure SQL.
En el Azure Portal, vaya a la página Instancia de Event Hubs de su centro de eventos.
Seleccione Características>Procesar datos en el menú de la izquierda y, a continuación, seleccione Iniciar en la tarjeta Transformar y almacenar datos en base de datos SQL.
Escriba un nombre para el trabajo de Stream Analytics y seleccione Crear. Verá el diagrama de trabajo de Stream Analytics con la ventana de Event Hubs a la derecha.
En la ventana Event hub, revise los ajustes de Serialización y Modo de autenticación, y seleccione Conectar.
Cuando la conexión se establezca correctamente y tenga datos en su instancia de centros de eventos, verá dos cosas:
Campos que están presentes en los datos de entrada. Puede elegir Agregar campo o seleccionar el símbolo de puntos suspensivos junto a un campo para quitar, cambiar el nombre o cambiar su tipo.
Ejemplo dinámico de datos entrantes en la tabla de Vista previa de los datos en la vista de diagrama. Se actualiza automáticamente de manera periódica. Puede seleccionar Pause streaming preview (Pausar vista previa de streaming) para ver una vista estática de los datos de entrada de ejemplo.
Seleccione el icono Agrupar por para agregar los datos. En el panel de configuración Agrupar por, puede especificar el campo que quiera usar para Agrupar por junto con la Ventana de tiempo.
En el siguiente ejemplo, se utiliza la media de precio y símbolo.
Puede validar los resultados del paso en la sección Versión preliminar de datos.
Seleccione el icono Administrar campos. En el panel de configuración Administrar campos, seleccione los campos que desee mostrar seleccionando Añadir campo. ->Esquema Importado -> campo.
Si desea agregar todos los campos, seleccione Agregar todos los campos. Al añadir un campo, puede especificar un nombre diferente para la salida. Por ejemplo,
AVG_Value
enValue
. Después de guardar las selecciones, verá los datos en el panel Versión preliminar de datos.En el siguiente ejemplo, Símbolo y AVG_Valor están seleccionados. Símbolo se asigna a símbolo, y AVG_Value se asigna a precio.
Seleccione el icono SQL. En el panel de configuración SQL Database, rellene los parámetros necesarios y conéctese. Seleccione Cargar tabla existente para que la tabla se seleccione automáticamente. En el siguiente ejemplo, se selecciona
[dbo].[stocks]
. A continuación, seleccione Conectar.Nota
El esquema de la tabla que elija para escribir debe coincidir exactamente con el número y tipo de los campos que genera la versión preliminar de los datos.
En el panel Versión preliminar de datos, verá la versión preliminar de los datos que se ingieren en la base de datos SQL.
Seleccione Guardar y, a continuación, seleccione Iniciar para iniciar el trabajo de Stream Analytics.
Para iniciar el trabajo, especifique:
El número de unidades de streaming (SU) con las que se ejecutan los trabajos. Las SU representan la cantidad de procesos y memoria asignadas al trabajo. Se recomienda empezar con tres y, a continuación, ajustar la cantidad según sea necesario.
Control de errores de datos de salida: permite especificar el comportamiento que desea cuando se produce un error en la salida de un trabajo en el destino debido a errores de datos. De manera predeterminada, el trabajo reintenta hasta que la operación de escritura se realiza correctamente. También puede optar por quitar estos eventos de salida.
Después de seleccionar Iniciar, el trabajo comienza a ejecutarse en dos minutos. Verá el panel Métricas abierto en el panel inferior. Este panel tarda algún tiempo en actualizarse. Seleccione Actualizar en la esquina superior derecha del panel para actualizar el gráfico. Continúe con el siguiente paso en otra pestaña o ventana del navegador web.
También puede ver el trabajo en la sección Procesar datos de la pestaña Trabajos de Stream Analytics. Seleccione Abrir métricas para supervisarlo, detenerlo o reiniciarlo, según sea necesario.
Vaya a su centro de eventos en el portal en una pestaña o ventana separada del navegador, y envíe de nuevo los datos de acciones de muestra (como hizo en los requisitos previos). En la página Instancia de centro de eventos, seleccione Generar datos (versión preliminar) en el menú de la izquierda, seleccione Datos de inventario para Conjunto de datos y, a continuación, seleccione Enviar para enviar algunos datos de muestra al centro de eventos. Tardará unos minutos en ver actualizado el panel Métricas.
Debería ver los registros insertados en la base de datos Azure SQL.
Consideraciones al usar la característica de replicación geográfica de Event Hubs
Azure Event Hubs lanzó recientemente característica Replicación geográfica en versión preliminar pública. Esta característica es diferente de la característica de Recuperación ante desastres geográfica de Azure Event Hubs.
Cuando el tipo de conmutación por error es Forzado y la coherencia de la replicación es Asincrónico, el trabajo de Stream Analytics no garantiza exactamente una salida una vez en una salida de Azure Event Hubs.
Azure Stream Analytics, como productor con un centro de eventos una salida, podría observar el retraso de la marca de agua en el trabajo durante la duración de la conmutación por error y durante la limitación por Event Hubs en caso de que el retraso de replicación entre principal y secundario alcance el retraso máximo configurado.
Azure Stream Analytics, como consumidor con Event Hubs como entrada, puede observar el retraso de la marca de agua en el trabajo durante la duración de la conmutación por error y podría omitir los datos o buscar datos duplicados una vez completada la conmutación por error.
Debido a estas advertencias, se recomienda reiniciar el trabajo de Stream Analytics con la hora de inicio adecuada justo después de que se complete la conmutación por error de Event Hubs. Además, dado que la característica de replicación geográfica de Event Hubs está en versión preliminar pública, no se recomienda usar este patrón para trabajos de Stream Analytics de producción en este momento. El comportamiento actual de Stream Analytics mejorará antes de que la característica de replicación geográfica de Event Hubs esté disponible con carácter general y se pueda usar en trabajos de producción de Stream Analytics.
Pasos siguientes
Obtenga más información sobre Azure Stream Analytics y cómo supervisar el trabajo que ha creado.