Compartir a través de


Azure Cosmos DB: casos de uso de análisis sin ETL

SE APLICA A: NoSQL MongoDB Gremlin

Azure Cosmos DB proporciona varias opciones de análisis para el análisis sin ETL, casi en tiempo real sobre los datos operativos. Puede habilitar el análisis en los datos de Azure Cosmos DB mediante las siguientes opciones:

  • Creación de reflejo de Azure Cosmos DB en Microsoft Fabric
  • Azure Synapse Link para Azure Cosmos DB

Para más información sobre estas opciones, consulte "Análisis y BI en los datos de Azure Cosmos DB".

Importante

La creación de reflejo de Azure Cosmos DB en Microsoft Fabric ya está disponible en versión preliminar para la API NoSql. Esta característica proporciona todas las funcionalidades de Azure Synapse Link con un mejor rendimiento analítico, capacidad para unificar el patrimonio de datos con Fabric OneLake y abrir el acceso a los datos en OneLake con formato Delta Parquet. Si está considerando Azure Synapse Link, le recomendamos probar la creación de reflejo para evaluar si es la solución adecuada para su organización. Para empezar a crear reflejo, haga clic aquí.

No-ETL, el análisis casi en tiempo real puede abrir varias posibilidades para sus empresas. Estos son tres escenarios de ejemplo:

  • Análisis, previsiones e informes de la cadena de suministro
  • Personalización en tiempo real
  • Mantenimiento predictivo y detección de anomalías en escenarios de IoT

Análisis, previsiones e informes de la cadena de suministro

Los estudios de investigación demuestran que integrar análisis de macrodatos en las operaciones de la cadena de suministro conducen a mejoras en los tiempos de entrega del ciclo de pedidos y la eficacia de la cadena de suministro.

Los fabricantes están incorporando tecnologías nativas de la nube para liberarse de las restricciones de los sistemas heredados de planeación de recursos empresariales (ERP) y de administración de cadenas de suministro (SCM). Con cadenas de suministro que generan volúmenes cada vez mayores de datos operativos cada minuto (pedidos, envíos, datos de transacciones), los fabricantes necesitan una base de datos operativa. Esta base de datos operativa se debe escalar para controlar los volúmenes de datos, así como una plataforma analítica para lograr un nivel de inteligencia contextual en tiempo real para mantenerse a la vanguardia.

La siguiente arquitectura muestra la eficacia de usar Azure Cosmos DB como base de datos operativa nativa de nube en el análisis de la cadena de suministro:

Diagrama de análisis en tiempo real para Azure Cosmos DB en la cadena de suministro.

En función de la arquitectura anterior, puede lograr los siguientes casos de uso:

  • Preparación y entrenamiento de una canalización predictiva: genere conclusiones sobre los datos operativos de toda la cadena de suministro mediante el aprendizaje automático. De esta manera, puede reducir los costos de inventario y operaciones, así como reducir los tiempos de entrega de pedidos para los clientes.

La creación de reflejo y Synapse Link le permiten analizar los datos operativos variables en Azure Cosmos DB sin ningún proceso ETL manual. Estas ofertas le ahorran costos adicionales, latencia y complejidad operativa. Permiten a los ingenieros y científicos de datos crear canalizaciones predictivas sólidas:

  • Consulte los datos operativos de Azure Cosmos DB mediante la integración nativa con grupos de Apache Spark en Microsoft Fabric o Azure Synapse Analytics. Puede consultar los datos en un cuaderno interactivo o en trabajos remotos programados sin necesidad de ingeniería de datos compleja.

  • Cree modelos de Machine Learning (ML) con algoritmos de Spark ML e integración de Azure Machine Learning (AML) en Microsoft Fabric o Azure Synapse Analytics.

  • Reescriba los resultados después de la inferencia del modelo en Azure Cosmos DB para calcular una puntuación operativa casi en tiempo real.

  • Informes operativos: los equipos de la cadena de suministro necesitan informes flexibles y personalizados sobre datos operativos precisos en tiempo real. Estos informes son necesarios para obtener una vista de instantánea de la eficacia, rentabilidad y productividad de la cadena de suministro. Permite que los analistas de datos y a otras partes interesadas evalúen constantemente el negocio e identifiquen las áreas que se van a ajustar para reducir los costos operativos.

La creación de reflejo y Synapse Link para Azure Cosmos DB habilitan escenarios de creación de informes/inteligencia empresarial enriquecidos:

  • Consulte los datos operativos de Azure Cosmos DB mediante la integración nativa con una expresividad completa del lenguaje T-SQL.

  • Modele y publique paneles de BI de actualización automática en Azure Cosmos DB a través de Power BI integrado en Microsoft Fabric o Azure Synapse Analytics.

A continuación se incluyen algunas instrucciones para la integración de los datos por lotes y la transmisión de datos en Azure Cosmos DB:

  • Orquestación e integración de datos por lotes: dado que las cadenas de suministro son cada vez más complejas, las plataformas de datos de cadena de suministro deben integrarse con diversos formatos y orígenes de datos. Microsoft Fabric y Azure Synapse incluyen el mismo motor de integración de datos y experiencias que Azure Data Factory. Esta integración permite a los ingenieros de datos crear canalizaciones de datos enriquecidas sin un motor de orquestación independiente:

  • Procesamiento e integración de la transmisión de datos: dado el crecimiento de IoT industrial (sensores que realizan un seguimiento de los recursos "de la planta a la tienda", flotas de logística conectadas, etc.), se genera una gran cantidad de datos en tiempo real en un flujo que debe integrarse con los datos de movimiento lento tradicionales para generar conclusiones. Azure Stream Analytics es un servicio recomendado para ETL y procesamiento del flujo de datos en Azure con una amplia variedad de escenarios. Azure Stream Analytics admite Azure Cosmos DB como receptor de datos nativo.

Personalización en tiempo real

Actualmente, los distribuidores deben crear soluciones de comercio electrónico seguras y escalables que satisfagan tanto las exigencias de los clientes como las de las empresas. Dichas soluciones de comercio electrónico deben atraer a los clientes con productos y ofertas personalizados, procesar las transacciones de forma rápida y segura, y centrarse en el cumplimiento y el servicio de atención al cliente. Azure Cosmos DB junto con la versión más reciente de Synapse Link para Azure Cosmos DB permite a los distribuidores generar recomendaciones personalizadas para los clientes en tiempo real. Usan la configuración de baja latencia y coherencia ajustable para obtener conclusiones inmediatas, tal como se muestra en la siguiente arquitectura:

Diagrama de Azure Cosmos DB en personalización en tiempo real.

  • Preparación y entrenamiento de una canalización predictiva: puede generar conclusiones sobre los datos operativos en sus unidades de negocio o en los segmentos de clientes mediante Fabric o Synapse Spark y modelos de aprendizaje automático. Esto genera una entrega personalizada a segmentos de clientes, experiencias de usuario final predictivas y marketing dirigido para satisfacer las necesidades de los usuarios finales. )

Mantenimiento predictivo de IoT

Las innovaciones en IoT industrial han reducido drásticamente los tiempos de inactividad de la maquinaria y han aumentado la eficacia general en todos los campos del sector. Una de estas innovaciones es el análisis de mantenimiento predictivo para maquinaria en el perímetro de la nube.

A continuación se muestra una arquitectura que usa las funcionalidades nativas de HTAP en la nube en el mantenimiento predictivo de IoT:

Diagrama de Azure Cosmos DB en mantenimiento predictivo de IOT.

  • Preparación y entrenamiento de una canalización predictiva: los datos operativos históricos de los sensores de dispositivos IoT se pueden usar para entrenar modelos predictivos, como los detectores de anomalías. Estos detectores de anomalías se vuelven a implementar en el perímetro para la supervisión en tiempo real. Este círculo virtuoso permite volver a entrenar de forma continua los modelos predictivos.

  • Informes operativos: gracias al crecimiento de las iniciativas de Digital Twins, las empresas recopilan grandes cantidades de datos operativos de un gran número de sensores para crear una copia digital de cada equipo. Estos datos alimentan a la inteligencia empresarial, que debe comprender las tendencias de los datos históricos, además de los datos de acceso frecuente.