Notes
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
La sémantique de graphe vous permet de modéliser et d’interroger des données en tant que réseaux interconnectés. Un graphique se compose de nœuds (entités) et de bords (relations) qui les connectent. Les nœuds et les arêtes peuvent contenir des propriétés, créant un modèle de données enrichi pour des relations complexes.
Les graphiques excellent pour représenter des données complexes avec des relations plusieurs-à-plusieurs, des structures hiérarchiques ou des connexions réseau, telles que les réseaux sociaux, les systèmes de recommandation, les ressources connectées et les graphiques de connaissances. Contrairement aux bases de données relationnelles qui nécessitent des index et des jointures pour connecter des données entre les tables, les graphiques utilisent une adjudance directe entre les nœuds, ce qui permet une traversée rapide et intuitive des relations.
Le graphique suivant illustre un scénario de chemin d’accès aux attaques de cybersécurité. Les nœuds représentent des entités telles que des sources externes, des utilisateurs et des ressources critiques, tandis que les arêtes représentent des actions ou des relations qui forment une séquence d’attaque potentielle.
Les requêtes de graphe tirent parti de la structure de graphique pour effectuer des opérations sophistiquées telles que la recherche de chemins, de modèles, de distances les plus courtes, de communautés et de mesures de centralité. Ces fonctionnalités rendent les graphiques puissants pour la modélisation des relations, des interactions, des dépendances et des flux entre les domaines, notamment les réseaux sociaux, les chaînes d’approvisionnement, les réseaux d’appareils IoT, les jumeaux numériques, les systèmes de recommandation et les structures organisationnelles.
Le graphique suivant montre un scénario de chaîne d’approvisionnement où les nœuds représentent des fournisseurs, des fabricants et des distributeurs, et les arêtes représentent des relations d’approvisionnement. Cet exemple montre comment les graphiques modélisent les flux et les dépendances entre différents contextes métier.
Pourquoi utiliser la sémantique des graphiques ?
Les fonctionnalités de graphe offrent des avantages significatifs en tirant parti des investissements existants en matière de données tout en ajoutant une modélisation de relation sophistiquée :
- Aucune migration de données requise : créez des modèles de graphique directement à partir de données actuelles sans duplication.
- Solution économique : élimine la complexité et les dépenses des bases de données de graphe dédiées.
- Prise en charge de l’analyse temporelle : en tant que base de données de série chronologique, vous pouvez naturellement analyser la façon dont les graphiques évoluent au fil du temps.
- Modélisation basée sur les événements : modélise les graphiques sous forme de séquences d’événements de relation, en s’alignant sur des fonctionnalités de traitement d’événements fortes.
- Intégration transparente de KQL : les opérateurs Graph fonctionnent en même temps que toutes les fonctionnalités KQL existantes avec une prise en charge complète d’IntelliSense.
Cette approche offre une modélisation des relations de niveau entreprise tout en conservant les performances, la mise à l’échelle et une interface familière. Les organisations peuvent analyser des données interconnectées complexes entre différents domaines, des chaînes d’approvisionnement et des hiérarchies organisationnelles aux réseaux d’appareils IoT et aux relations sociales, sans investissements supplémentaires en infrastructure.
Approche de création de graphiques temporaires
Les graphiques temporaires sont créés dynamiquement à l’aide de l’opérateur make-graph
. Ces graphiques existent en mémoire pendant l’exécution de la requête et sont automatiquement ignorés une fois la requête terminée.
Principales caractéristiques
- Création dynamique : générée à partir de données tabulaires à l’aide de requêtes KQL avec la structure entière résidant en mémoire
- Disponibilité immédiate - Aucune configuration requise pour le prétraitement ou la configuration
- Contraintes de mémoire : la taille du graphique est limitée par la mémoire disponible sur les nœuds de cluster
- Facteurs de performance : la topologie et les tailles de propriétés graphes déterminent les besoins en mémoire
Cette approche est optimale pour les jeux de données de taille inférieure à moyenne, où l’analyse immédiate est nécessaire.
Cas d’usage pour les graphiques temporaires
Les graphiques transitoires excellent dans plusieurs scénarios :
- Analyse ad hoc - Enquêtes ponctuelles nécessitant un examen rapide du modèle
- Analyse exploratoire des données - Tester des hypothèses et valider des approches analytiques
- Petits à moyens ensembles de données : analyse en temps réel des événements récents ou des sous-ensembles de données ciblés
- Prototypage rapide - Test des modèles de graphique avant d’implémenter des modèles persistants
- Analyse dynamique des données - Données fréquemment modifiées qui ne justifient pas le stockage persistant
Les applications courantes incluent la surveillance IoT en temps réel, l’analyse des relations de la chaîne logistique, le mappage du parcours client et tout scénario nécessitant une visualisation immédiate des relations d’entité.
Approche de création de graphiques persistants
Les graphiques persistants utilisent des modèlesgraphiques et des instantanés de graphiques pour fournir des solutions robustes pour les graphiques à grande échelle, complexes représentant des réseaux organisationnels, des chaînes d’approvisionnement, des écosystèmes IoT, des jumeaux numériques et d’autres domaines de données interconnectés.
Caractéristiques clés des graphiques persistants
- Stockage persistant : les modèles graph et les instantanés sont stockés dans les métadonnées de base de données pour la durabilité et la cohérence
- Scalabilité - Gérer les graphiques dépassant les limitations de mémoire avec les fonctionnalités d’analyse à l’échelle de l’entreprise
- Réutilisation : plusieurs utilisateurs peuvent interroger la même structure sans regénérer, ce qui permet une analyse collaborative
- Optimisation des performances - Éliminer la latence de construction de graphique pour les requêtes répétées
- Contrôle de version : plusieurs instantanés représentent des graphiques à différents moments pour l’analyse historique
- Support des schémas - Définitions structurées pour différents types d’entités et leurs propriétés
La fonctionnalité de schéma prend en charge les étiquettes statiques (prédéfinies dans le modèle de graphique) et les étiquettes dynamiques (générées au moment de l’exécution à partir de données), offrant une flexibilité pour les environnements complexes avec différents types d’entités.
Cas d’usage pour les graphiques persistants
Les graphiques persistants sont essentiels pour :
- Analytique d’entreprise - Flux de travail de supervision continue sur des réseaux complexes
- Analyse des données à grande échelle - Graphiques à l’échelle de l’entreprise avec des millions de nœuds et de relations
- Analyse collaborative - Plusieurs équipes travaillant avec des structures de graphe partagées
- Flux de travail de production - Systèmes automatisés nécessitant un accès cohérent aux graphiques
- Comparaison historique - Analyse basée sur le temps de l’évolution des graphiques et des modifications
Exemple : graphe persistant de jumeaux numériques
Dans les scénarios de jumeau numérique et IoT, les graphiques persistants prennent en charge l’analyse régulière des relations des appareils, des dépendances d’équipement et de l’évolution du système au fil du temps. L’analyse historique permet de comparer les états système sur différentes périodes, de suivre l’évolution des actifs et d’effectuer une analyse des tendances à long terme.
Exemple : Graphe persistant IoT et jumeau numérique
Les applications IoT et de jumeau numérique bénéficient considérablement des graphiques persistants lors de la modélisation de relations complexes entre les appareils physiques et leurs représentations virtuelles entre les systèmes distribués. Ces graphiques permettent aux organisations de :
- Créer des modèles complets de déploiements IoT et de ressources connectées
- Prendre en charge la surveillance en temps réel, la maintenance prédictive et l’optimisation des performances
- Analyser les dépendances d’équipement et identifier les points d’échec potentiels
- Optimiser les placements des capteurs par le biais de la compréhension de la topologie physique et logique
- Suivre les configurations d’appareil, les communications et les caractéristiques de performances au fil du temps
- Détecter les anomalies du modèle de communication et visualiser l’évolution de l’environnement intelligent
- Simuler des conditions d’exploitation avant d’implémenter des modifications d’infrastructure physique
Cette approche persistante est inestimable pour la gestion des écosystèmes IoT complexes à grande échelle.
Fonctionnalités d’interrogation de graphes
Une fois qu'un graphique est établi (via make-graph
ou à partir d'un instantané), vous pouvez tirer parti de la suite complète d'opérateurs de graphique KQL pour une analyse approfondie.
Opérateurs principaux :
-
graph-match
- Permet des opérations sophistiquées de correspondance de modèles et de traversées pour identifier des séquences de relations complexes -
graph-shortest-paths
- Recherche des chemins optimaux entre les entités, ce qui permet de hiérarchiser les connexions et d’identifier les relations critiques -
graph-to-table
- Convertit les résultats d’analyse de graphique en format tabulaire pour l’intégration avec les systèmes existants
Fonctionnalités d’analyse avancées :
- Analyse basée sur le temps - Examiner la façon dont les relations et les modèles évoluent au fil du temps
- Intégration géospatiale - Combiner des données de graphe avec l’intelligence basée sur l’emplacement pour l’analyse des modèles géographiques
- Intégration de Machine Learning - Appliquer des algorithmes pour le clustering d’entités, la classification des modèles et la détection d’anomalies
Ces fonctionnalités prennent en charge divers cas d’usage, notamment l’analyse du parcours client, les systèmes de recommandation de produits, les réseaux IoT, les jumeaux numériques et les graphiques de connaissances.
Choix de l’approche appropriée
L’arbre de décision suivant vous aide à sélectionner l’approche de création de graphique la plus appropriée en fonction de vos exigences et contraintes spécifiques.
Arbre de décision : graphiques temporaires ou persistants
Quand utiliser des graphiques temporaires
Choisissez des graphiques transitoires pour :
- Taille du graphique inférieure à 10 millions de nœuds et arêtes (pour des performances optimales)
- Analyse d’un seul utilisateur ou d’une petite équipe avec des exigences de collaboration minimales
- Enquêtes ponctuelles ou exploratoires où des résultats immédiats sont nécessaires
- Analyse des données en temps réel nécessitant des informations d’état actuelles
- Prototypage rapide et test des modèles de graphe et de la logique de requête
Bien que les graphiques temporaires puissent gérer des jeux de données plus volumineux, le temps d’exécution des requêtes augmente à mesure que le graphique doit être reconstruit pour chaque requête. Tenez compte de ce compromis en matière de performances lors de l’utilisation de jeux de données plus volumineux.
Quand utiliser des graphiques persistants
Choisissez des graphiques persistants pour :
- Taille du graphique dépassant 10 millions de nœuds et arêtes où le stockage distribué est bénéfique
- Plusieurs équipes nécessitant un accès partagé pour l’analyse collaborative
- Analyse répétée sur les jeux de données stables où la latence de construction a un impact sur la productivité
- Intégration de flux de travail de production nécessitant un accès cohérent et fiable aux graphiques
- Exigences de comparaison historique pour le suivi des modifications au fil du temps
- Limitations de capacité de mémoire affectant les performances des requêtes
- Flux de travail d’investigation collaboratifs entre les équipes et les fuseaux horaires
Les graphiques persistants sont essentiels lors de l’utilisation de données à l’échelle de l’entreprise ou lorsque les limitations de mémoire affectent les performances.
Considérations relatives aux performances
Utilisation de la mémoire
- Graphiques temporaires - Limités par une mémoire de nœud de cluster unique, limitant l’utilisation aux jeux de données au sein de la RAM disponible
- Graphiques persistants - Tirer parti du stockage distribué et des modèles d’accès optimisés pour les données à l’échelle de l’entreprise
Latence des requêtes
- Graphiques temporaires : inclure le temps de construction dans chaque requête, avec des retards croissants pour les jeux de données volumineux ou les sources de données externes
- Graphes persistants - Éliminer la latence de construction par le biais d’instantanés préconstruits pour permettre une analyse rapide
Les dépendances de source de données externes, telles que les requêtes inter-clusters ou les tables externes vers SQL et CosmosDB, peuvent affecter considérablement le temps de construction du graphique temporaire, car chaque requête doit attendre des réponses externes.
Actualisation des données
- Graphiques temporaires - Toujours refléter l’état des données actuel, idéal pour l’analyse en temps réel
- Graphiques persistants - Refléter les données au moment de la création d’instantanés, fournissant une cohérence pour l’analyse collaborative, mais nécessitant des actualisations périodiques
Intégration à l’écosystème KQL
La sémantique de graphe s’intègre parfaitement aux fonctionnalités plus larges de KQL :
- Analyse de série chronologique - Suivre l’évolution des relations au fil du temps
- Fonctions géospatiales - Analyser les modèles basés sur l’emplacement et les anomalies géographiques
- Opérateurs Machine Learning - Détecter des modèles, classifier des comportements et identifier les anomalies
- Opérateurs scalaires et tabulaires - Activer des transformations complexes, des agrégations et un enrichissement des données
Cette intégration permet des flux de travail sophistiqués, notamment le suivi de l’évolution de la chaîne d’approvisionnement, l’analyse de la distribution des ressources géographiques, la détection de la communauté par le biais d’algorithmes de clustering et la corrélation d’insights sur les graphiques avec l’analyse traditionnelle des journaux et l’intelligence externe.