Vue d’ensemble de la sémantique des graphiques

2025-05-29

S’applique à : ✅Microsoft Fabric

La sémantique de graphe vous permet de modéliser et d’interroger des données en tant que réseaux interconnectés. Un graphique se compose de nœuds (entités) et de bords (relations) qui les connectent. Les nœuds et les arêtes peuvent contenir des propriétés, créant un modèle de données enrichi pour des relations complexes.

Les graphiques excellent pour représenter des données complexes avec des relations plusieurs-à-plusieurs, des structures hiérarchiques ou des connexions réseau, telles que les réseaux sociaux, les systèmes de recommandation, les ressources connectées et les graphiques de connaissances. Contrairement aux bases de données relationnelles qui nécessitent des index et des jointures pour connecter des données entre les tables, les graphiques utilisent une adjudance directe entre les nœuds, ce qui permet une traversée rapide et intuitive des relations.

Le graphique suivant illustre un scénario de chemin d’accès aux attaques de cybersécurité. Les nœuds représentent des entités telles que des sources externes, des utilisateurs et des ressources critiques, tandis que les arêtes représentent des actions ou des relations qui forment une séquence d’attaque potentielle.

Graphique montrant le scénario de cybersécurité, y compris l’e-mail de hameçonnage et le chemin d’accès à une base de données sensible.

Les requêtes de graphe tirent parti de la structure de graphique pour effectuer des opérations sophistiquées telles que la recherche de chemins, de modèles, de distances les plus courtes, de communautés et de mesures de centralité. Ces fonctionnalités rendent les graphiques puissants pour la modélisation des relations, des interactions, des dépendances et des flux entre les domaines, notamment les réseaux sociaux, les chaînes d’approvisionnement, les réseaux d’appareils IoT, les jumeaux numériques, les systèmes de recommandation et les structures organisationnelles.

Le graphique suivant montre un scénario de chaîne d’approvisionnement où les nœuds représentent des fournisseurs, des fabricants et des distributeurs, et les arêtes représentent des relations d’approvisionnement. Cet exemple montre comment les graphiques modélisent les flux et les dépendances entre différents contextes métier.

Graphique de deux fournisseurs, fabricants et distributeurs et relation d’approvisionnement.

Pourquoi utiliser la sémantique des graphiques ?

Les fonctionnalités de graphe offrent des avantages significatifs en tirant parti des investissements existants en matière de données tout en ajoutant une modélisation de relation sophistiquée :

Aucune migration de données requise : créez des modèles de graphique directement à partir de données actuelles sans duplication.
Solution économique : élimine la complexité et les dépenses des bases de données de graphe dédiées.
Prise en charge de l’analyse temporelle : en tant que base de données de série chronologique, vous pouvez naturellement analyser la façon dont les graphiques évoluent au fil du temps.
Modélisation basée sur les événements : modélise les graphiques sous forme de séquences d’événements de relation, en s’alignant sur des fonctionnalités de traitement d’événements fortes.
Intégration transparente de KQL : les opérateurs Graph fonctionnent en même temps que toutes les fonctionnalités KQL existantes avec une prise en charge complète d’IntelliSense.

Cette approche offre une modélisation des relations de niveau entreprise tout en conservant les performances, la mise à l’échelle et une interface familière. Les organisations peuvent analyser des données interconnectées complexes entre différents domaines, des chaînes d’approvisionnement et des hiérarchies organisationnelles aux réseaux d’appareils IoT et aux relations sociales, sans investissements supplémentaires en infrastructure.

Approche de création de graphiques temporaires

Les graphiques temporaires sont créés dynamiquement à l’aide de l’opérateur make-graph . Ces graphiques existent en mémoire pendant l’exécution de la requête et sont automatiquement ignorés une fois la requête terminée.

Principales caractéristiques

Création dynamique : générée à partir de données tabulaires à l’aide de requêtes KQL avec la structure entière résidant en mémoire
Disponibilité immédiate - Aucune configuration requise pour le prétraitement ou la configuration
Contraintes de mémoire : la taille du graphique est limitée par la mémoire disponible sur les nœuds de cluster
Facteurs de performance : la topologie et les tailles de propriétés graphes déterminent les besoins en mémoire

Cette approche est optimale pour les jeux de données de taille inférieure à moyenne, où l’analyse immédiate est nécessaire.

Cas d’usage pour les graphiques temporaires

Les graphiques transitoires excellent dans plusieurs scénarios :

Analyse ad hoc - Enquêtes ponctuelles nécessitant un examen rapide du modèle
Analyse exploratoire des données - Tester des hypothèses et valider des approches analytiques
Petits à moyens ensembles de données : analyse en temps réel des événements récents ou des sous-ensembles de données ciblés
Prototypage rapide - Test des modèles de graphique avant d’implémenter des modèles persistants
Analyse dynamique des données - Données fréquemment modifiées qui ne justifient pas le stockage persistant

Les applications courantes incluent la surveillance IoT en temps réel, l’analyse des relations de la chaîne logistique, le mappage du parcours client et tout scénario nécessitant une visualisation immédiate des relations d’entité.

Approche de création de graphiques persistants

Les graphiques persistants utilisent des modèles graphiques et des instantanés de graphiques pour fournir des solutions robustes pour les graphiques à grande échelle, complexes représentant des réseaux organisationnels, des chaînes d’approvisionnement, des écosystèmes IoT, des jumeaux numériques et d’autres domaines de données interconnectés.

Caractéristiques clés des graphiques persistants

Stockage persistant : les modèles graph et les instantanés sont stockés dans les métadonnées de base de données pour la durabilité et la cohérence
Scalabilité - Gérer les graphiques dépassant les limitations de mémoire avec les fonctionnalités d’analyse à l’échelle de l’entreprise
Réutilisation : plusieurs utilisateurs peuvent interroger la même structure sans regénérer, ce qui permet une analyse collaborative
Optimisation des performances - Éliminer la latence de construction de graphique pour les requêtes répétées
Contrôle de version : plusieurs instantanés représentent des graphiques à différents moments pour l’analyse historique
Support des schémas - Définitions structurées pour différents types d’entités et leurs propriétés

La fonctionnalité de schéma prend en charge les étiquettes statiques (prédéfinies dans le modèle de graphique) et les étiquettes dynamiques (générées au moment de l’exécution à partir de données), offrant une flexibilité pour les environnements complexes avec différents types d’entités.

Cas d’usage pour les graphiques persistants

Les graphiques persistants sont essentiels pour :

Analytique d’entreprise - Flux de travail de supervision continue sur des réseaux complexes
Analyse des données à grande échelle - Graphiques à l’échelle de l’entreprise avec des millions de nœuds et de relations
Analyse collaborative - Plusieurs équipes travaillant avec des structures de graphe partagées
Flux de travail de production - Systèmes automatisés nécessitant un accès cohérent aux graphiques
Comparaison historique - Analyse basée sur le temps de l’évolution des graphiques et des modifications

Exemple : graphe persistant de jumeaux numériques

Un graphique montrant l'exemple d'usine de jumeaux numériques avec les relations des appareils et les dépendances des équipements.

Dans les scénarios de jumeau numérique et IoT, les graphiques persistants prennent en charge l’analyse régulière des relations des appareils, des dépendances d’équipement et de l’évolution du système au fil du temps. L’analyse historique permet de comparer les états système sur différentes périodes, de suivre l’évolution des actifs et d’effectuer une analyse des tendances à long terme.

Exemple : Graphe persistant IoT et jumeau numérique

Les applications IoT et de jumeau numérique bénéficient considérablement des graphiques persistants lors de la modélisation de relations complexes entre les appareils physiques et leurs représentations virtuelles entre les systèmes distribués. Ces graphiques permettent aux organisations de :

Créer des modèles complets de déploiements IoT et de ressources connectées
Prendre en charge la surveillance en temps réel, la maintenance prédictive et l’optimisation des performances
Analyser les dépendances d’équipement et identifier les points d’échec potentiels
Optimiser les placements des capteurs par le biais de la compréhension de la topologie physique et logique
Suivre les configurations d’appareil, les communications et les caractéristiques de performances au fil du temps
Détecter les anomalies du modèle de communication et visualiser l’évolution de l’environnement intelligent
Simuler des conditions d’exploitation avant d’implémenter des modifications d’infrastructure physique

Cette approche persistante est inestimable pour la gestion des écosystèmes IoT complexes à grande échelle.

Fonctionnalités d’interrogation de graphes

Une fois qu'un graphique est établi (via make-graph ou à partir d'un instantané), vous pouvez tirer parti de la suite complète d'opérateurs de graphique KQL pour une analyse approfondie.

Opérateurs principaux :

graph-match - Permet des opérations sophistiquées de correspondance de modèles et de traversées pour identifier des séquences de relations complexes
graph-shortest-paths - Recherche des chemins optimaux entre les entités, ce qui permet de hiérarchiser les connexions et d’identifier les relations critiques
graph-to-table - Convertit les résultats d’analyse de graphique en format tabulaire pour l’intégration avec les systèmes existants

Fonctionnalités d’analyse avancées :

Analyse basée sur le temps - Examiner la façon dont les relations et les modèles évoluent au fil du temps
Intégration géospatiale - Combiner des données de graphe avec l’intelligence basée sur l’emplacement pour l’analyse des modèles géographiques
Intégration de Machine Learning - Appliquer des algorithmes pour le clustering d’entités, la classification des modèles et la détection d’anomalies

Ces fonctionnalités prennent en charge divers cas d’usage, notamment l’analyse du parcours client, les systèmes de recommandation de produits, les réseaux IoT, les jumeaux numériques et les graphiques de connaissances.

Choix de l’approche appropriée

L’arbre de décision suivant vous aide à sélectionner l’approche de création de graphique la plus appropriée en fonction de vos exigences et contraintes spécifiques.

Arbre de décision : graphiques temporaires ou persistants

Organigramme montrant un arbre de décision pour quand utiliser des graphiques persistants ou temporaires.

Quand utiliser des graphiques temporaires

Choisissez des graphiques transitoires pour :

Taille du graphique inférieure à 10 millions de nœuds et arêtes (pour des performances optimales)
Analyse d’un seul utilisateur ou d’une petite équipe avec des exigences de collaboration minimales
Enquêtes ponctuelles ou exploratoires où des résultats immédiats sont nécessaires
Analyse des données en temps réel nécessitant des informations d’état actuelles
Prototypage rapide et test des modèles de graphe et de la logique de requête

Bien que les graphiques temporaires puissent gérer des jeux de données plus volumineux, le temps d’exécution des requêtes augmente à mesure que le graphique doit être reconstruit pour chaque requête. Tenez compte de ce compromis en matière de performances lors de l’utilisation de jeux de données plus volumineux.

Quand utiliser des graphiques persistants

Choisissez des graphiques persistants pour :

Taille du graphique dépassant 10 millions de nœuds et arêtes où le stockage distribué est bénéfique
Plusieurs équipes nécessitant un accès partagé pour l’analyse collaborative
Analyse répétée sur les jeux de données stables où la latence de construction a un impact sur la productivité
Intégration de flux de travail de production nécessitant un accès cohérent et fiable aux graphiques
Exigences de comparaison historique pour le suivi des modifications au fil du temps
Limitations de capacité de mémoire affectant les performances des requêtes
Flux de travail d’investigation collaboratifs entre les équipes et les fuseaux horaires

Les graphiques persistants sont essentiels lors de l’utilisation de données à l’échelle de l’entreprise ou lorsque les limitations de mémoire affectent les performances.

Considérations relatives aux performances

Utilisation de la mémoire

Graphiques temporaires - Limités par une mémoire de nœud de cluster unique, limitant l’utilisation aux jeux de données au sein de la RAM disponible
Graphiques persistants - Tirer parti du stockage distribué et des modèles d’accès optimisés pour les données à l’échelle de l’entreprise

Latence des requêtes

Graphiques temporaires : inclure le temps de construction dans chaque requête, avec des retards croissants pour les jeux de données volumineux ou les sources de données externes
Graphes persistants - Éliminer la latence de construction par le biais d’instantanés préconstruits pour permettre une analyse rapide

Les dépendances de source de données externes, telles que les requêtes inter-clusters ou les tables externes vers SQL et CosmosDB, peuvent affecter considérablement le temps de construction du graphique temporaire, car chaque requête doit attendre des réponses externes.

Actualisation des données

Graphiques temporaires - Toujours refléter l’état des données actuel, idéal pour l’analyse en temps réel
Graphiques persistants - Refléter les données au moment de la création d’instantanés, fournissant une cohérence pour l’analyse collaborative, mais nécessitant des actualisations périodiques

Intégration à l’écosystème KQL

La sémantique de graphe s’intègre parfaitement aux fonctionnalités plus larges de KQL :

Analyse de série chronologique - Suivre l’évolution des relations au fil du temps
Fonctions géospatiales - Analyser les modèles basés sur l’emplacement et les anomalies géographiques
Opérateurs Machine Learning - Détecter des modèles, classifier des comportements et identifier les anomalies
Opérateurs scalaires et tabulaires - Activer des transformations complexes, des agrégations et un enrichissement des données

Cette intégration permet des flux de travail sophistiqués, notamment le suivi de l’évolution de la chaîne d’approvisionnement, l’analyse de la distribution des ressources géographiques, la détection de la communauté par le biais d’algorithmes de clustering et la corrélation d’insights sur les graphiques avec l’analyse traditionnelle des journaux et l’intelligence externe.