Qu’est-ce qu’une base de données de graphe ?

Une base de données de graphe est un type de base de données qui représente des informations sous forme de nœuds (entités) et de bords (relations) au lieu de tables et de lignes. Cette structure facilite l’exploration de connexions et de modèles complexes sur vos données.

Le type de base de données de graphe le plus couramment utilisé implémente le modèle LPG (Labeled Property Graph) : les entités (nœuds) et les relations (arêtes) peuvent avoir des étiquettes et des propriétés (paires clé-valeur). Ce modèle flexible permet des conceptions à la fois sans schéma obligatoire et dictées par un schéma, et vous permet d'exprimer des relations complexes de données. Étant donné que les connexions sont stockées explicitement en tant que périphéries, les requêtes parcourent les relations en suivant des arêtes au lieu de calculer des jointures coûteuses au moment de la requête.

Note

Les exemples de cet article utilisent l’exemple de jeu de données de graphique de réseau social.

Concepts fondamentaux de la base de données Graph

Une base de données de graphe organise les données en trois blocs de construction fondamentaux :

Les nœuds représentent des entités telles que des personnes, des produits ou des lieux. Les nœuds peuvent avoir des étiquettes et des propriétés qui décrivent leurs attributs. Par exemple, un Person nœud peut avoir des propriétés telles que firstName, lastNameet age.
Les arêtes représentent la façon dont les entités sont connectées, par exemple FRIENDS_WITH, PURCHASEDou LOCATED_IN. Les arêtes peuvent également porter des propriétés et des étiquettes pour capturer les métadonnées de relation.
Les propriétés attachent des détails aux nœuds et aux arêtes (par exemple, le nom d’une personne ou le bord depuis la date).

Comment fonctionne l'interrogation des relations

Les requêtes Graph récupèrent les informations connectées en passant d’un nœud de départ à ses voisins, puis à leurs voisins, et ainsi de suite. Le coût d’un parcours dépend du nombre de bords qu’il touche (le quartier local), et non de la taille totale du jeu de données. Cette caractéristique permet d'exprimer naturellement et efficacement des questions sur les chemins d’accès, les connexions et les modèles, tels que les amis d’amis, les chemins les plus courts ou les dépendances multi-tronçons.

Les bases de données graphes utilisent des langages de requête basés sur des modèles, tels que le langage de requête Graph (GQL) pour décrire ces traversées de manière concise. Le même groupe de travail international qui supervise SQL (ISO/IEC 39075) standardise GQL, qui aligne l’interrogation de graphiques avec les normes de base de données établies.

Exemple (correspondance de modèle avec GQL) :

MATCH (p:Person {firstName: "Annemarie"})-[:knows]->(friend)-[:likes]->(c:Comment)
RETURN c
ORDER BY c.creationDate
LIMIT 100

Ce modèle s'interprète comme suit : à partir du nœud Personne pour Annemarie, suivez :knows les arêtes vers chaque nœud ami, puis suivez les arêtes :likes vers les nœuds associés :Comment. Retournez le 100 plus récent de ces commentaires classés par leur date de création.

Raisonnement graphique assisté par l’IA (aperçu)

Les bases de données graphes sont parfaitement adaptées au raisonnement de l'IA, car elles encodent les relations dont les modèles de langage ont besoin pour répondre avec précision aux questions à plusieurs étapes. Dans Microsoft Fabric, Fabric Data Agent prend en charge le graphique comme source de données, ce qui permet aux utilisateurs de poser des questions en langage naturel auxquelles l’agent répond en interrogeant le graphique. Pour plus d’informations sur la façon dont NL2GQL traduit le langage naturel en langage GQL, consultez l’annonce du raisonnement d’IA alimenté par Graph.

Flexibilité du modèle de données et du schéma de graphe

Les modèles de données graphiques sont optionnels au niveau du schéma : vous pouvez commencer avec un modèle flexible et le formaliser progressivement. Dans le graphique de Microsoft Fabric, les changements structurels, tels que l’ajout de nouvelles propriétés, la modification d’étiquettes ou la modification des types de relations, nécessitent actuellement la réutilisation des données dans un nouveau modèle. Cette approche réduit la nécessité d’une duplication des données et permet aux équipes d’unifier les données de plusieurs sources sans remaniement initial. Pour plus d'informations sur le modèle de données utilisé dans le graphe dans Microsoft Fabric, consultez Graphes de propriétés étiquetés.

Utilisations courantes pour les bases de données de graphe

Les bases de données graphes s’alignent étroitement sur les domaines où les connexions génèrent de la valeur, tels que :

Réseaux sociaux : modèles de relations entre les personnes et leurs interactions
Graphiques de connaissances : connecter des concepts, des entités et des faits pour la recherche sémantique et le raisonnement
Systèmes de recommandation : parcourir les interactions utilisateur-élément pour exposer des suggestions personnalisées
Réseaux de fraude et de risque : détecter des modèles suspects entre les comptes, les transactions et les appareils
Topologie réseau et informatique : mapper les dépendances entre les serveurs, les services et les composants d’infrastructure
Analyse des dépendances de la chaîne d’approvisionnement : origines et relations des composants de trace entre les fournisseurs
Génération augmentée par récupération basée sur des graphes (RAG) : utilisez la structure de graphes comme source de connaissances pour les agents IA qui ont besoin d'un raisonnement multi-étapes avec des réponses explicables et fondées.

Dans ces scénarios, les questions concernent moins les enregistrements uniques et davantage le nombre d’entités qui se lient et interagissent sur plusieurs sauts.

Quand prendre en compte une base de données de graphe

Une base de données de graphe est un choix judicieux lorsque les relations sont au cœur des questions essentielles auxquelles vous devez répondre. Choisissez une base de données de graphe quand :

Vos questions principales impliquent des chemins, des quartiers et des modèles dans les données connectées.
Le nombre de tronçons est variable ou non connu à l’avance.
Vous devez combiner et parcourir les relations entre des jeux de données disparates.

Si vous posez régulièrement ces types de questions, un modèle de graphe est un ajustement naturel.

Comment le graphique dans Microsoft Fabric se compare aux bases de données de graphiques autonomes

La représentation de vos données sous la forme d’un graphe et leur stockage dans une base de données de graphe autonome distincte introduisent souvent une charge liée à l'ETL (extraction, transformation, chargement) et à la gouvernance. En revanche, le graphique dans Microsoft Fabric fonctionne directement sur OneLake, ce qui réduit ou élimine la nécessité de pipelines ETL séparés et les duplications de données. Tenez compte de ces compromis :

Déplacement et duplication des données : les bases de données de graphe autonomes nécessitent généralement l’extraction, la transformation et le chargement de données dans un magasin distinct, ce qui augmente la complexité et peut entraîner des jeux de données en double. Graph fonctionne sur OneLake pour que vous puissiez modéliser et interroger des données connectées sans les déplacer.
Coûts opérationnels : les piles de graphiques autonomes s’exécutent en tant que clusters ou services distincts et comportent souvent des frais de capacité inactive. Dans le graphe, les charges de travail consomment des unités de capacité mutualisées avec des métriques de réduction automatique et centralisées, ce qui simplifie les opérations et peut réduire les coûts.
Scalabilité : certaines bases de données de graphe autonomes dépendent d’une extension verticale ou d’un regroupement spécifique au fournisseur. Graph est conçu pour les grands graphiques et utilise la fragmentation évolutive sur plusieurs processus pour gérer efficacement les charges de travail de données massives.
Outils et compétences : les systèmes graphiques spécifiques au fournisseur peuvent nécessiter des langages spécialisés et des infrastructures analytiques distinctes. Graph fournit une modélisation unifiée, des requêtes standardisées (GQL), des algorithmes d’analyse de graphes intégrés, une intégration BI et IA, y compris une prise en charge par Fabric Data Agent des requêtes en langage naturel sur les graphes (préversion), et des outils exploratoires à faible code/sans code. Ces fonctionnalités permettent à un ensemble plus large d’utilisateurs d’utiliser des données connectées.
Gouvernance et sécurité : les déploiements de graphiques distincts nécessitent des configurations de gouvernance et de sécurité indépendantes. Graph utilise la gouvernance OneLake, la traçabilité et le contrôle d’accès en fonction du rôle (RBAC) pour que la conformité, l’audit et les autorisations restent cohérentes avec le reste de votre environnement Fabric.

Commentaires

Cette page a-t-elle été utile ?

Last updated on 2026-06-02