Megjegyzés
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhat bejelentkezni vagy módosítani a címtárat.
Az oldalhoz való hozzáféréshez engedély szükséges. Megpróbálhatja módosítani a címtárat.
Megjegyzés:
Ez a funkció jelenleg nyilvános előzetes verzióban érhető el. Ez az előzetes verzió szolgáltatásszintű szerződés nélkül érhető el, és éles számítási feladatokhoz nem ajánlott. Előfordulhat, hogy bizonyos funkciók nem támogatottak, vagy korlátozott képességekkel rendelkeznek. További információ: Supplemental Terms of Use for Microsoft Azure Previews.
A gráfadatbázisok hatékony módszert kínálnak a csatlakoztatott adatok modellezésére és lekérdezésére. A táblákban adatokat tároló hagyományos relációs adatbázisoktól eltérően a gráfadatbázisok csomópontokként (entitásokként) és élekként (kapcsolatokként) jelölik az információkat, így egyszerűbbé válik az összetett kapcsolatok és minták rugalmasabb feltárása. Ez a cikk ismerteti a gráfadatbázisok alapvető fogalmait, a gráf lekérdezések működését, és ismerteti, hogy mikor érdemes gráfadatbázist használni a számítási feladathoz. Emellett összehasonlítja a Microsoft Fabric gráfjait a különálló gráfadatbázis-telepítésekkel.
A gráfadatbázis leggyakrabban használt típusa a címkézett tulajdonsággráf (LPG) modellt valósítja meg: az entitások (csomópontok) és a kapcsolatok (élek) címkékkel és tulajdonságokkal (kulcs-érték párokkal) rendelkezhetnek. Ez a rugalmas modell lehetővé teszi mind a séma-nélküli, mind a sémaalapú tervezést, és lehetőséget biztosít a gazdag szemantika kifejezésére. Mivel a kapcsolatok explicit módon élekként vannak tárolva, a lekérdezések az élek mentén haladva járják be a kapcsolatokat, ezzel elkerülve a drága illesztések számítását.
Fontos
Ez a cikk kizárólag a közösségi hálózati példa gráfdatasetet használja.
A Graph-adatbázis alapfogalmai
- A csomópontok entitásokat , például személyeket, termékeket vagy helyeket jelölnek. A csomópontok olyan címkéket és tulajdonságokat tartalmazhatnak, amelyek az attribútumaikat írják le. Egy személycsomópont például rendelkezhet olyan tulajdonságokkal, mint a firstName, a lastName és az age.
- Az élek az entitások kapcsolatát jelölik, például FRIENDS_WITH, PURCHASED vagy LOCATED_IN. Az élek tulajdonságokat és címkéket is tartalmazhatnak a kapcsolat metaadatainak kódolásához.
- A tulajdonságok a csomópontokhoz és élekhez csatolják a részleteket (például egy személy nevét vagy egy él dátumát). Mivel a kapcsolatok kifejezetten élekként vannak tárolva, a lekérdezések a gráfon való kapcsolatok követésével navigálnak, nem pedig a lekérdezés során számítva ki azokat.
Hogyan működik a kapcsolatok lekérdezése
A gráfos lekérdezések úgy kérnek le összekapcsolt adatokat, hogy elindulnak egy kezdő csomópontból, áthaladnak annak szomszédain, majd továbbhaladnak azok szomszédaihoz, és így tovább. A bejárási művelet az érintett élek számához (a helyi környékhez) van kötve, nem pedig az adathalmaz teljes méretéhez. Ez a jellemző természetessé és hatékonnyá teszi az útvonalakkal, kapcsolatokat és mintákat illető kérdések kifejezését, mint például a barátok barátai, a legrövidebb útvonalak vagy a több ugrásos függőségek.
A gráfadatbázisok mintaalapú lekérdezési nyelveket használnak, például az egyre elterjedtebb Graph Query Language (GQL)-t ezeknek a bejárásoknak a tömör leírására. Ugyanaz a nemzetközi munkacsoport, amely felügyeli az SQL-t (ISO/IEC 39075) szabványosítja a GQL-t, amely a gráflekérdezést a meglévő adatbázisszabványokhoz igazítja.
Példa (minta egyezés a GQL-vel):
MATCH (p:Person {firstName: "Annemarie"})-[:knows]->(friend)-[:likes]->(c:Comment)
RETURN c
ORDER BY c.creationDate
LIMIT 100
A minta a következőképpen olvasható: az Annemarie személycsomópontjából kiindulva kövesse a :knows éleket minden barátcsomópont felé, majd kövesse a :likes éleket a kapcsolódó :Comment csomópontokig. Adja vissza a létrehozási dátumuk szerint rendezett megjegyzések közül a 100 legújabbat.
Modellezés és séma
A gráfadatmodellek sémaalapúak: rögzített sémával dolgozhat, ha erős irányításra van szüksége, vagy új csomóponttípusok, kapcsolatok vagy tulajdonságok megjelenésekor fejlesztheti a modellt. Ez a megközelítés csökkenti az adatok duplikálásának szükségességét, és lehetővé teszi, hogy a csapatok több forrásból származó adatokat egyesítsenek anélkül, hogy komoly előzetes újratervezést kellene elvégezniük.
A gráfadatbázisok gyakori felhasználási módjai
A gráfadatbázisok szorosan igazodnak azokhoz a tartományokhoz, ahol a kapcsolatok meghajtják az értéket, például:
- Közösségi hálózatok
- Tudásgráfok
- Ajánlórendszerek
- Csalási és kockázati hálózatok
- Hálózati és informatikai topológia
- Ellátási lánc függőségelemzése
Ezekben a forgatókönyvekben kevesebb a kérdés az egyes rekordokról, és arról, hogy hány entitás kapcsolódik egymáshoz, és hogyan kommunikálnak több ugráson keresztül.
Mikor érdemes gráfadatbázist figyelembe venni?
Gráfadatbázis kiválasztása a következő esetekben:
- Az elsődleges kérdések a csatlakoztatott adatok elérési útjait, környékeit és mintáit érintik.
- A ugrások száma változó vagy előre nem ismert.
- Egyesítenie kell és el kell navigálnia a különböző adathalmazok közötti kapcsolatokat.
Ha rendszeresen tesz fel ilyen jellegű kérdéseket, a gráfmodellek természetes illeszkedésnek számítanak.
Hogyan hasonlítja össze a Microsoft Fabric gráfja az önálló gráfadatbázisokat?
Az adatok gráfként való ábrázolása és egy különálló, különálló gráfadatbázisban való tárolása gyakran ETL-t (kinyerést, átalakítást, terhelést) és szabályozási többletterhelést jelent. Ezzel szemben a gráf közvetlenül a OneLake-en működik, ami csökkenti vagy kiküszöböli a különálló ETL-folyamatok és az adatok duplikációjának szükségességét. Fontolja meg ezeket a kompromisszumokat:
- Adatáthelyezés és duplikáció: Az önálló gráfadatbázisok általában adatok kinyerését, átalakítását és betöltését igénylik egy külön tárolóba, ami növeli a bonyolultságot, és duplikált adathalmazokhoz vezethet. A Graph a OneLake-en működik, így áthelyezés nélkül is modellezheti és lekérdezheti a csatlakoztatott adatokat.
- Üzemeltetési költségek: Az önálló gráfrétegek különálló klaszterekként vagy szolgáltatásokként futnak, és gyakran magukban foglalják a kihasználatlan kapacitás költségeit. A gráfban a számítási feladatok készletezett kapacitásegységeket (CU-kat) használnak fel automatikus leskálázási és központosított metrikákkal, ami leegyszerűsíti a műveleteket, és csökkentheti a költségeket.
- Méretezhetőség: Egyes különálló gráfadatbázisok a vertikális felskálázástól vagy a gyártófüggő klaszterezéstől függenek. A Graph nagy méretű gráfokhoz készült, és horizontális skálázást használ több feldolgozóra a nagy adatos számítási feladatok hatékony kezeléséhez.
- Eszközök és készségek: A szállítóspecifikus gráfrendszerek speciális nyelveket és különálló elemzési keretrendszereket igényelhetnek. A Graph egységes modellezést, szabványalapú lekérdezést (GQL), beépített gráfelemzési algoritmusokat, BI- és AI-integrációt, valamint alacsony/kód nélküli felderítő eszközöket biztosít. Ezek a képességek lehetővé teszik, hogy a felhasználók szélesebb köre működjön együtt a csatlakoztatott adatokkal.
- Irányítás és biztonság: A különálló gráftelepítések független szabályozási és biztonsági beállításokat igényelnek. A Graph a OneLake-szabályozást, a vonalvezetést és a munkaterület szerepköralapú hozzáférés-vezérlését (RBAC) használja, így a megfelelőség, a naplózás és az engedélyek továbbra is összhangban maradnak a Fabric-környezet többi részével.