Jegyzet
Az oldalhoz való hozzáférés engedélyezést igényel. Próbálhatod be jelentkezni vagy könyvtárat váltani.
Az oldalhoz való hozzáférés engedélyezést igényel. Megpróbálhatod a könyvtár váltását.
Megjegyzés:
Ez a funkció jelenleg nyilvános előzetes verzióban érhető el. Ez az előzetes verzió szolgáltatásszintű szerződés nélkül érhető el, és éles számítási feladatokhoz nem ajánlott. Előfordulhat, hogy bizonyos funkciók nem támogatottak, vagy korlátozott képességekkel rendelkeznek. További információkért lásd: Microsoft Azure Previews Kiegészítő Felhasználási Feltételek.
A gráfadatbázisok hatékony módszert kínálnak a csatlakoztatott adatok modellezésére és lekérdezésére. A táblákban adatokat tároló hagyományos relációs adatbázisoktól eltérően a gráfadatbázisok csomópontokként (entitásokként) és élekként (kapcsolatokként) jelölik az információkat, így egyszerűbbé válik az összetett kapcsolatok és minták rugalmasabb feltárása.
A gráfadatbázis leggyakrabban használt típusa a címkézett tulajdonsággráf (LPG) modellt valósítja meg: az entitások (csomópontok) és a kapcsolatok (élek) címkékkel és tulajdonságokkal (kulcs-érték párokkal) rendelkezhetnek. Ez a rugalmas modell lehetővé teszi mind a séma-nélküli, mind a sémaalapú tervezést, és lehetőséget biztosít a gazdag szemantika kifejezésére. Mivel a kapcsolatok explicit módon élekként vannak tárolva, a lekérdezések az élek mentén haladva járják be a kapcsolatokat, ezzel elkerülve a drága illesztések számítását.
Fontos
Ez a cikk kizárólag a közösségi hálózati példa gráfdatasetet használja.
A Graph-adatbázis alapfogalmai
- A csomópontok entitásokat , például személyeket, termékeket vagy helyeket jelölnek. A csomópontok olyan címkéket és tulajdonságokat tartalmazhatnak, amelyek az attribútumaikat írják le. Egy személycsomópont például rendelkezhet olyan tulajdonságokkal, mint a firstName, a lastName és az age.
- Az élek az entitások kapcsolatát jelölik, például FRIENDS_WITH, PURCHASED vagy LOCATED_IN. Az élek tulajdonságokat és címkéket is tartalmazhatnak a kapcsolat metaadatainak kódolásához.
- A tulajdonságok a csomópontokhoz és élekhez csatolják a részleteket (például egy személy nevét vagy egy él dátumát). Mivel a kapcsolatok kifejezetten élekként vannak tárolva, a lekérdezések a gráfon való kapcsolatok követésével navigálnak, nem pedig a lekérdezés során számítva ki azokat.
Hogyan működik a kapcsolatok lekérdezése
A gráfos lekérdezések úgy kérnek le összekapcsolt adatokat, hogy elindulnak egy kezdő csomópontból, áthaladnak annak szomszédain, majd továbbhaladnak azok szomszédaihoz, és így tovább. A bejárási művelet az érintett élek számához (a helyi környékhez) van kötve, nem pedig az adathalmaz teljes méretéhez. Ez természetes és hatékony kérdéseket tesz fel az útvonalakkal, a kapcsolatokkal és a mintákkal – például a barátok barátaival, a legrövidebb útokkal vagy a több ugrásos függőségekkel – kapcsolatban.
A gráfadatbázisok mintaalapú lekérdezési nyelveket használnak, például az egyre elterjedtebb Graph Query Language (GQL)-t ezeknek a bejárásoknak a tömör leírására. A GQL-t ugyanaz a nemzetközi munkacsoport szabványosította, amely felügyeli az SQL-t (ISO/IEC 39075), és a gráflekérdezést a meglévő adatbázis-szabványokhoz igazítja.
Példa (minta egyezés a GQL-vel):
MATCH (p:Person {firstName: "Annemarie"})-[:knows]->(friend)-[:likes]->(c:Comment)
RETURN c
ORDER BY c.creationDate
LIMIT 100
A minta a következőképpen olvasható: az Annemarie személycsomópontjából kiindulva kövesse a :knows éleket minden barátcsomópont felé, majd kövesse a :likes éleket a kapcsolódó :Comment csomópontokig. Adja vissza a létrehozási dátumuk szerint rendezett megjegyzések közül a 100 legújabbat.
Modellezés és séma
A gráfadatmodellek sémaalapúak: rögzített sémával dolgozhat, ha erős irányításra van szüksége, vagy új csomóponttípusok, kapcsolatok vagy tulajdonságok megjelenésekor fejlesztheti a modellt. Ez a megközelítés csökkenti az adatok duplikálásának szükségességét, és lehetővé teszi, hogy a csapatok több forrásból származó adatokat egyesítsenek anélkül, hogy komoly előzetes újratervezést kellene elvégezniük.
A gráfadatbázisok gyakori felhasználási módjai
A gráfadatbázisok szorosan igazodnak azokhoz a tartományokhoz, ahol a kapcsolatok meghajtják az értéket, például:
- Közösségi hálózatok
- Tudásgráfok
- Ajánlórendszerek
- Csalási és kockázati hálózatok
- Hálózati és informatikai topológia
- Ellátási lánc függőségelemzése
Ezekben a forgatókönyvekben kevesebb a kérdés az egyes rekordokról, és arról, hogy hány entitás kapcsolódik egymáshoz, és hogyan kommunikálnak több ugráson keresztül.
Mikor érdemes gráfadatbázist figyelembe venni?
Gráfadatbázis kiválasztása a következő esetekben:
- Az elsődleges kérdések a csatlakoztatott adatok elérési útjait, környékeit és mintáit érintik
- A ugrások száma változó vagy előre nem ismert
- Egyesítenie kell és el kell navigálnia a különböző adathalmazok közötti kapcsolatokat
Ha rendszeresen tesz fel ilyen jellegű kérdéseket, a gráfmodellek természetes illeszkedésnek számítanak.
Grafikon a Microsoft Fabricben
Az adatok gráfként való ábrázolása és egy különálló, különálló gráfadatbázisban való tárolása gyakran ETL-t (kinyerést, átalakítást, terhelést) és szabályozási többletterhelést jelent. Ezzel szemben a Microsoft Fabric Graph közvetlenül a OneLake-en működik, ami csökkenti vagy kiküszöböli a különálló ETL-folyamatok és az adatok duplikációjának szükségességét. Fontolja meg ezeket a kompromisszumokat:
- Adatáthelyezés és duplikáció: Az önálló gráfadatbázisok általában adatok kinyerését, átalakítását és betöltését igénylik egy külön tárolóba, ami növeli a bonyolultságot, és duplikált adathalmazokhoz vezethet. A Microsoft Fabric Graph a OneLake-en működik, így áthelyezés nélkül is modellezheti és lekérdezheti a csatlakoztatott adatokat.
- Üzemeltetési költségek: Az önálló gráfrétegek különálló klaszterekként vagy szolgáltatásokként futnak, és gyakran magukban foglalják a kihasználatlan kapacitás költségeit. A Fabric grafikonteljesítményei egyesített kapacitásegységeket (CU-kat) használnak fel automatikus leépítéssel és központosított metrikákkal, ami leegyszerűsíti a műveleteket és csökkentheti a költségeket.
- Méretezhetőség: Egyes különálló gráfadatbázisok a vertikális felskálázástól vagy a gyártófüggő klaszterezéstől függenek. A Microsoft Fabric graph nagy méretű gráfokhoz készült, és horizontális felskálázást használ több feldolgozóra a nagyméretű adathalmaz kezelése érdekében hatékony kezeléséhez.
- Eszközök és készségek: A szállítóspecifikus gráfrendszerek speciális nyelveket és különálló elemzési keretrendszereket igényelhetnek. A Microsoft Fabric gráf egységesített modellezést, szabványalapú lekérdezést (GQL), beépített gráfelemzési algoritmusokat, BI- és AI-integrációt, valamint alacsony-kód/nem-kódoló felderítő eszközöket biztosít. Ezek a képességek lehetővé teszik, hogy a felhasználók szélesebb köre működjön együtt a csatlakoztatott adatokkal.
- Irányítás és biztonság: A különálló gráftelepítések független szabályozási és biztonsági beállításokat igényelnek. A Microsoft Fabric Gráf a OneLake-szabályozást, a leszármazási, és a munkaterület szerepköralapú hozzáférés-vezérlését (RBAC) használja, így a megfelelőségi, auditálási és engedélyezési folyamatok konzisztens maradnak a Fabric környezet többi részével.