Jegyzet
Az oldalhoz való hozzáférés engedélyezést igényel. Próbálhatod be jelentkezni vagy könyvtárat váltani.
Az oldalhoz való hozzáférés engedélyezést igényel. Megpróbálhatod a könyvtár váltását.
A modern megoldások különböző adatokat kezelnek, például tranzakciókat, eseményeket, dokumentumokat, telemetriát, bináris objektumokat és elemzési tényeket. Egyetlen adattár ritkán felel meg hatékonyan az összes hozzáférési mintának. A legtöbb éles rendszer többplatformos adatmegőrzést alkalmaz, ami azt jelenti, hogy több tárolási modellt is kiválaszt. Ez a cikk központosítja az Azure-ban elérhető elsődleges adattármodellek canonical definícióit, és összehasonlító táblázatokat biztosít a modellek kiválasztásának felgyorsításához, mielőtt konkrét szolgáltatásokat választ.
Az adatmodellek kiválasztásához kövesse az alábbi lépéseket:
Azonosíthatja a számítási feladatok hozzáférési mintáit, például a pontolvasásokat, az összesítéseket, a teljes szöveget, a hasonlóságot, az időablak-vizsgálatokat és az objektumkézbesítést.
A mintákat térképezze fel a következő szakaszok tárolási modelljeire.
Hozzon létre egy rövid listát az azure-szolgáltatásokról, amelyek implementálják ezeket a modelleket.
Alkalmazza az értékelési kritériumokat, például a konzisztenciát, a késést, a skálázást, a szabályozást és a költségeket.
Csak akkor egyesítse a modelleket, ha a hozzáférési minták vagy az életciklusok egyértelműen eltérnek egymástól.
Útmutató használata
Minden modellszakasz tömör definíciót, jellemző számítási feladatokat, adatjellemzőket, példaforgatókönyveket és reprezentatív Azure-szolgáltatásokra mutató hivatkozásokat tartalmaz. Minden szakasz tartalmaz egy táblázatot is, amely segít kiválasztani a megfelelő Azure-szolgáltatást a használati esethez. Bizonyos esetekben más cikkek segítségével megalapozottabb döntéseket hozhat az Azure-szolgáltatások lehetőségeiről. A megfelelő modellszakaszok ezekre a cikkekre hivatkoznak.
Két összehasonlító táblázat összegzi a nem összefüggő modelltulajdonságokat, így gyorsan kiértékelheti a lehetőségeket anélkül, hogy a szakaszok tartalmát ismételgeti.
Besorolás áttekintése
| Kategória | Elsődleges cél | Tipikus Azure-szolgáltatási példák |
|---|---|---|
| Relációs (OLTP) | Konzisztens tranzakciós műveletek | Azure SQL Database, Azure Database for PostgreSQL vagy Azure Database for MySQL |
| Nem összefüggő, például dokumentum, kulcs-érték, oszlopcsalád és gráf | Rugalmas séma vagy kapcsolatközpontú számítási feladatok | Azure Cosmos DB API-k, Azure Managed Redis, Managed Cassandra vagy HBase |
| Idősorok | Magas betöltési időszeletelésű metrikák és események | Azure Data Explorer vagy Eventhouse a Fabricben |
| Objektum és fájl | Nagy bináris vagy félig strukturált fájltároló | Azure Blob Storage vagy Azure Data Lake Storage |
| Keresés és indexelés | Teljes szöveges és többmezős relevancia, másodlagos indexelés | Azure AI Keresés |
| Vector | Szemantikai vagy közelítő legközelebbi szomszéd (ANN) hasonlóság | Azure AI Search vagy Azure Cosmos DB-változatok |
| Elemzés, online elemzési feldolgozás (OLAP), nagymértékben párhuzamos feldolgozás (MPP) | Nagy léptékű előzmény-összesítés vagy üzleti intelligencia (BI) | Microsoft Fabric, Azure Data Explorer, Azure Analysis Services vagy Azure Databricks |
Megjegyzés:
Egyetlen szolgáltatás több modellt is kínálhat, más néven többmodelles modellt. Válassza ki a legjobban illeszkedő modellt ahelyett, hogy a modelleket olyan módon kombinálja, amely bonyolítja a műveleteket.
Relációs adattárak
A relációsadatbázis-kezelő rendszerek az adatokat normalizált táblákba rendezik sémaalapú írással. Betartatják az integritást, támogatják az atomitást, a konzisztenciát, az elkülönítést és a tartósságot (ACID) és a gazdag SQL-lekérdezéseket.
Erősségeit: Többsoros tranzakciós konzisztencia, összetett illesztések, erős relációs korlátozások és kiforrott eszközök a jelentéskészítéshez, felügyelethez és szabályozáshoz.
Megfontolások: A horizontális skálázás általában tömbösítést vagy particionálást igényel, a normalizálás pedig növelheti az olvasási igényű denormalizált nézetek illesztési költségeket.
Munkaterhek: Rendeléskezelés, készletkövetés, pénzügyi főkönyv rögzítése, számlázás és működési jelentéskészítés.
Azure-szolgáltatás kiválasztása relációs adattárakhoz
Az SQL Database az SQL Server motort használó modern felhőalkalmazások felügyelt relációs adatbázisa.
A Azure SQL Managed Instance egy közel teljes SQL Server-környezet a felhőben, amely ideális a lift-and-shift migrálásokhoz.
Az SQL Database (rugalmas skálázás) egy nagymértékben méretezhető SQL-szint, amelyet nagy számítási feladatokhoz terveztek gyors automatikus skálázással és gyors biztonsági mentésekkel.
Az Azure Database for PostgreSQL egy felügyelt PostgreSQL-szolgáltatás, amely támogatja a nyílt forráskódú bővítményeket és a rugalmas üzembe helyezési lehetőségeket.
Az Azure Database for MySQL webalkalmazások és nyílt forráskódú számítási feladatok felügyelt MySQL-adatbázisa.
Az SQL Database in Fabric egy, az SQL Database-en alapuló, fejlesztőbarát tranzakciós adatbázis, amellyel egyszerűen létrehozhat egy operatív adatbázist a Fabricben.
Az alábbi táblázat segítségével megállapíthatja, hogy melyik Azure-szolgáltatás felel meg a használati eset követelményeinek.
| Service | A következőkre alkalmas | Legfontosabb funkciók | Példa használati esetre |
|---|---|---|---|
| SQL-adatbázis | Natív felhőbeli alkalmazások | Felügyelt, rugalmas készletek, Rugalmas skálázás, beépített magas rendelkezésre állás, speciális biztonság | Modern szolgáltatott szoftver (SaaS) alkalmazás létrehozása méretezhető SQL háttérrendszer használatával |
| felügyelt SQL-példány | Régi vállalati alkalmazások | Az SQL Server teljes kompatibilitása, átemeléses támogatás, virtuális hálózatok, speciális naplózás | Helyszíni SQL Server-alkalmazás migrálása minimális kódmódosításokkal |
| SQL Database (rugalmas skálázás) | Globális terjesztés | Többrégiós olvasási skálázhatóság, georeplikálás, gyors automatikus skálázás | Magas olvasási sebességet igénylő globálisan elosztott alkalmazás kiszolgálása |
| Azure Database for PostgreSQL | Nyílt forráskódú, elemzési számítási feladatok | PostGIS, Rugalmas skálázás, Rugalmas kiszolgáló, nyílt forráskódú bővítmények | Térinformatikai alkalmazás fejlesztése a PostgreSQL és a PostGIS használatával |
| Azure Database for MySQL | Egyszerűsített webalkalmazások | Rugalmas kiszolgáló, nyílt forráskódú kompatibilitás, költséghatékony | WordPress-alapú e-kereskedelmi webhely üzemeltetése |
| SQL Adatbázis a Fabric környezetben | Online tranzakciófeldolgozási (OLTP-) számítási feladatok a Fabric-ökoszisztémában | Az SQL Database motorra épül, méretezhető és a Fabricbe integrált | AI-alkalmazások létrehozása natív vektorkeresési képességeket tartalmazó operatív, relációs adatmodellen |
Nem kapcsolódó adattárak
A nem kapcsolódó adatbázisok, más néven NoSQL-adatbázisok rugalmas sémákhoz, horizontális méretezéshez és adott hozzáférési vagy összesítési mintákhoz optimalizálhatók. Általában enyhítik a relációs viselkedés néhány aspektusát, például a séma merevségét és a tranzakció hatókörét a méretezhetőség vagy az agilitás érdekében.
Dokumentumtároló adattárak
A dokumentumadattárak használatával részben strukturált, gyakran JSON formátumú dokumentumokat tárolhat, ahol minden dokumentum nevesített mezőket és adatokat tartalmaz. Az adatok lehetnek egyszerű értékek vagy összetett elemek, például listák és gyermekgyűjtemények. A dokumentumonkénti séma rugalmassága lehetővé teszi a fokozatos fejlődést.
Erősségeit: Természetes alkalmazásobjektum-leképezés, denormalizált összesítések, többmezős indexelés
Megfontolások: Dokumentumméret növekedése, szelektív tranzakciós hatókör, gondos adatalakzat-kialakítás szükséges a nagy léptékű lekérdezésekhez
Munkaterhek: Termékkatalógusok, tartalomkezelés, profiltárolók
Azure-szolgáltatás kiválasztása dokumentum-adattárakhoz
Az Azure Cosmos DB for NoSQL egy séma nélküli, többrégiós NoSQL-adatbázis, amely alacsony késésű olvasási és írási késéssel rendelkezik.
Az Azure DocumentDB egy globálisan elosztott adatbázis, amely MongoDB-protokollkompatibilitással és automatikus skálázással rendelkezik.
Az Azure Cosmos DB in Fabric egy séma nélküli NoSQL-adatbázis, amely alacsony késésű olvasási és írási, egyszerűsített felügyelettel és beépített Fabric-elemzésekkel rendelkezik.
Az alábbi táblázat segítségével megállapíthatja, hogy melyik Azure-szolgáltatás felel meg a használati eset követelményeinek.
| Service | A következőkre alkalmas | Legfontosabb funkciók | Példa használati esetre |
|---|---|---|---|
| Azure Cosmos DB for NoSQL | Sql-szerű lekérdezést támogató egyéni JSON-dokumentummodellek | Rich query language, több régióba írás, élettartam (TTL), változáskövetés | Rugalmas sémákat támogató több-bérlős SaaS-platform létrehozása |
| Azure DocumentDB | MongoDB-illesztőprogramokat vagy JSON-központú API-kat használó alkalmazások | Globális elosztás, automatikus skálázás, MongoDB-natív vezetékes protokoll | Node.js-alkalmazás migrálása a MongoDB-ből az Azure-ba |
| Azure Cosmos DB a Fabricben | Valós idejű elemzés NoSQL-adatokon keresztül | Automatikus kinyerés, átalakítás és betöltés (ETL) OneLake-be a Fabric-integráción keresztül | Valós idejű elemzési irányítópultokat tartalmazó tranzakciós alkalmazások |
Oszlopcsalád-adattárak
Egy oszlopcsalád-adatbázis, más néven széles oszlopos adatbázis, a ritka adatokat sorokba tárolja, és a dinamikus oszlopokat oszlopcsaládokba rendezi a közös hozzáférés támogatása érdekében. Az oszlop tájolása javítja a kijelölt oszlopkészletek vizsgálatát.
Erősségeit: Nagy írási sebesség, széles vagy ritka adathalmazok hatékony lekérése, dinamikus séma családokon belül
Megfontolások: Az első sorkulcs és az oszlopcsalád kialakítása, a másodlagos index támogatása változó, a lekérdezés rugalmassága alacsonyabb, mint a relációs
Munkaterhek: Eszközök internetes hálózata (IoT) telemetriai adatok, személyre szabás, elemzési preaggregáció, idősorozat típusú magas adatok, ha nem használ dedikált idősoros adatbázist
Azure-szolgáltatás kiválasztása oszlopcsalád-adattárakhoz
Az Apache Cassandra Azure Managed Instance egy felügyelt szolgáltatás nyílt forráskódú Apache Cassandra-fürtökhöz.
Az Azure HDInsighton futó Apache HBase egy méretezhető NoSQL-tároló az Apache HBase-re és a Hadoop-ökoszisztémára épülő big data számítási feladatokhoz.
Az Azure Data Explorer (Kusto) a Kusto lekérdezési nyelvet (KQL) használó telemetriai, naplók és idősoros adatok elemzési motorja.
Az alábbi táblázat segítségével megállapíthatja, hogy melyik Azure-szolgáltatás felel meg a használati eset követelményeinek.
| Service | A következőkre alkalmas | Legfontosabb funkciók | Példa használati esetre |
|---|---|---|---|
| Azure Managed Instance for Apache Cassandra | Új és migrált Cassandra számítási feladatok | Felügyelt, natív Apache Cassandra | A Cassandra-kompatibilitást támogató IoT-eszköz telemetriai adatainak fogadása |
| Apache HBase a HDInsighton | Hadoop-ökoszisztéma, batch analytics | Hadoop Elosztott fájlrendszer (HDFS) integráció, nagy méretű kötegelt feldolgozás | Szenzoradatok kötegelt feldolgozása egy gyártási létesítményben |
| Azure Data Explorer (Kusto) | Nagy terhelésű telemetriai adatok, idősorozat-elemzés | KQL, gyors rögtönzött lekérdezések, időablakos függvények | Valós idejű elemzés alkalmazásnaplókhoz és metrikákhoz |
Kulcs-érték adattárak
A kulcs-érték adattár minden adatértéket egyedi kulccsal társít. A kulcs-érték tárolók többsége csak az egyszerű lekérdezési, beszúrási és törlési műveleteket támogatja. Egy érték részleges vagy teljes módosításához az alkalmazásnak felülírnia kell a teljes érték meglévő adatait. A legtöbb implementációban egyetlen érték olvasása vagy írása atomi művelet.
Erősségeit: Egyszerűség, alacsony késés, lineáris méretezhetőség
Megfontolások: Korlátozott lekérdezési kifejezőképesség, értékalapú keresésekhez szükséges újratervezés, nagy értékű felülírás költsége
Munkaterhek: Gyorsítótárazás, munkamenetek, funkciójelzők, felhasználói profilok, javaslatkeresések
Azure-szolgáltatás kiválasztása kulcs-érték adattárakhoz
Az Azure Managed Redis egy memóriabeli felügyelt adattár, amely a Legújabb Redis Enterprise-verzión alapul, amely alacsony késést és magas átviteli sebességet biztosít.
Az Azure Cosmos DB for Table egy kulcs-érték tároló, amely a strukturált NoSQL-adatok gyors eléréséhez van optimalizálva.
Az Azure Cosmos DB for NoSQL egy dokumentumadattár, amely a strukturált NoSQL-adatok gyors elérésére és horizontális skálázhatóságra van optimalizálva.
Az alábbi táblázat segítségével megállapíthatja, hogy melyik Azure-szolgáltatás felel meg a használati eset követelményeinek.
| Service | A következőkre alkalmas | Legfontosabb funkciók | Példa használati esetre |
|---|---|---|---|
| Azure Managed Redis | Nagy sebességű gyorsítótárazás, munkamenet-állapot, közzététel-feliratkozás | Memóriabeli tároló, almilliszekundumos késés, Redis protokoll | Termékoldalak gyorsítótárazása e-kereskedelmi webhelyhez |
| Azure Cosmos DB for Table | Meglévő Azure Table Storage-számítási feladatok migrálása | Table Storage API-kompatibilitás | Felhasználói beállítások és beállítások tárolása mobilalkalmazásban |
| Azure Cosmos DB for NoSQL | Nagy sebességű gyorsítótárazás nagy léptékű és magas rendelkezésre állással | Séma nélküli, többrégiós, automatikus skálázás | Gyorsítótárazás, munkamenet állapota, kiszolgálói réteg |
Gráf adatbázisok
A gráfadatbázis csomópontokként és élekként tárolja az információkat. Az élek kapcsolatokat határoznak meg, és a csomópontok és az élek is a táblaoszlopokhoz hasonló tulajdonságokkal rendelkezhetnek. Elemezheti az entitások, például az alkalmazottak és a részlegek közötti kapcsolatokat.
Erősségek: Kapcsolat-első lekérdezési minták, hatékony változómélység-bejárások
Megfontolások: Többletterhelés, ha a kapcsolatok sekélyek, gondos modellezést igényel a teljesítményhez, és nem ideális tömeges elemzésekhez
Munkaterhek: Közösségi hálózatok, csalási körök, tudásgráfok, ellátási lánc függőségei
Azure-szolgáltatás kiválasztása gráfadattárakhoz
Sql Server-gráfbővítmények használata a gráfadatok tárolásához. A gráfbővítmény kibővíti az SQL Server, az SQL Database és a felügyelt SQL-példány képességeit, így lehetővé teszi az összetett kapcsolatok modellezését és lekérdezését közvetlenül a relációs adatbázisban lévő gráfstruktúrák használatával.
Idősoros adattárak
Az idősoros adattárak idő szerint rendszerezett értékhalmazt kezelnek. Támogatják az olyan funkciókat, mint az időalapú lekérdezések és aggregációk. Nagy mennyiségű adat közel valós idejű betöltésére és elemzésére vannak optimalizálva. Ezek általában csak hozzáfűző adatbázisok.
Erősségek: Tömörítés, nagy mennyiségű adatbefogadás, időablakos lekérdezések és összesítések, sorrenden kívüli befogadás kezelése
Megfontolások: Címke kardinalitás kezelése, megőrzési költség, mintavételi stratégia, speciális lekérdezési nyelvek
Munkaterhek: IoT-érzékelőmetrikák, alkalmazástelemetria, monitorozás, ipari adatok és pénzügyi piaci adatok
Azure-szolgáltatás kiválasztása idősoros adattárakhoz
Az Azure Data Explorer egy felügyelt big data storage platform. Segítségével nagy mennyiségű adatot kérdezhet le és jeleníthet meg közel valós időben. Válassza ezt a szolgáltatást, ha szolgáltatásként különálló platformra (PaaS) van szüksége, amely részletesen szabályozza a fürtkonfigurációt, a hálózatkezelést és a skálázást.
A Microsoft Fabric Eventhouse része a Real-Time Intelligence felületének a Fabricben. KQL-adatbázisokat használ a streamelési adatok kezeléséhez. Akkor válassza ezt a szolgáltatást, ha olyan szolgáltatást (SaaS) szeretne használni, amely integrálva van a Fabric-ökoszisztémával, beleértve a OneLake-t és más Fabric-számítási feladatokat.
Egyes tranzakciós adatbázisok korlátozott idősorozat-képességeket biztosítanak a szélesebb körű funkciókészlet részeként vagy bővítményeken keresztül. Az Azure Database for PostgreSQL rugalmas kiszolgáló például támogatja a TimescaleDB-t. Válassza ezt a lehetőséget, ha az adatbázis meglévő tranzakciós adatai mellett idősoros adatokat is le kell kérdeznie.
Amikor idősoros adattárat választ, értékelje ki a szolgáltatást a számítási feladat igényei alapján:
- Betöltési teljesítmény
- Alkalmi lekérdezések
- További indexek a dátum/idő mezőkön túl
- Idősorozat-elemzések és riasztások
Objektum-adattárak
Nagy bináris vagy félig strukturált objektumokat tárol, és olyan metaadatokat tartalmaz, amelyek ritkán változnak vagy nem módosíthatók.
Erősségeit: Gyakorlatilag korlátlan skálázás, rétegzett költség, tartósság, párhuzamos olvasási képesség
Megfontolások: Egész objektumos műveletek, korlátozott metaadat-lekérdezések, végleges listaelem-viselkedések
Munkaterhek: Médiaeszközök, biztonsági másolatok, data lake raw zones, naplóarchívumok
Azure-szolgáltatás kiválasztása objektumadattárakhoz
A Data Lake Storage egy big data-optimalizált objektumtároló, amely egyesíti a hierarchikus névteret és a HDFS-kompatibilitást a fejlett elemzésekhez és a nagy léptékű adatfeldolgozáshoz.
A Blob Storage egy méretezhető objektumtároló strukturálatlan adatokhoz, például képekhez, dokumentumokhoz és biztonsági másolatokhoz, amelyek rétegzett hozzáférést biztosítanak a költségoptimalizáláshoz.
Az alábbi táblázat segítségével megállapíthatja, hogy melyik Azure-szolgáltatás felel meg a használati eset követelményeinek.
| Service | A következőkre alkalmas | Legfontosabb funkciók | Példa használati esetre |
|---|---|---|---|
| Data Lake Storage- | Big data-elemzés és hierarchikus adatok | HDFS, hierarchikus névtér, elemzésre optimalizálva | Strukturált és strukturálatlan adatok petabájtjainak tárolása és lekérdezése az Azure Data Factory vagy az Azure Databricks használatával |
| Blob Storage | Általános célú objektumtárolás | Egyszerű névtér, egyszerű REST API és rétegzett tárterület, amely gyakori, ritka elérésű és archív elemeket tartalmaz | Képek, dokumentumok, biztonsági másolatok és statikus webhelytartalom üzemeltetése |
Adattárak keresése és indexelése
A keresőmotor-adatbázis lehetővé teszi, hogy az alkalmazások külső adattárakban keressenek információkat. A keresőmotor-adatbázisok nagy mennyiségű adatot indexelhetnek, és közel valós idejű hozzáférést biztosíthatnak ezekhez az indexekhez.
Erősségeit: Teljes szöveges lekérdezések, pontozás, nyelvi elemzés, homályos egyezés
Megfontolások: Az indexek végleges konzisztenciája, különálló betöltési vagy indexelési folyamat, nagy indexfrissítések költsége
Munkaterhek: Webhely- vagy termékkeresés, naplókeresés, metaadatok szűrése, többattribútumos felderítés
Azure-szolgáltatás kiválasztása keresési adattárakhoz
További információ: Keresési adattár kiválasztása az Azure-ban.
Vektorkeresési adattárak
A vektorkeresési adattárak tárolják és lekérik az adatok nagy dimenziójú vektoros ábrázolásait, amelyeket gyakran gépi tanulási modellek hoznak létre.
Erősségeit: Szemantikai keresés, ANN algoritmusok
Megfontolások: Indexelés összetettsége, tárolási többletterhelés, késés és pontosság, integrációs kihívások
Munkaterhek: Szemantikai dokumentumkeresés, javaslatmotorok, kép- és videólekérés, csalás és anomáliadetektálás
Azure-szolgáltatás kiválasztása vektorkeresési adattárakhoz
További információ: Azure-szolgáltatás kiválasztása vektorkereséshez.
Elemzési adattárak
Az elemzési adattárak tárolják a big data-adatokat, és megőrzik azokat az elemzési folyamatok teljes életciklusa során.
Erősségeit: Méretezhető számítás és tárolás, SQL és Spark támogatása, integráció BI-eszközökkel, idősorozat- és telemetriaelemzéssel
Megfontolások: A vezénylés költsége és összetettsége, az alkalmi számítási feladatok lekérdezési késése, több adattartomány szabályozása
Munkaterhek: Nagyvállalati jelentéskészítés, big data-elemzés, telemetriai összesítés, működési irányítópultok, adatelemzési folyamatok
Azure-szolgáltatás kiválasztása elemzési adattárakhoz
További információ: Elemzési adattár kiválasztása az Azure-ban.
Összehasonlító jellemzők (alapvető nemrelációs modellek)
| Jellemző | Dokumentum | Oszlopcsalád | Kulcs-érték | Graph |
|---|---|---|---|---|
| Normalizálás | Denormalizált | Denormalizált | Denormalizált | Normalizált kapcsolatok |
| Séma megközelítése | Olvasáskori séma | Oszlopcsaládok meghatározása, oszlopok sémája olvasáskor | Olvasáskori séma | Olvasáskori séma |
| Konzisztencia (jellemző) | Minden egyes elemhez hangolható | Minden egyes sorhoz vagy családhoz | Minden kulcshoz | Minden egyes élhez vagy bejárás szemantikájához |
| Atomiság hatóköre | Dokumentum | Sor vagy család a tábla implementációjától függően | Egyedi kulcs | Gráftranzakció (változó) |
| Zárolás és egyidejűség | Optimista (ETag) | Pesszimista vagy optimista, a megvalósítástól függően | Optimista kulcs | Optimista (tervezési minta) |
| Hozzáférési minta | Összesítés (entitás) | Széles ritka aggregátumok | Pontkeresés kulcs szerint | Kapcsolatbejárások |
| Indexelés | Elsődleges és másodlagos | Elsődleges és korlátozott másodlagos | Elsődleges (kulcs) | Elsődleges és néha másodlagos |
| Adatalakzat | Rugalmas hierarchikus | Gyéren táblásított széles | Átlátszatlan érték | Csomópontok és élek |
| Ritka/Széles alkalmasság | Igen/Igen | Igen/Igen | Yes/No | Nem/Nem |
| Tipikus datumméret | Kis-közepes | Közepes–nagy | Kicsi | Kicsi |
| Skálázási dimenzió | Partíciók száma | Partíció- és oszlopcsalád szélessége | Kulcstérfogalom | Csomópontok vagy élek száma |
Összehasonlító jellemzők (specializált nemrelációs modellek)
| Jellemző | Idősorok | Objektum (blob) | Keresés/indexelés |
|---|---|---|---|
| Normalizálás | Normalizált | Denormalizált | Denormalizált |
| Schema | Olvasáskori séma (címkék) | Átlátszatlan érték és metaadatok | Írás közbeni séma (index leképezése) |
| Atomiság hatóköre | N/A (hozzáfűzés) | Objektum | Minden dokumentum- vagy indexművelethez |
| Hozzáférési minta | Időszelet-vizsgálat, ablakösszesítés | Teljes objektumos műveletek | Szöveges lekérdezések és szűrők |
| Indexelés | Idő és választható másodlagos opció | Csak kulcs (elérési út) | Fordított és választható aspektusok |
| Adatalakzat | Táblázat formátumú (időbélyeg, címkék, érték) | Bináris vagy blob metaadatokkal | Tokenizált szöveg és strukturált mezők |
| Profil írása | Hozzáfűzés nagy sebességgel | Tömeges vagy ritkán frissített frissítések | Kötegelt vagy folyamatos indexelés |
| Profil olvasása | Összesített tartományok | Teljes vagy részleges letöltések | Rangsorolt eredményhalmazok |
| Növekedési hajtóereje | Eseményarány megszorozva a megtartási aránnyal | Objektumok száma és mérete | Indexelt dokumentumkötet |
| Konzisztenciatűrés | Késői adatok végleges | Írás utáni olvasás minden egyes objektumnál | Végleges új dokumentumok esetén |
Válasszon a modellek közül (heurisztika)
| Szükség | Előnyben részesít |
|---|---|
| Szigorú többentitásos tranzakciók | Relational |
| Fejlődő összesített alakzat, JSON-központú API-k | Dokumentum |
| Rendkívül alacsony késésű kulcsszó-keresések vagy gyorsítótárazás | Kulcs-érték |
| Széles, ritka, írásigényes telemetria | Oszlopcsalád vagy idősor |
| Mély kapcsolat átjárás | Graph |
| Hatalmas előzményelemzési vizsgálatok | Elemzés vagy OLAP |
| Nagy strukturálatlan bináris fájlok vagy tózónák | Objektum |
| Teljes szöveges relevancia és szűrés | Keresés és indexelés |
| Magas betöltési időbélyeg-metrikák ablakos lekérdezésekkel | Idősorok |
| Gyors hasonlóság (szemantikai vagy vektoros) | Vektoros keresés |
Modellek kombinálása és a buktatók elkerülése
Több modellt használjon, ha a következő forgatókönyvek érvényesek:
- A hozzáférési minták eltérnek, például a pontos keresés, a széleskörű elemzési átvizsgálás és a teljes szövegű keresés.
- Az életciklus és a megőrzés különböznek, például a változtathatatlan nyers adatok és a gondosan összeállított strukturált adatok esetében.
- Késés és átviteli sebesség követelményeinek ütközése.
Kerülje a korai töredezettség:
- Használjon egy szolgáltatást, ha továbbra is megfelel a teljesítményre, a méretezésre és a szabályozási célokra vonatkozó célkitűzéseknek.
- Központosíthatja a megosztott besorolási logikát, és szükség esetén elkerülheti a tárolók közötti ismétlődő átalakítási folyamatokat.
Tekintse meg a következő gyakori antipatterneket:
- Több mikroszolgáltatás osztozik egy adatbázison, ami összekapcsolást hoz létre.
- A Teams egy másik, működési érettség nélküli modellt ad hozzá, például figyelést vagy biztonsági mentéseket.
- A keresési index lesz az elsődleges adattár, ami visszaéléshez vezet.
Mikor kell újra kiértékelni a modell választását?
| Jel | Lehetséges művelet |
|---|---|
| Alkalmi illesztések növelése egy dokumentumtárban | Relációs olvasási modell bevezetése |
| Magas processzorhasználat a keresési indexben az elemzési aggregációk miatt | Átterhelés az elemzési motorra |
| A nagyméretű denormalizált dokumentumok részleges frissítési versengést hoznak létre | Aggregátumok újraformázása vagy felosztása |
| Az időablakos lekérdezések lassúak az oszlopcsalád-tárolóban | Célként létrehozott idősorozat-adatbázis bevezetése |
| A pontkeresés késése a gráfok bejárási mélységével nő | Származtatott materializált nézetek hozzáadása |
Következő lépések
- A biztonságos módszertan az Azure-hoz készült felhőbevezetési keretrendszerben
- Nulla megbízhatósági keretrendszer adatbiztonsága
Kapcsolódó erőforrások
A következő cikkek segítségével válasszon ki egy speciális adattárat:
- Big Data Storage-technológia kiválasztása az Azure-ban
- Keresési adattár kiválasztása az Azure-ban
- Azure-szolgáltatás kiválasztása vektorkereséshez
Ebből a cikkből megismerheti az Azure-szolgáltatásokat használó referenciaarchitektúrákat:
- Az alapkonfigurációban magas rendelkezésre állású zónaredundáns webalkalmazás-architektúra az SQL Database-t használja relációs adattárként.
- Az Azure Container Apps és a Dapr architektúrával rendelkező mikroszolgáltatások üzembe helyezése az SQL Database, az Azure Cosmos DB és az Azure Managed Redis szolgáltatást használja adattárként.
- Az Azure-architektúra dokumentumbesorolásának automatizálása az Azure Cosmos DB-t használja adattárként.