Útmutató: Tóadatbázis módosítása
Ebből a cikkből megtudhatja, hogyan módosíthatja a meglévő tóadatbázisokat Azure Synapse az adatbázis-tervezővel. Az adatbázis-tervezővel kód írása nélkül egyszerűen hozhat létre és helyezhet üzembe adatbázist.
Előfeltételek
- A Synapse-rendszergazdai vagy a Synapse-közreműködői engedélyek szükségesek a Synapse-munkaterületen egy tóadatbázis létrehozásához.
- A Storage-blobadatok közreműködője engedélyre van szükség a Data Lake-en a Tábla létrehozása a Data Lake-ből beállítás használatakor.
Adatbázis tulajdonságainak módosítása
A Azure Synapse Analytics-munkaterület kezdőlapján válassza a bal oldali Adatok lapot. Ekkor megnyílik az Adatok lap, amelyen megjelenik a munkaterületen már létező adatbázisok listája.
Vigye az egérmutatót az Adatbázisok szakaszra, és válassza a módosítani kívánt adatbázis melletti három pontot, majd válassza a Megnyitás lehetőséget.
Ekkor megnyílik az adatbázis-tervező lap, amelyen a kiválasztott adatbázis betöltődik a vászonra.
Az adatbázis-tervező Tulajdonságok panelje a lap jobb felső sarkában található Tulajdonságok ikonra kattintva nyitható meg.
- Név A nevek nem szerkeszthetők az adatbázis közzététele után, ezért győződjön meg arról, hogy a választott név helyes.
- Leírás Az adatbázis leírásának megadása nem kötelező, de lehetővé teszi, hogy a felhasználók megértsék az adatbázis célját.
- Az adatbázis tárolási beállításai az adatbázis tábláinak alapértelmezett tárolási adatait tartalmazó szakasz. Az alapértelmezett beállításokat a rendszer az adatbázis minden táblájára alkalmazza, kivéve, ha az felül van bírálva a táblán.
- A társított szolgáltatás az adatok Azure Data Lake Storage való tárolására használt alapértelmezett társított szolgáltatás. Megjelenik a Synapse-munkaterülethez társított alapértelmezett társított szolgáltatás, de a társított szolgáltatást bármilyen ADLS-tárfiókra módosíthatja.
- A fájlböngésző használatával az alapértelmezett tároló- és mappaelérési út beállításához használt bemeneti mappa a társított szolgáltatásban, vagy manuálisan szerkeszti az elérési utat a ceruza ikonnal.
- A Azure Synapse adatformátumú lake-adatbázisok támogatják a parquet és a tagolt szöveget az adatok tárolási formátumaként.
Ha táblát szeretne hozzáadni az adatbázishoz, válassza a + Táblázat gombot.
- A Custom új táblát ad hozzá a vászonhoz.
- A sablonból megnyithatja a katalógust, és kiválaszthat egy új tábla hozzáadásakor használandó adatbázissablont. További információ: Create lake database from database template (Tóadatbázis létrehozása adatbázissablonból).
- A Data Lake-ből importálhat egy táblasémát a tóban már meglévő adatokkal.
Válassza az Egyéni lehetőséget. Egy új tábla jelenik meg a vásznon Table_1 néven.
Ezután testre szabhatja Table_1, beleértve a tábla nevét, leírását, tárolási beállításait, oszlopait és kapcsolatait. Lásd az alábbi Táblák testreszabása egy adatbázison belül szakaszt.
Adjon hozzá egy új táblát a data lake-ből a + Táblázat , majd a Data Lake-ből lehetőség kiválasztásával.
Ekkor megjelenik a Külső tábla létrehozása a Data Lake-ből panel. Töltse ki az ablaktáblát az alábbi részletekkel, és válassza a Folytatás lehetőséget.
- A külső tábla neve annak a névnek, amelyet meg szeretne adni a létrehozni kívánt táblának.
- Társított szolgáltatás, amely az adatfájl Azure Data Lake Storage helyét tartalmazza.
- A bemeneti fájl vagy mappa a fájlböngészővel navigálhat a fájlhoz, és kiválaszthat egy fájlt a tavon, amellyel táblázatot szeretne létrehozni.
- A következő képernyőn Azure Synapse megtekinti a fájlt, és észleli a sémát.
- Az Új külső táblázat lapra kerül, ahol frissítheti az adatformátummal kapcsolatos beállításokat, és megtekintheti az adatok előnézetét annak ellenőrzéséhez, hogy Azure Synapse helyesen azonosította-e a fájlt.
- Ha elégedett a beállításokkal, válassza a Létrehozás lehetőséget.
- A rendszer hozzáad egy új táblát a kiválasztott névvel a vászonhoz, és a Tábla tárolási beállításai szakaszban megjelenik a megadott fájl.
Mivel az adatbázis testre van szabva, ideje közzétenni. Ha Git-integrációt használ a Synapse-munkaterülettel, véglegesítenie kell a módosításokat, és egyesítenie kell őket az együttműködési ágban. További információ a Azure Synapse verziókövetéséről. Ha Synapse Live módot használ, kiválaszthatja a "közzététel" lehetőséget.
Az adatbázis a közzététel előtt ellenőrzi a hibákat. A talált hibák az értesítések lapon jelennek meg, és útmutatást ad a hiba elhárításához.
A közzététel létrehozza az adatbázissémát a Azure Synapse Metaadattárban. A közzététel után az adatbázis- és táblaobjektumok más Azure-szolgáltatások számára is láthatók lesznek, és lehetővé teszik, hogy az adatbázis metaadatai olyan alkalmazásokba áramlanak, mint a Power BI vagy a Microsoft Purview.
Adatbázisok tábláinak testreszabása
Az adatbázis-tervezővel teljes mértékben testre szabhatja az adatbázis tábláinak bármelyikét. Ha kijelöl egy táblát, három lap érhető el, amelyek mindegyike a tábla sémájára vagy metaadataira vonatkozó beállításokat tartalmazza.
Általános kérdések
Az Általános lap a táblára jellemző információkat tartalmazza.
Nevezze el a tábla nevét. A táblanév az adatbázis bármely egyedi értékére szabható. Több, azonos nevű tábla nem engedélyezett.
Ez az érték (nem kötelező) öröklődik, ha a tábla adatbázissablonból lett létrehozva. Nem szerkeszthető, és közli a felhasználóval, hogy melyik sablontáblából származik.
A táblázat leírásának leírása. Ha a táblát adatbázissablonból hozták létre, az tartalmazza a tábla által képviselt fogalom leírását. Ez a mező szerkeszthető, és az üzleti követelményeknek megfelelő leírásnak megfelelően módosítható.
A Megjelenítés mappa annak az üzleti területnek a nevét tartalmazza, amelybe a tábla az adatbázissablon részeként lett csoportosítva. Egyéni táblák esetében ez az érték "Egyéb" lesz.
Emellett van egy összecsukható, a Tábla tárolási beállításai című szakasza, amely a tábla által használt mögöttes tárolási információk beállításait tartalmazza.
Az adatbázisból való öröklés alapértelmezett jelölőnégyzete azt határozza meg, hogy az alábbi tárolási beállítások öröklődnek-e az adatbázis Tulajdonságok lapján megadott értékektől, vagy egyenként vannak-e beállítva. Ha testre szeretné szabni a tárolási értékeket, törölje a jelölőnégyzet jelölését.
- A társított szolgáltatás az adatok Azure Data Lake Storage való tárolására használt alapértelmezett társított szolgáltatás. Módosítsa ezt úgy, hogy másik ADLS-fiókot válasszon.
- Adja meg azt a mappát az ADLS-ben, ahol a táblázatba betöltött adatok meg fognak élni. A ceruza ikonnal tallózhat a mappa helye között, vagy manuálisan szerkesztheti azt.
- Az adatformátum az Input mappában lévő Adatok lake-adatbázisai Azure Synapse támogatja a parquet és a tagolt szöveget az adatok tárolási formátumaként. Ha az adatformátum nem egyezik a mappában lévő adatokkal, a tábla lekérdezései sikertelenek lesznek.
Ha tagolt szöveg adatformátumát használja, további beállítások érhetők el:
- A sorfejlécek jelölőnégyzet bejelölése, ha az adatok sorfejléceket tartalmaznak.
- Többsoros adatkapcsolat engedélyezése jelölőnégyzet bejelölése, ha az adatok több sort tartalmaznak egy sztringoszlopban.
- A Quote Character (Idézőjel) mezőben adja meg a tagolt szövegfájl egyéni idézőjelét.
- Az Escape-karakter egy tagolt szövegfájl egyéni feloldó karakterét adja meg.
- Az adatokon használt tömörítési típus adattömörítése.
- Elhatárolja az adatfájlokban használt mezőelválasztót. Támogatott értékek: Vessző (,), tab (\t) és cső (|).
- Itt jelennek meg a partícióoszlopok listája.
- Hozzáfűzhető jelölőnégyzet bejelölése, ha kiszolgáló nélküli SQL-ből kérdez le Dataverse-adatokat.
Parquet-adatok esetén a következő beállítás létezik:
- Az adatokon használt tömörítési típus adattömörítése.
Oszlopok
Az Oszlopok lapon jelennek meg a táblázat oszlopai, és módosíthatók. Ezen a lapon két oszloplista található: Standard oszlopok és Partícióoszlopok. A standard oszlopok olyan oszlopok , amelyek adatokat tárolnak, elsődleges kulcsok, és egyéb esetben nem használhatók az adatok particionálására. A partícióoszlopok az adatokat is tárolják, de az alapul szolgáló adatokat mappákba particionálják az oszlopban található értékek alapján. Minden oszlop a következő tulajdonságokkal rendelkezik.
- Nevezze el az oszlop nevét. A táblában egyedinek kell lennie.
- A kulcsok azt jelzik, hogy az oszlop elsődleges kulcs (PK) és/vagy idegen kulcs (FK)-e a táblához. A partícióoszlopokra nem alkalmazható.
- Adja meg az oszlop leírását. Ha az oszlop adatbázissablonból lett létrehozva, az oszlop által képviselt fogalom leírása megjelenik. Ez a mező szerkeszthető, és az üzleti követelményeknek megfelelő leírásnak megfelelően módosítható.
- A Nullability (Nullability ) azt jelzi, hogy lehetnek-e null értékek ebben az oszlopban. A partícióoszlopokra nem alkalmazható.
- Az adattípus a Spark-adattípusok elérhető listája alapján állítja be az oszlop adattípusát.
- A Formátum/Hossz beállítással testre szabhatja az oszlop formátumát vagy maximális hosszát az adattípustól függően. A dátum- és időbélyeg-adattípusok formátum legördülő menüvel rendelkeznek, más típusok, például a sztringek pedig maximális hosszmezővel rendelkeznek. Nem minden adattípus rendelkezik értékkel, mivel egyes típusok rögzített hosszúságúak. Az Oszlopok lap tetején található egy parancssáv, amely az oszlopok kezelésére használható.
- A szűrés kulcsszó alapján a megadott kulcsszónak megfelelő elemekre szűri az oszlopok listáját.
-
A + Oszlop funkcióval új oszlopot adhat hozzá. Három lehetőség közül választhat.
- Az új oszlop új egyéni standard oszlopot hoz létre.
- A sablonból megnyithatja a feltárási panelt, és lehetővé teszi egy adatbázissablon oszlopainak azonosítását, amelyek szerepeljenek a táblában. Ha az adatbázis nem adatbázissablonnal lett létrehozva, ez a lehetőség nem jelenik meg.
- A Partíció oszlop új egyéni partícióoszlopot ad hozzá.
- A klónozás duplikálja a kijelölt oszlopot. A klónozott oszlopok mindig ugyanolyan típusúak, mint a kijelölt oszlop.
- A konvertálási típus a kiválasztott standard oszloppartícióoszlopra való módosítására szolgál, és fordítva. Ez a beállítás szürkén jelenik meg, ha több különböző típusú oszlopot jelölt ki, vagy a kijelölt oszlop nem konvertálható az oszlopon beállított PK vagy Nullability jelző miatt.
- A törlés törli a kijelölt oszlopokat a táblából. Ez a művelet nem vonható vissza.
Az oszlopok sorrendjét húzással is átrendezheti az oszlopnév bal oldalán megjelenő dupla függőleges három ponttal, amikor rámutat az oszlopra, vagy rákattint az oszlopra a fenti képen látható módon.
Partícióoszlopok
A partícióoszlopok az adatbázisban lévő fizikai adatok particionálására szolgálnak az oszlopok értékei alapján. A partícióoszlopok lehetővé teszik a lemezen lévő adatok nagyobb teljesítményű adattömbökbe való elosztását. A Azure Synapse partícióoszlopai mindig a táblaséma végén találhatók. Emellett a partíciómappák létrehozásakor felülről lefelé használják őket. Ha például a partícióoszlopok Year (Év) és Month (Hónap) voltak, akkor az ADLS-ben az alábbihoz hasonló struktúra jelenik meg:
Ahol az 1. és a 2. fájl tartalmazza az összes sort, ahol az Év és a Hónap érték 2020, illetve Jan értékeket tartalmazott. Minél több partícióoszlopot ad hozzá egy táblához, annál több fájl lesz hozzáadva ehhez a hierarchiához, így a partíciók teljes fájlmérete csökken.
Azure Synapse nem kényszeríti ki vagy hozza létre ezt a hierarchiát úgy, hogy partícióoszlopokat ad hozzá egy táblához. A partícióstruktúra létrehozásához az adatokat a Synapse Pipelines vagy egy Spark-jegyzetfüzet használatával kell betölteni a táblába.
Kapcsolatok
A Kapcsolatok lapon megadhatja az adatbázis táblái közötti kapcsolatokat. Az adatbázis-tervezőben lévő kapcsolatok tájékoztató jellegűek, és nem kényszerítik a mögöttes adatokra vonatkozó korlátozásokat. Más Microsoft-alkalmazások olvassák őket, hogy felgyorsítsák az átalakításokat, vagy betekintést nyújtsanak az üzleti felhasználók számára a táblák csatlakoztatásának módjába. A Kapcsolatok panelen az alábbi információk láthatók.
- A(z) (Tábla) típusú kapcsolatok akkor vannak, ha egy vagy több táblához külső kulcsok vannak csatlakoztatva. Ezt néha szülőkapcsolatnak is nevezik.
- A(z) táblához való kapcsolat akkor van, ha egy tábla idegen kulccsal rendelkezik, és más táblához csatlakozik. Ezt néha gyermekkapcsolatnak is nevezik.
- Mindkét kapcsolattípus a következő tulajdonságokkal rendelkezik.
- A táblában a szülőtábla a kapcsolatban, vagy az "egy" oldalon.
- A szülőtábla oszlopából kiindulva a kapcsolat alapja.
- A gyermektábla táblázatba való betáblázásához a kapcsolatban vagy a "több" oldalon.
- A gyermektábla oszlopának oszlopához a kapcsolat alapul. A Kapcsolatok lap tetején található a kapcsolatok kezelésére használható parancssáv
- A szűrés kulcsszó alapján a megadott kulcsszónak megfelelő elemekre szűri az oszlopok listáját.
-
+ A Kapcsolat funkcióval új kapcsolatot adhat hozzá. Két lehetőség érhető el.
- A Táblából új kapcsolatot hoz létre abból a táblából, amelyen éppen dolgozik, és egy másik táblához.
- A tábla létrehozása új kapcsolatot hoz létre egy másik táblából a másik táblához, amelyen éppen dolgozik.
- A sablonból megnyithatja a feltárási panelt, és kiválaszthatja az adatbázissablonban az adatbázisba felvenni kívánt kapcsolatokat. Ha az adatbázis nem adatbázissablonnal lett létrehozva, ez a lehetőség nem jelenik meg.
Következő lépések
Folytassa az adatbázis-tervező képességeit az alábbi hivatkozásokkal.