Adatok másolása SQL Server-adatbázisból az Azure Blob Storage-ba
A következőkre vonatkozik: Azure Data Factory Azure Synapse Analytics
Tipp.
Próbálja ki a Data Factoryt a Microsoft Fabricben, amely egy teljes körű elemzési megoldás a nagyvállalatok számára. A Microsoft Fabric az adattovábbítástól az adatelemzésig, a valós idejű elemzésig, az üzleti intelligenciáig és a jelentéskészítésig mindent lefed. Ismerje meg, hogyan indíthat új próbaverziót ingyenesen!
Ebben az oktatóanyagban az Azure Data Factory felhasználói felületével (UI) hoz létre egy adat-előállító folyamatot, amely adatokat másol egy SQL Server-adatbázisból az Azure Blob Storage-ba. Létrehozhat és alkalmazhat egy saját üzemeltetésű integrációs modult, amely adatokat helyez át a helyszíni és a felhőalapú adattárolók között.
Feljegyzés
Ez a cikk nem mutatja be részletesen a Data Factory szolgáltatást. További információ: A Data Factory bemutatása.
Az oktatóanyagban az alábbi lépéseket fogja végrehajtani:
- Adat-előállító létrehozása
- Hozzon létre helyi integrációs modult.
- SQL Server- és Azure Storage-beli társított szolgáltatások létrehozása.
- SQL Server- és Azure Blob-adatkészletek létrehozása.
- Folyamat létrehozása másolási tevékenységgel az adatok áthelyezéséhez
- Folyamat futásának indítása
- A folyamat futásának monitorozása.
Előfeltételek
Azure-előfizetés
Ha még nem rendelkezik Azure-előfizetéssel, első lépésként hozzon létre egy ingyenes fiókot.
Azure-szerepkörök
Az adat-előállító példányok létrehozásához annak a felhasználói fióknak, amellyel bejelentkezik az Azure-ba, a közreműködő vagy tulajdonos szerepkör tagjának, vagy az Azure-előfizetés rendszergazdájának kell lennie.
Az előfizetésben található engedélyek megtekintéséhez lépjen be az Azure Portalra. Válassza ki a felhasználónevet a jobb felső sarokban, majd válassza az Engedélyek elemet. Ha több előfizetéshez is rendelkezik hozzáféréssel, válassza ki a megfelelő előfizetést. A felhasználó szerepkörhöz való hozzáadására vonatkozó mintautasításért lásd : Azure-szerepkörök hozzárendelése az Azure Portal használatával.
SQL Server 2014, 2016 és 2017
Ebben az oktatóanyagban egy SQL Server-adatbázist használ forrásadattárként. Az ebben az oktatóanyagban létrehozott data factory-folyamat adatokat másol ebből az SQL Server-adatbázisból (forrásból) a Blob Storage-ba (fogadóba). Ezután létre fog hozni egy emp nevű táblát az SQL Server-adatbázisban, és beszúr a táblába néhány mintabejegyzést.
Indítsa el az SQL Server Management Studiót. Ha még nincs telepítve a számítógépen, tekintse meg az SQL Server Management Studio letöltését ismertető cikket.
Csatlakozzon az SQL Server-példányához a hitelesítő adataival.
Hozzon létre egy mintaadatbázist. A fanézetben kattintson a jobb gombbal a Databases (Adatbázisok) elemre, majd válassza a New Database (Új adatbázis) elemet.
Az New Database (Új adatbázis) ablakban adjon nevet az új adatbázisnak, majd kattintson az OK gombra.
Az emp tábla létrehozásához és néhány mintaadat beszúrásához futtassa a következő lekérdezési szkriptet az adatbázison. A fanézetben kattintson a jobb gombbal a létrehozott adatbázisra, majd válassza a New Query (Új lekérdezés) elemet.
CREATE TABLE dbo.emp ( ID int IDENTITY(1,1) NOT NULL, FirstName varchar(50), LastName varchar(50) ) GO INSERT INTO emp (FirstName, LastName) VALUES ('John', 'Doe') INSERT INTO emp (FirstName, LastName) VALUES ('Jane', 'Doe') GO
Azure Storage-fiók
Ebben az oktatóanyagban egy általános célú Azure Storage-fiókot (ebben az esetben blobtárolót) használunk cél-/fogadóadattárként. Ha még nem rendelkezik általános célú Azure Storage-fiókkal, tekintse meg a Tárfiók létrehozását ismertető cikket. Az oktatóanyagban létrehozott data factory-folyamat adatokat másol az SQL Server-adatbázisból (forrásból) a Blob Storage-ba (fogadóba).
Tárfióknév és fiókkulcs beszerzése
Ebben az oktatóanyagban a tárfiók nevét és kulcsát használjuk. A tárfiók nevét és kulcsát az alábbi lépéseket követve szerezheti be:
Jelentkezzen be az Azure Portalra az Azure-ban használt felhasználónevével és jelszavával.
A bal oldali panelen válassza a Minden szolgáltatás lehetőséget. Szűrjön rá a Tárolás kulcsszóra, majd válassza a Tárfiókok lehetőséget.
A tárfiókok listájában szükség esetén szűrjön a tárfiókra. Ezután válassza ki a tárfiókot.
A Tárfiók ablakban válassza a Hozzáférési kulcsok elemet.
Másolja a Tárfiók neve és 1. kulcs mező értékét, majd illessze be őket egy jegyzettömbbe vagy más szerkesztőbe az oktatóanyag későbbi részeiben történő használatra.
Adftutorial tároló létrehozása
Ebben a szakaszban egy adftutorial nevű blobtárolót hoz létre a Blob Storage-ban.
A Storage-fiók ablakában lépjen az Áttekintés elemre, majd válassza a Tárolók lehetőséget.
A Tárolók ablakban válassza a + Tároló lehetőséget egy új létrehozásához.
Az Új tároló ablak Név mezőjébe írja be az adftutorial nevet. Válassza a Létrehozás parancsot.
A tárolók listájában válassza ki az imént létrehozott adftutorialt .
Ne zárja be az adftutorialtároló ablakát. Ezzel ellenőrizheti a kimenetet az oktatóanyag végén. A Data Factory automatikusan létrehozza a kimeneti mappát a tárolóban, így nem kell újat létrehoznia.
Adat-előállító létrehozása
Ebben a lépésben létrehoz egy adat-előállítót, és elindítja a Data Factory felhasználói felületét, hogy létrehozzon egy folyamatot az adat-előállítóban.
Nyissa meg a Microsoft Edge vagy a Google Chrome böngészőt. A Data Factory felhasználói felületének használata jelenleg csak a Microsoft Edge-ben és a Google Chrome-ban támogatott.
A bal oldali menüben válassza az Erőforrás-integrációs>>adat-előállító létrehozása lehetőséget:
Az Új adat-előállító lap Név mezőjében adja meg az ADFTutorialDataFactory értéket.
Az adat-előállító nevének globálisan egyedinek kell lennie. Ha a Név mezőnél az alábbi hibaüzenet jelenik meg, módosítsa az adat-előállító nevét (például a következőre: sajátneveADFTutorialDataFactory). A Data Factory-összetevők elnevezési szabályait a Data Factory elnevezési szabályait ismertető cikkben találja.
Válassza ki azt az Azure-előfizetést, amelyben az adat-előállítót létre szeretné hozni.
Erőforráscsoport: hajtsa végre a következő lépések egyikét:
Kattintson a Meglévő használata elemre, majd a legördülő listából válasszon egy meglévő erőforráscsoportot.
Kattintson az Új létrehozása elemre, és adja meg az erőforráscsoport nevét.
Az erőforráscsoportokkal kapcsolatos információkért tekintse meg az Erőforráscsoportok használata az Azure-erőforrások kezeléséhez ismertető cikket.
A Verzió résznél válassza a V2 értéket.
A Hely alatt válassza ki az adat-előállító helyét. A legördülő listán csak a támogatott helyek jelennek meg. A Data Factory által használt adattárak (például a Storage és az SQL Database) és számítási erőforrások (például az Azure HDInsight) más régiókban is lehetnek.
Válassza a Létrehozás lehetőséget.
A létrehozás befejezése után a Data Factory lap a képen látható módon jelenik meg:
Válassza a Megnyitás az Azure Data Factory Studio megnyitása csempén a Data Factory felhasználói felületének külön lapon való elindításához.
Folyamat létrehozása
Az Azure Data Factory kezdőlapján válassza az Orchestrate lehetőséget. A rendszer automatikusan létrehoz egy folyamatot. A folyamat fanézetben jelenik meg, és megnyílik a szerkesztő is.
A Tulajdonságok panel Általános paneljén adja meg az SQLServerToBlobPipeline nevet. Ezután a jobb felső sarokban található Tulajdonságok ikonra kattintva összecsukja a panelt.
A Tevékenységek eszközmezőben bontsa ki az Áthelyezés és átalakítás elemet. Húzza a Másolás tevékenységet a folyamat tervezési felületére. Állítsa a tevékenység nevét a következőre: CopySqlServerToAzureBlobActivity.
A Tulajdonságok ablakban lépjen a Forrás lapra, és válassza a + Új elemet.
Az Új adatkészlet párbeszédpanelen keressen rá az SQL Serverre. Válassza az SQL Servert, majd a Folytatás lehetőséget.
A Tulajdonságok beállítása párbeszédpanel Név területén adja meg az SqlServerDataset nevet. A Csatolt szolgáltatás területen válassza az + Új lehetőséget. Ebben a lépésben egy kapcsolatot hoz létre a forrásadatkészlettel (az SQL Server-adatbázissal).
Az Új társított szolgáltatás párbeszédpanelen adja hozzá a nevet SqlServerLinkedService néven. A Csatlakozás integrációs futtatókörnyezeten keresztül területen válassza az +Új lehetőséget. Ebben a szakaszban egy saját üzemeltetésű Integration Runtime átjárót hozhat létre, és társíthatja azt az SQL Server-adatbázist futtató helyszíni géppel. A saját üzemeltetésű integrációs modul az a komponens, amely adatokat másol a gépen futó SQL Server-adatbázisból a Blob Storage-ba.
Az Integrációs modul beállítása párbeszédpanelen válassza a Saját üzemeltetésű, majd a Folytatás lehetőséget.
A név alatt adja meg a TutorialIntegrationRuntime nevet. Válassza a Létrehozás parancsot.
A Beállítások beállításnál kattintson ide a számítógép expressz beállításának elindításához. Ez a művelet telepíti az integrációs modult a számítógépére, és regisztrálja azt a Data Factoryban. Használhatja a manuális telepítési lehetőséget is. Ehhez töltse le a telepítőfájlt, futtassa, majd a kulccsal regisztrálja az integrációs modult.
Az Integration Runtime (helyi) Express beállítási ablakban válassza a Bezárás elemet, amikor a folyamat befejeződött.
Az Új társított szolgáltatás (SQL Server) párbeszédpanelen ellenőrizze, hogy a TutorialIntegrationRuntime be van-e jelölve a Csatlakozás integrációs modulon keresztül. Ezután hajtsa végre a következő lépéseket:
a. A Név mezőben adja meg az SqlServerLinkedService nevet.
b. A Kiszolgáló neve alatt adja meg az SQL Server-példány nevét.
c. Az Adatbázis neve alatt adja meg az emp táblával rendelkező adatbázis nevét.
d. A Hitelesítés típusa alatt válassza ki azt a hitelesítési típust, amelyet a Data Factorynak az SQL Server-adatbázishoz történő csatlakozáshoz használnia kell.
e. A Felhasználónév és a Jelszó alatt adja meg a felhasználónevet és a jelszót. Szükség esetén használja a mydomain\myuser felhasználónevet.
f. Válassza a Kapcsolat tesztelése elemet. Ez a lépés annak ellenőrzésére szolgál, hogy a Data Factory képes-e csatlakozni az SQL Server-adatbázishoz a létrehozott saját üzemeltetésű integrációs modullal.
: A csatolt szolgáltatás mentéséhez válassza a Létrehozás lehetőséget.
A társított szolgáltatás létrehozása után visszatér az SqlServerDataset Tulajdonságkészlet beállítása lapjára. Tegye a következőket:
a. Ellenőrizze, hogy a Társított szolgáltatás mezőben látható-e az SqlServerLinkedService szolgáltatás.
b. A Táblanév csoportban válassza a [dbo].[ emp].
c. Kattintson az OK gombra.
Lépjen az SQLServerToBlobPipeline folyamatot tartalmazó lapra, vagy válassza az SQLServerToBlobPipeline folyamatot a fanézetben.
Lépjen a Fogadó lapra a Tulajdonságok ablak alján, és válassza a + Új elemet.
Az Új adathalmaz párbeszédpanelen válassza az Azure Blob Storage lehetőséget. Ezután válassza a Folytatás elemet.
A Formátum kiválasztása párbeszédpanelen válassza ki az adatok formátumtípusát. Ezután válassza a Folytatás elemet.
A Tulajdonságok beállítása párbeszédpanelen adja meg az AzureBlobDataset for Name kifejezést. A Társított szolgáltatások szövegbeviteli mező mellett válassza az + Új lehetőséget.
Az Új társított szolgáltatás (Azure Blob Storage) párbeszédpanelen adja meg az AzureStorageLinkedService nevet, és válassza ki a tárfiókot a Tárfiók névlistájából. Tesztelje a kapcsolatot, majd válassza a Létrehozás lehetőséget a társított szolgáltatás üzembe helyezéséhez.
A társított szolgáltatás létrehozása után visszatér a Tulajdonságok beállítása lapra. Kattintson az OK gombra.
Nyissa meg a fogadó adatkészletét. A Kapcsolat lapon hajtsa végre az alábbi lépéseket:
a. Ellenőrizze, hogy a Társított szolgáltatás részen az AzureStorageLinkedService van-e kiválasztva.
b. A Fájl elérési útján adja meg az adftutorial/fromonprem értéket a Container/Directory részhez. Ha a kimeneti mappa nem létezik az adftutorial tárolóban, a Data Factory automatikusan létrehozza azt.
c. A Fájl résznél válassza a Dinamikus tartalom hozzáadása lehetőséget.
d. Adja hozzá
@CONCAT(pipeline().RunId, '.txt')
, majd válassza a Befejezés lehetőséget. Ez a művelet átnevezi a fájlt PipelineRunID.txt.Lépjen a megnyitott folyamatot tartalmazó lapra, vagy válassza ki a folyamatot a fanézetben. Ellenőrizze, hogy a Fogadó-adatkészlet mezőben az AzureBlobDataset érték van-e kiválasztva.
A folyamat beállításainak érvényesítéséhez válassza az Érvényesítés elemet a folyamat eszköztárán. A Pipa érvényesítési kimenetének bezárásához válassza az ikont>>.
A Data Factoryben létrehozott entitások közzétételéhez válassza az Összes közzététele lehetőséget.
Várjon, amíg megjelenik a Közzététel befejeződött előugró ablak. A közzététel állapotának ellenőrzéséhez válassza az értesítések megjelenítése hivatkozást az ablak tetején. Az értesítési ablak bezárásához válassza a Bezárás elemet.
Folyamat futtatásának aktiválása
Válassza az Eseményindító hozzáadása lehetőséget a folyamat eszköztárán, majd válassza az Eseményindító most lehetőséget.
A folyamat futásának monitorozása
Lépjen a Figyelés lapra. Az előző lépésben manuálisan aktivált folyamat jelenik meg.
A folyamatfuttatáshoz társított tevékenységfuttatások megtekintéséhez válassza az SQLServerToBlobPipeline hivatkozást a PIPELINE NAME területen.
A Tevékenység futtatása lapon válassza a Részletek (szemüveg képe) hivatkozást a másolási művelet részleteinek megtekintéséhez. Ha vissza szeretne lépni a Folyamatfuttatások nézetre, válassza a felül található Minden folyamatfuttatás lehetőséget.
Kimenet ellenőrzése
A folyamat automatikusan létrehozza a fromonprem nevű kimeneti mappát az adftutorial
blobtárolóban. Ellenőrizze, hogy a [pipeline().RunId].txt fájl megjelenik-e a kimeneti mappában.
Kapcsolódó tartalom
A példában szereplő folyamat adatokat másol az egyik helyről egy másikra a Blob Storage-ban. Megtanulta végrehajtani az alábbi műveleteket:
- Adat-előállító létrehozása
- Hozzon létre helyi integrációs modult.
- SQL Server- és Storage-beli társított szolgáltatások létrehozása.
- SQL Server- és Blob Storage-adatkészletek létrehozása.
- Folyamat létrehozása másolási tevékenységgel az adatok áthelyezéséhez
- Folyamat futásának indítása
- A folyamat futásának monitorozása.
A Data Factory által támogatott adattárak listáját a támogatott adattárakat ismertető cikk tartalmazza.
Az adatok egy forrásból egy célhelyre történő tömeges másolásának megismeréséhez lépjen a következő oktatóanyagra: