Adatok betöltése az Azure Data Lake Storage Gen2-be

Ebben a cikkben megtudhatja, hogyan lehet adatokat átvinni egyik tárfiókból a másikba az Azure Data Lake Gen 2 tárolón belül az Azure Synapse Analytics használatával.

Előfeltételek

  • Azure-előfizetés: Ha nem rendelkezik Azure-előfizetéssel, a kezdés előtt hozzon létre egy ingyenes Azure-fiókot .
  • Azure Storage-fiók: Az Azure Data Lake Gen 2-t használja forrásadattárként. Ha nincs tárfiókja, a létrehozás lépéseit az Azure Storage-fiók létrehozása című témakörben találja.

Társított szolgáltatások létrehozása

Az Azure Synapse Analyticsben egy társított szolgáltatásban határozhatja meg a kapcsolatadatait más szolgáltatások számára. Ebben a szakaszban az Azure Synapse Analytics és az Azure Data Lake Gen 2 társított szolgáltatásként lesz hozzáadva.

  1. Nyissa meg az Azure Synapse Analytics UX-t, és lépjen a Kezelés lapra.
  2. A Külső kapcsolatok területen válassza a Csatolt szolgáltatások lehetőséget.
  3. Csatolt szolgáltatás hozzáadásához válassza az Új lehetőséget.
  4. Válassza ki az Azure Data Lake Storage Gen2 csempét a listából, és válassza a Folytatás lehetőséget.
  5. Adja meg a hitelesítési adatait. A fiókkulcs, a szolgáltatásnév és a felügyelt identitás jelenleg támogatott hitelesítési típusok. Válassza a tesztkapcsolatot a hitelesítő adatok helyességének ellenőrzéséhez.
  6. Miután végzett, válassza a Létrehozás lehetőséget.

Folyamat létrehozása

Egy folyamatterv tartalmazza a tevékenységek egy csoportjának végrehajtásához szükséges logikai folyamatot. Ebben a szakaszban egy olyan másolási tevékenységet tartalmazó folyamatot fog létrehozni, amely az Azure Data Lake Gen 2-ből egy dedikált SQL-készletbe betölti az adatokat.

  1. Lépjen az Orchestrate lapra. Kattintson a folyamatok fejléc melletti plusz ikonra, majd válassza a Folyamat lehetőséget.
  2. A tevékenységek panelen az Áthelyezés és átalakítás alatt húzza az Adatok másolása elemet a folyamatvászonra.
  3. Válassza ki a másolási tevékenységet, és lépjen a Forrás lapra. Új forrásadatkészlet létrehozásához válassza az Új lehetőséget.
  4. Válassza az Azure Data Lake Storage Gen2-t adattárként, és válassza a Folytatás lehetőséget.
  5. Formátumként válassza a DelimitedText elemet, majd válassza a Folytatás lehetőséget.
  6. A Tulajdonságok beállítása panelen válassza ki a létrehozott ADLS társított szolgáltatást. Adja meg a forrásadatok elérési útját, és adja meg, hogy az első sor fejléccel rendelkezik-e. Importálhatja a sémát a fájltárolóból vagy egy mintafájlból. Ha végzett , válassza az OK gombra.
  7. Lépjen a Fogadó lapra. Új fogadóadatkészlet létrehozásához válassza az Új lehetőséget.
  8. Válassza az Azure Data Lake Storage Gen2-t adattárként, és válassza a Folytatás lehetőséget.
  9. Formátumként válassza a DelimitedText elemet, majd válassza a Folytatás lehetőséget.
  10. A Tulajdonságok beállítása panelen válassza ki a létrehozott ADLS társított szolgáltatást. Adja meg annak a mappának az elérési útját, amelyben adatokat szeretne írni. Ha végzett , válassza az OK gombra.

Folyamat hibakeresése és közzététele

Miután befejezte a folyamat konfigurálását, végrehajthat egy hibakeresési futtatást, mielőtt közzéteszi az összetevőket, hogy ellenőrizze, hogy minden helyes-e.

  1. A folyamat hibakereséséhez válassza a Hibakeresés elemet az eszköztáron. A folyamat futtatási állapotát az ablak alján található Kimenet lapon tekintheti meg.
  2. Miután a folyamat sikeresen lefutott, a felső eszköztáron válassza az Összes közzététele lehetőséget. Ez a művelet közzéteszi a Synapse Analytics szolgáltatásban létrehozott entitásokat (adathalmazokat és folyamatokat).
  3. Várjon, amíg megjelenik a Sikeres közzététel üzenet. Az értesítési üzenetek megtekintéséhez kattintson a jobb felső sarokban található harang gombra.

A folyamat aktiválása és figyelése

Ebben a lépésben manuálisan elindítja az előző lépésben közzétett pipeline-t.

  1. Válassza az Eseményindító hozzáadása lehetőséget az eszköztáron, majd válassza az Eseményindító most lehetőséget. A Folyamatfuttatás lapon válassza a Befejezés lehetőséget.
  2. Lépjen a bal oldali oldalsávOn található Monitor fülre. Itt láthat egy manuális eseményindító által aktivált folyamatfuttatást. A Műveletek oszlopban található hivatkozások használatával megtekintheti a tevékenységek részleteit, és újra futtathatja a folyamatot.
  3. A folyamatfuttatáshoz társított tevékenységfuttatások megtekintéséhez válassza a Tevékenységfuttatások megtekintése hivatkozást a Műveletek oszlopban. Ebben a példában csak egy tevékenység van, így csak egy bejegyzés jelenik meg a listában. A másolási művelettel kapcsolatos részletekért válassza a Részletek hivatkozást (szemüveg ikon) a Műveletek oszlopban. Válassza a Folyamatfuttatások lehetőséget felül, hogy visszalépjen a Folyamatfuttatások nézetre. A nézet frissítéséhez válassza a Frissítés parancsot.
  4. Ellenőrizze, hogy az adatok helyesen íródnak-e a dedikált SQL-készletben.

Következő lépések

Az Azure Synapse Analytics adatintegrációjára vonatkozó további információkért tekintse meg az adatok dedikált SQL-készletbe való betöltéséről szóló cikket.