Adatok elemzése kiszolgáló nélküli SQL-készlettel

Ebben az oktatóanyagban megtanulhatja, hogyan elemezheti az adatokat kiszolgáló nélküli SQL-készlettel.

A beépített kiszolgáló nélküli SQL-készlet

A kiszolgáló nélküli SQL-készletek lehetővé teszik az SQL használatát anélkül, hogy kapacitást kellene lefoglalnia. A kiszolgáló nélküli SQL-készlet számlázása a lekérdezés futtatásához feldolgozott adatok mennyiségén alapul, nem pedig a lekérdezés futtatásához használt csomópontok számán.

Minden munkaterülethez tartozik egy beépített, előre konfigurált kiszolgáló nélküli SQL-készlet.

NYC Taxi-adatok elemzése kiszolgáló nélküli SQL-készlettel

Note

Győződjön meg arról, hogy a mintaadatokat az elsődleges tárfiókba helyezte

  1. A Synapse Studióban nyissa meg a Fejlesztés központot

  2. Hozzon létre egy új SQL-szkriptet.

  3. Illessze be a következő kódot a szkriptbe. (Frissítse contosolake a(z) tárfiók nevére és users a(z) tároló nevére.)

    SELECT
        TOP 100 *
    FROM
        OPENROWSET(
            BULK 'https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet',
            FORMAT='PARQUET'
        ) AS [result]
    
  4. Válassza a Futtatás parancsot.

Az adatfeltárás csak egy egyszerűsített forgatókönyv, amelyben megismerheti az adatok alapvető jellemzőit. Ebben az oktatóanyagban további információt talál az adatfeltárásról és -elemzésről.

Adatfeltárási adatbázis létrehozása

A fájlok tartalmát közvetlenül master adatbázison keresztül böngészheti. Néhány egyszerű adatfeltárási forgatókönyv esetén nem kell külön adatbázist létrehoznia. Az adatfeltárás folytatása során azonban érdemes lehet létrehozni néhány segédprogramobjektumot, például:

  • Külső adatforrások, amelyek a tárfiókok nevesített hivatkozásait jelölik.
  • Az adatbázis hatókörébe tartozó hitelesítő adatok, amelyek lehetővé teszik a külső adatforrások hitelesítésének megadását.
  • Adatbázis-felhasználók, akik bizonyos adatforrásokhoz vagy adatbázis-objektumokhoz való hozzáférésre vonatkozó engedélyekkel rendelkeznek.
  • A lekérdezésekben használható segédprogramnézetek, eljárások és függvények.

Jótanács

A Synapse Studióban egy új SQL-szkript megnyitásakor a felső eszköztár adatbázis legördülő menüjében választhatja ki a főkiszolgálót. Ez az alapértelmezett rendszeradatbázis, amely kiszolgáló nélküli SQL-készletekhez jelenik meg.

  1. master Az adatbázis használatával külön adatbázist hozhat létre egyéni adatbázis-objektumokhoz. Egyéni adatbázis-objektumok nem hozhatók létre az master adatbázisban.

    CREATE DATABASE DataExplorationDB 
                    COLLATE Latin1_General_100_BIN2_UTF8
    

    Fontos

    Az UTF-8 szöveg VARCHAR oszlopokká történő megfelelő átalakításának biztosításához használjon _UTF8 végződésű kollációt. Latin1_General_100_BIN2_UTF8 A legjobb teljesítményt nyújt a Parquet-fájlokból és az Azure Cosmos DB-tárolókból adatokat olvasó lekérdezésekben. A rendezés módosításáról további információt a Synapse SQL által támogatott rendezési típusok című témakörben talál.

  2. Állítsa át az adatbázis-környezetet master-ról DataExplorationDB-re a következő parancs használatával. Az use database felhasználói felület vezérlő használatával átválthatja az aktuális adatbázist is.

    USE DataExplorationDB
    
  3. Hozzon létre DataExplorationDB segédprogram-objektumokat, például hitelesítő adatokat és adatforrásokat.

    CREATE EXTERNAL DATA SOURCE ContosoLake
    WITH ( LOCATION = 'https://contosolake.dfs.core.windows.net')
    

    Note

    Külső adatforrás hitelesítő adatok nélkül is létrehozható. Ha nem létezik hitelesítő adat, a rendszer a hívó identitását használja a külső adatforrás eléréséhez.

  4. Ha szeretné, az újonnan létrehozott DataExplorationDB adatbázis használatával hozzon létre egy bejelentkezést egy olyan felhasználó DataExplorationDB számára, aki hozzáfér a külső adatokhoz:

    CREATE LOGIN data_explorer WITH PASSWORD = 'My Very Strong Password 1234!';
    

    Ezután hozzon létre egy adatbázis-felhasználót DataExplorationDB a fenti bejelentkezéshez, és adja meg az ADMINISTER DATABASE BULK OPERATIONS engedélyt.

    CREATE USER data_explorer FOR LOGIN data_explorer;
    GO
    GRANT ADMINISTER DATABASE BULK OPERATIONS TO data_explorer;
    GO
    
  5. Vizsgálja meg a fájl tartalmát a relatív elérési út és az adatforrás használatával:

    SELECT
        TOP 100 *
    FROM
        OPENROWSET(
                BULK '/users/NYCTripSmall.parquet',
                DATA_SOURCE = 'ContosoLake',
                FORMAT='PARQUET'
        ) AS [result]
    
  6. Tegye közzé a módosításokat a munkaterületen.

Az adatfeltárási adatbázis csak egy egyszerű helyőrző, ahol a segédprogram objektumait tárolhatja. A Synapse SQL-készlettel sokkal több műveletet végezhet, és létrehozhat egy logikai adattárházat – egy relációs réteget, amely az Azure-adatforrásokra épül. Ebben az oktatóanyagban további információt talál a logikai adattárház felépítéséről.

Következő lépések