Megosztás a következőn keresztül:


Adatok elemzése dedikált SQL-készletekkel

Ebben az oktatóanyagban az NYC Taxi adataival ismerkedhet meg egy dedikált SQL-készlet képességeivel.

Create a dedicated SQL pool

  1. A Synapse Studióban a bal oldali panelen válassza az SQL-készletek kezelése>lehetőséget az Analytics-készletek alatt.
  2. Válassza az Új lehetőséget.
  3. A dedikált SQL-készlet neveként válassza a lehetőséget SQLPOOL1.
  4. A teljesítményszinthez válassza a DW100C lehetőséget.
  5. Válassza a Felülvizsgálat + létrehozás>Létrehozás lehetőséget. A dedikált SQL-készlet néhány perc múlva készen áll.

A dedikált SQL-készlet egy más néven SQLPOOL1SQL-adatbázishoz van társítva.

  1. Lépjen az Adat-munkaterületre>.
  2. Egy SQLPOOL1 nevű adatbázisnak kell megjelennie. Ha nem látja, válassza a Frissítés lehetőséget.

A dedikált SQL-készlet mindaddig számlázható erőforrásokat használ fel, amíg aktív. A költségek csökkentése érdekében később szüneteltetheti a készletet.

Megjegyzés:

Amikor új dedikált SQL-készletet (korábbi nevén SQL DW-t) hoz létre a munkaterületen, megnyílik a dedikált SQL-készlet kiépítési oldala. A kiépítés a logikai SQL-kiszolgálón történik.

Az NYC Taxi adatainak betöltése a SQLPOOL1

  1. A Synapse Studióban lépjen a Fejlesztés központra, válassza ki a + gombot új erőforrás hozzáadásához, majd hozzon létre új SQL-szkriptet.

  2. Válassza ki a készletet SQLPOOL1 (az oktatóanyag 1. LÉPÉSében létrehozott készletet) Csatlakozás a szkript fölötti lista legördülő listájához.

  3. Írja be a következő kódot:

    IF NOT EXISTS (SELECT * FROM sys.objects O JOIN sys.schemas S ON O.schema_id = S.schema_id WHERE O.NAME = 'NYCTaxiTripSmall' AND O.TYPE = 'U' AND S.NAME = 'dbo')
    CREATE TABLE dbo.NYCTaxiTripSmall
        (
        [VendorID] bigint, 
        [store_and_fwd_flag] nvarchar(1) NULL, 
        [RatecodeID] float NULL, 
        [PULocationID] bigint NULL,  
        [DOLocationID] bigint NULL, 
        [passenger_count] float NULL, 
        [trip_distance] float NULL, 
        [fare_amount] float NULL, 
        [extra] float NULL, 
        [mta_tax] float NULL, 
        [tip_amount] float NULL, 
        [tolls_amount] float NULL, 
        [ehail_fee] float NULL, 
        [improvement_surcharge] float NULL, 
        [total_amount] float NULL, 
        [payment_type] float NULL, 
        [trip_type] float NULL, 
        [congestion_surcharge] float  NULL
        )
    WITH
        (
        DISTRIBUTION = ROUND_ROBIN,
         CLUSTERED COLUMNSTORE INDEX
         -- HEAP
        )
    GO
    
    COPY INTO dbo.NYCTaxiTripSmall
    (VendorID 1, store_and_fwd_flag 4, RatecodeID 5,  PULocationID 6 , DOLocationID 7,  
     passenger_count 8,trip_distance 9, fare_amount 10, extra 11, mta_tax 12, tip_amount 13, 
     tolls_amount 14, ehail_fee 15, improvement_surcharge 16, total_amount 17, 
     payment_type 18, trip_type 19, congestion_surcharge 20 )
    FROM 'https://contosolake.dfs.core.windows.net/users/NYCTripSmall.parquet'
    WITH
    (
        FILE_TYPE = 'PARQUET'
        ,MAXERRORS = 0
        ,IDENTITY_INSERT = 'OFF'
    )
    
  4. A szkript végrehajtásához válassza a Futtatás gombot.

  5. Ez a szkript kevesebb mint 60 másodperc alatt fejeződik be. 2 millió sorNYI NYC Taxi-adatot tölt be egy úgynevezett dbo.NYCTaxiTripSmalltáblába.

Az NYC Taxi adatainak felfedezése a dedikált SQL-készletben

  1. A Synapse Studióban nyissa meg a Data Hubot.

  2. Nyissa meg SQLPOOL1 Táblák elemet>.

  3. Kattintson a jobb gombbal a dbo-ra. NYCTaxiTripSmall tábla, és válassza az Új SQL-szkript>select TOP 100 Sorok.

  4. Várjon, amíg létrejön és fut egy új SQL-szkript.

  5. Az SQL-szkript tetején Csatlakozás automatikusan a SQLPOOL1 nevű SQL-készletre van állítva.

  6. Cserélje le az SQL-szkript szövegét erre a kódra, és futtassa.

    SELECT passenger_count as PassengerCount,
          SUM(trip_distance) as SumTripDistance_miles,
          AVG(trip_distance) as AvgTripDistance_miles
    INTO dbo.PassengerCountStats
    FROM  dbo.NYCTaxiTripSmall
    WHERE trip_distance > 0 AND passenger_count > 0
    GROUP BY passenger_count;
    
    SELECT * FROM dbo.PassengerCountStats
    ORDER BY PassengerCount;
    

    Ez a lekérdezés létrehoz egy táblát dbo.PassengerCountStats a trip_distance mező összesített adataival, majd lekérdezi az új táblát. Az adatok azt mutatják, hogy a teljes utazási távolság és az átlagos utazási távolság hogyan viszonyul az utasok számához.

  7. Az SQL-szkript eredményablakában módosítsa a nézetet diagramra az eredmények vonaldiagramként való vizualizációjának megtekintéséhez. Kategória oszlopának módosítása a gombraPassengerCount.

Következő lépés