Adatok másolása a Google BigQueryből az Azure Data Factory vagy a Synapse Analytics használatával

A következőkre vonatkozik: Azure Data Factory Azure Synapse Analytics

Tipp.

Próbálja ki a Data Factoryt a Microsoft Fabricben, amely egy teljes körű elemzési megoldás a nagyvállalatok számára. A Microsoft Fabric az adattovábbítástól az adatelemzésig, a valós idejű elemzésig, az üzleti intelligenciáig és a jelentéskészítésig mindent lefed. Ismerje meg, hogyan indíthat új próbaverziót ingyenesen!

Ez a cikk bemutatja, hogyan használható a Másolási tevékenység az Azure Data Factoryben és a Synapse Analytics-folyamatokban adatok másolására a Google BigQueryből. A másolási tevékenység áttekintési cikkére épül, amely általános áttekintést nyújt a másolási tevékenységről.

Fontos

Az új Google BigQuery-összekötő továbbfejlesztett natív Google BigQuery-támogatást biztosít. Ha a régi Google BigQuery-összekötőt használja a megoldásban, a támogatott verzió csak a visszamenőleges kompatibilitást szolgálja, tekintse meg a Google BigQuery-összekötő (örökölt) cikkét.

Támogatott képességek

Ez a Google BigQuery-összekötő a következő képességeket támogatja:

Támogatott képességek IR
Copy tevékenység (forrás/-) (1) (2)
Keresési tevékenység (1) (2)

(1) Azure-integrációs modul (2) Saját üzemeltetésű integrációs modul

A másolási tevékenység által forrásként vagy fogadóként támogatott adattárak listáját a Támogatott adattárak táblában találja.

A szolgáltatás egy beépített illesztőprogramot biztosít a kapcsolat engedélyezéséhez. Ezért nem kell manuálisan telepítenie egy illesztőprogramot az összekötő használatához.

Feljegyzés

Ez a Google BigQuery-összekötő a BigQuery API-kra épül. Vegye figyelembe, hogy a BigQuery korlátozza a bejövő kérelmek maximális sebességét, és projektenkénti alapon kényszeríti ki a megfelelő kvótákat, tekintse meg a Kvóták > Korlátok – API-kérelmeket. Győződjön meg arról, hogy nem indít túl sok egyidejű kérést a fiókhoz.

Első lépések

A Copy tevékenység folyamattal való végrehajtásához használja az alábbi eszközök vagy SDK-k egyikét:

Társított szolgáltatás létrehozása a Google BigQueryhez felhasználói felülettel

Az alábbi lépésekkel létrehozhat egy társított szolgáltatást a Google BigQueryhez az Azure Portal felhasználói felületén.

  1. Keresse meg az Azure Data Factory vagy a Synapse-munkaterület Kezelés lapját, és válassza a Társított szolgáltatások lehetőséget, majd kattintson az Új gombra:

  2. Keresse meg a Google BigQueryt, és válassza ki az összekötőt.

    Képernyőkép a Google BigQuery-összekötőről.

  3. Konfigurálja a szolgáltatás részleteit, tesztelje a kapcsolatot, és hozza létre az új társított szolgáltatást.

    Képernyőkép a Google BigQuery társított szolgáltatáskonfigurációjáról.

Csatlakozás or konfigurációjának részletei

Az alábbi szakaszok a Google BigQuery-összekötőre jellemző entitások meghatározásához használt tulajdonságok részleteit ismertetik.

Társított szolgáltatás tulajdonságai

A Google BigQuery társított szolgáltatása az alábbi tulajdonságokat támogatja.

Tulajdonság Leírás Kötelező
típus A típustulajdonságot GoogleBigQueryV2 értékre kell állítani. Igen
projectId Az alapértelmezett BigQuery-projekt projektazonosítója, amely alapján lekérdezhetők. Igen
authenticationType A hitelesítéshez használt OAuth 2.0 hitelesítési mechanizmus.
Az engedélyezett értékek a UserAuthentication és a ServiceAuthentication. A táblázat alatti szakaszokban további tulajdonságokat és JSON-mintákat talál ezekhez a hitelesítési típusokhoz.
Igen

Felhasználói hitelesítés használata

Állítsa a "authenticationType" tulajdonságot UserAuthentication értékre, és adja meg a következő tulajdonságokat az előző szakaszban ismertetett általános tulajdonságokkal együtt:

Tulajdonság Leírás Kötelező
clientId A frissítési jogkivonat létrehozásához használt alkalmazás azonosítója. Igen
clientSecret A frissítési jogkivonat létrehozásához használt alkalmazás titkos kódja. Jelölje meg ezt a mezőt SecureStringként, hogy biztonságosan tárolja, vagy hivatkozzon az Azure Key Vaultban tárolt titkos kódra. Igen
refreshToken A Google-tól beszerzett frissítési jogkivonat a BigQueryhez való hozzáférés engedélyezésére szolgál. Ebből a közösségi blogból megtudhatja, hogyan szerezhet be egyet az OAuth 2.0 hozzáférési jogkivonatok beszerzéséből. Jelölje meg ezt a mezőt SecureStringként, hogy biztonságosan tárolja, vagy hivatkozzon az Azure Key Vaultban tárolt titkos kódra. Igen

Példa:

{
    "name": "GoogleBigQueryLinkedService",
    "properties": {
        "type": "GoogleBigQueryV2",
        "typeProperties": {
            "projectId" : "<project ID>",
            "authenticationType" : "UserAuthentication",
            "clientId": "<client ID>",
            "clientSecret": {
                "type": "SecureString",
                "value":"<client secret>"
            },
            "refreshToken": {
                "type": "SecureString",
                "value": "<refresh token>"
            }
        }
    }
}

Szolgáltatáshitelesítés használata

Állítsa a "authenticationType" tulajdonságot ServiceAuthentication értékre, és adja meg a következő tulajdonságokat az előző szakaszban ismertetett általános tulajdonságokkal együtt.

Tulajdonság Leírás Kötelező
keyFileContent A szolgáltatásfiók hitelesítéséhez használt JSON formátumú kulcsfájl. Jelölje meg ezt a mezőt SecureStringként, hogy biztonságosan tárolja, vagy hivatkozzon az Azure Key Vaultban tárolt titkos kódra. Igen

Példa:

{
    "name": "GoogleBigQueryLinkedService",
    "properties": {
        "type": "GoogleBigQueryV2",
        "typeProperties": {
            "projectId": "<project ID>",
            "authenticationType": "ServiceAuthentication",
            "keyFileContent": {
                "type": "SecureString",
                "value": "<key file JSON string>"
            }
        }
    }
}

Adathalmaz tulajdonságai

Az adathalmazok meghatározásához elérhető szakaszok és tulajdonságok teljes listáját az Adathalmazok című cikkben találja. Ez a szakasz a Google BigQuery adatkészlet által támogatott tulajdonságok listáját tartalmazza.

Ha adatokat szeretne másolni a Google BigQueryből, állítsa az adathalmaz típustulajdonságát a GoogleBigQueryV2Object értékre. A következő tulajdonságok támogatottak:

Tulajdonság Leírás Kötelező
típus Az adathalmaz típustulajdonságának a következőnek kell lennie: GoogleBigQueryV2Object Igen
adathalmaz A Google BigQuery-adatkészlet neve. Nem (ha "lekérdezés" van megadva a tevékenységforrásban)
table A tábla neve. Nem (ha "lekérdezés" van megadva a tevékenységforrásban)

Példa

{
    "name": "GoogleBigQueryDataset",
    "properties": {
        "type": "GoogleBigQueryV2Object",
        "linkedServiceName": {
            "referenceName": "<Google BigQuery linked service name>",
            "type": "LinkedServiceReference"
        },
        "schema": [],
        "typeProperties": {
            "dataset": "<dataset name>",
            "table": "<table name>"
        }
    }
}

Másolási tevékenység tulajdonságai

A tevékenységek meghatározásához elérhető szakaszok és tulajdonságok teljes listáját a Folyamatok című cikkben találja. Ez a szakasz a Google BigQuery forrástípus által támogatott tulajdonságok listáját tartalmazza.

GoogleBigQuerySource forrástípusként

Ha adatokat szeretne másolni a Google BigQueryből, állítsa be a másolási tevékenység forrástípusát a GoogleBigQueryV2Source-ra. A másolási tevékenység forrás szakaszában az alábbi tulajdonságok támogatottak.

Tulajdonság Leírás Kötelező
típus A másolási tevékenység forrásának típustulajdonságát a GoogleBigQueryV2Source értékre kell állítani. Igen
Lekérdezés Az adatok olvasásához használja az egyéni SQL-lekérdezést. Például: "SELECT * FROM MyTable". További információt a Lekérdezés szintaxisa című témakörben talál. Nem (ha az adathalmazban "adathalmaz" és "tábla" van megadva)

Példa:

"activities":[
    {
        "name": "CopyFromGoogleBigQuery",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<Google BigQuery input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "GoogleBigQueryV2Source",
                "query": "SELECT * FROM MyTable"
            },
            "sink": {
                "type": "<sink type>"
            }
        }
    }
]

Keresési tevékenység tulajdonságai

A tulajdonságok részleteinek megismeréséhez tekintse meg a keresési tevékenységet.

A Google BigQuery társított szolgáltatásának frissítése

A Google BigQuery társított szolgáltatás frissítéséhez hozzon létre egy új Google BigQuery társított szolgáltatást, és konfigurálja a társított szolgáltatás tulajdonságaira hivatkozva.

Különbségek a Google BigQuery és a Google BigQuery között (örökölt)

A Google BigQuery-összekötő új funkciókat kínál, és kompatibilis a Google BigQuery (örökölt) összekötő legtöbb funkciójával. Az alábbi táblázat a Google BigQuery és a Google BigQuery (örökölt) funkcióbeli különbségeit mutatja be.

Google BigQuery Google BigQuery (örökölt)
A szolgáltatáshitelesítést az Azure integrációs modulja és a saját üzemeltetésű integrációs modul támogatja.
A TrustedCertPath, a useSystemTrustStore, az e-mail és a keyFilePath tulajdonságok nem támogatottak, mivel csak a saját üzemeltetésű integrációs modulban érhetők el.
A szolgáltatáshitelesítést csak a saját üzemeltetésű integrációs modul támogatja.
A trustedCertPath támogatása, aSystemTrustStore, az e-mail és a keyFilePath tulajdonságainak használata.
A Google BigQuery-adattípusoktól a szolgáltatás által belsőleg használt köztes adattípusokig az alábbi leképezéseket használjuk.

Numerikus –> Decimális
Időbélyeg –> DateTimeOffset
Datetime –> DatetimeOffset
A Google BigQuery-adattípusoktól a szolgáltatás által belsőleg használt köztes adattípusokig az alábbi leképezéseket használjuk.

Numerikus – Sztring>
Időbélyeg –> DateTime
Datetime –> DateTime
A requestGoogleDriveScope nem támogatott. Emellett a Google BigQuery szolgáltatásban is alkalmaznia kell az engedélyt a Google Drive API-hatókörök és a Lekérdezési meghajtó adatainak kiválasztásával. Támogatási kérelemGoogleDriveScope.
az additionalProjects nem támogatott. Másik lehetőségként lekérdezhet egy nyilvános adathalmazt a Google Cloud-konzollal. További projektek támogatása.

A másolási tevékenység által forrásként és fogadóként támogatott adattárak listáját lásd : Támogatott adattárak.