Azure Data Factory veya Synapse Analytics kullanarak Google BigQuery'den veri kopyalama (eski)
UYGULANANLAR: Azure Data Factory Azure Synapse Analytics
İpucu
Kuruluşlar için hepsi bir arada analiz çözümü olan Microsoft Fabric'te Data Factory'yi deneyin. Microsoft Fabric , veri taşımadan veri bilimine, gerçek zamanlı analize, iş zekasına ve raporlamaya kadar her şeyi kapsar. Yeni bir deneme sürümünü ücretsiz olarak başlatmayı öğrenin!
Bu makalede, Google BigQuery'den veri kopyalamak için Azure Data Factory ve Synapse Analytics işlem hatlarında Kopyalama Etkinliği'nin nasıl kullanılacağı özetlenmiştir. Kopyalama etkinliğine genel bir genel bakış sunan Kopyalama Etkinliğine genel bakış makalesini oluşturur.
Önemli
Yeni Google BigQuery bağlayıcısı geliştirilmiş yerel Google BigQuery desteği sağlar. Çözümünüzde eski Google BigQuery bağlayıcısını kullanıyorsanız lütfen Google BigQuery bağlayıcınızı 31 Ekim 2024'den önce yükseltin. Eski ve en son sürüm arasındaki fark hakkında ayrıntılı bilgi için bu bölüme bakın.
Desteklenen özellikler
Bu Google BigQuery bağlayıcısı aşağıdaki özellikler için desteklenir:
Desteklenen özellikler | IR |
---|---|
Kopyalama etkinliği (kaynak/-) | (1) (2) |
Arama etkinliği | (1) (2) |
(1) Azure tümleştirme çalışma zamanı (2) Şirket içinde barındırılan tümleştirme çalışma zamanı
Kopyalama etkinliği tarafından kaynak veya havuz olarak desteklenen veri depolarının listesi için Desteklenen veri depoları tablosuna bakın.
Hizmet, bağlantıyı etkinleştirmek için yerleşik bir sürücü sağlar. Bu nedenle, bu bağlayıcıyı kullanmak için bir sürücüyü el ile yüklemeniz gerekmez.
Not
Bu Google BigQuery bağlayıcısı, BigQuery API'lerinin üzerine kurulmuştur. BigQuery'nin en yüksek gelen istek oranını sınırladığını ve proje başına uygun kotaları zorunlu kıldığını unutmayın. Kotalar ve Sınırlar - API istekleri bölümüne bakın. Hesaba çok fazla eşzamanlı istek tetiklemediğinizden emin olun.
Kullanmaya başlayın
İşlem hattıyla Kopyalama etkinliği gerçekleştirmek için aşağıdaki araçlardan veya SDK'lardan birini kullanabilirsiniz:
- Veri Kopyalama aracı
- Azure portal
- .NET SDK'sı
- Python SDK'sı
- Azure PowerShell
- The REST API
- Azure Resource Manager şablonu
Kullanıcı arabirimini kullanarak Google BigQuery'ye bağlı hizmet oluşturma
Azure portalı kullanıcı arabiriminde Google BigQuery'ye bağlı bir hizmet oluşturmak için aşağıdaki adımları kullanın.
Azure Data Factory veya Synapse çalışma alanınızda Yönet sekmesine göz atın ve Bağlı Hizmetler'i seçin, ardından Yeni'ye tıklayın:
Google'ı arayın ve Google BigQuery bağlayıcısını seçin.
Hizmet ayrıntılarını yapılandırın, bağlantıyı test edin ve yeni bağlı hizmeti oluşturun.
Bağlayıcı yapılandırma ayrıntıları
Aşağıdaki bölümlerde, Google BigQuery bağlayıcısına özgü varlıkları tanımlamak için kullanılan özelliklerle ilgili ayrıntılar sağlanır.
Bağlı hizmet özellikleri
Google BigQuery bağlı hizmeti için aşağıdaki özellikler desteklenir.
Özellik | Açıklama | Gerekli |
---|---|---|
Tür | type özelliği GoogleBigQuery olarak ayarlanmalıdır. | Yes |
proje | Sorgulanacak varsayılan BigQuery projesinin proje kimliği. | Yes |
additionalProjects | Erişilebilecek genel BigQuery projelerinin proje kimliklerinin virgülle ayrılmış listesi. | Hayır |
requestGoogleDriveScope | Google Drive'a erişim isteyip istemediğiniz. Google Drive erişimine izin vermek, BigQuery verilerini Google Drive'dan alınan verilerle birleştiren federasyon tabloları için destek sağlar. Varsayılan değer yanlış değeridir. | Hayır |
authenticationType | Kimlik doğrulaması için kullanılan OAuth 2.0 kimlik doğrulama mekanizması. ServiceAuthentication yalnızca Şirket İçinde Barındırılan Tümleştirme Çalışma Zamanı'nda kullanılabilir. İzin verilen değerler UserAuthentication ve ServiceAuthentication'dır. Sırasıyla bu kimlik doğrulama türleri için daha fazla özellik ve JSON örneği hakkında bu tablonun altındaki bölümlere bakın. |
Yes |
Kullanıcı kimlik doğrulamayı kullanma
"authenticationType" özelliğini UserAuthentication olarak ayarlayın ve önceki bölümde açıklanan genel özelliklerle birlikte aşağıdaki özellikleri belirtin:
Özellik | Açıklama | Gerekli |
---|---|---|
clientId | Yenileme belirtecini oluşturmak için kullanılan uygulamanın kimliği. | Yes |
clientSecret | Yenileme belirtecini oluşturmak için kullanılan uygulamanın gizli dizisi. Güvenli bir şekilde depolamak için bu alanı SecureString olarak işaretleyin veya Azure Key Vault'ta depolanan bir gizli diziye başvurun. | Yes |
refreshToken | Google'dan alınan yenileme belirteci, BigQuery'ye erişimi yetkilendirmek için kullanılır. OAuth 2.0 erişim belirteçlerini alma ve bu topluluk blogundan nasıl edineceğinizi öğrenin. Güvenli bir şekilde depolamak için bu alanı SecureString olarak işaretleyin veya Azure Key Vault'ta depolanan bir gizli diziye başvurun. | Yes |
OAuth 2.0 yenileme belirtecini almak için gereken en düşük kapsamdır https://www.googleapis.com/auth/bigquery.readonly
. Büyük sonuçlar döndürebilecek bir sorgu çalıştırmayı planlıyorsanız, başka bir kapsam gerekebilir. Daha fazla bilgi için bu makaleye bakın.
Örnek:
{
"name": "GoogleBigQueryLinkedService",
"properties": {
"type": "GoogleBigQuery",
"typeProperties": {
"project" : "<project ID>",
"additionalProjects" : "<additional project IDs>",
"requestGoogleDriveScope" : true,
"authenticationType" : "UserAuthentication",
"clientId": "<id of the application used to generate the refresh token>",
"clientSecret": {
"type": "SecureString",
"value":"<secret of the application used to generate the refresh token>"
},
"refreshToken": {
"type": "SecureString",
"value": "<refresh token>"
}
}
}
}
Hizmet kimlik doğrulamayı kullanma
"authenticationType" özelliğini ServiceAuthentication olarak ayarlayın ve önceki bölümde açıklanan genel özelliklerle birlikte aşağıdaki özellikleri belirtin. Bu kimlik doğrulama türü yalnızca Şirket İçinde Barındırılan Tümleştirme Çalışma Zamanı'nda kullanılabilir.
Özellik | Açıklama | Gerekli |
---|---|---|
e-posta | ServiceAuthentication için kullanılan hizmet hesabı e-posta kimliği. Yalnızca Şirket İçinde Barındırılan Tümleştirme Çalışma Zamanı'nda kullanılabilir. | Hayır |
keyFilePath | Hizmet hesabı e-posta adresinin .p12 kimliğini doğrulamak için kullanılan veya .json anahtar dosyasının tam yolu. |
Yes |
trustedCertPath | TLS üzerinden bağlandığınızda sunucuyu doğrulamak için kullanılan güvenilen CA sertifikalarını içeren .pem dosyasının tam yolu. Bu özellik yalnızca Şirket İçinde Barındırılan Tümleştirme Çalışma Zamanı'nda TLS kullandığınızda ayarlanabilir. Varsayılan değer, tümleştirme çalışma zamanıyla birlikte yüklenen cacerts.pem dosyasıdır. | Hayır |
useSystemTrustStore | Sistem güven deposundan veya belirtilen bir .pem dosyasından CA sertifikası kullanılıp kullanılmayacağını belirtir. Varsayılan değer yanlış değeridir. | Hayır |
Örnek:
{
"name": "GoogleBigQueryLinkedService",
"properties": {
"type": "GoogleBigQuery",
"typeProperties": {
"project" : "<project id>",
"requestGoogleDriveScope" : true,
"authenticationType" : "ServiceAuthentication",
"email": "<email>",
"keyFilePath": "<.p12 or .json key path on the IR machine>"
},
"connectVia": {
"referenceName": "<name of Self-hosted Integration Runtime>",
"type": "IntegrationRuntimeReference"
}
}
}
Veri kümesi özellikleri
Veri kümelerini tanımlamak için kullanılabilen bölümlerin ve özelliklerin tam listesi için Veri kümeleri makalesine bakın. Bu bölümde, Google BigQuery veri kümesi tarafından desteklenen özelliklerin listesi sağlanır.
Google BigQuery'den veri kopyalamak için veri kümesinin type özelliğini GoogleBigQueryObject olarak ayarlayın. Aşağıdaki özellikler desteklenir:
Özellik | Açıklama | Gerekli |
---|---|---|
Tür | Veri kümesinin type özelliği şu şekilde ayarlanmalıdır: GoogleBigQueryObject | Yes |
veri kümesi | Google BigQuery veri kümesinin adı. | Hayır (etkinlik kaynağında "sorgu" belirtilirse) |
table | Tablonun adı. | Hayır (etkinlik kaynağında "sorgu" belirtilirse) |
tableName | Tablonun adı. Bu özellik geriye dönük uyumluluk için desteklenir. Yeni iş yükü için ve table kullanındataset . |
Hayır (etkinlik kaynağında "sorgu" belirtilirse) |
Örnek
{
"name": "GoogleBigQueryDataset",
"properties": {
"type": "GoogleBigQueryObject",
"typeProperties": {},
"schema": [],
"linkedServiceName": {
"referenceName": "<GoogleBigQuery linked service name>",
"type": "LinkedServiceReference"
}
}
}
Kopyalama etkinliğinin özellikleri
Etkinlikleri tanımlamak için kullanılabilen bölümlerin ve özelliklerin tam listesi için İşlem hatları makalesine bakın. Bu bölümde, Google BigQuery kaynak türü tarafından desteklenen özelliklerin listesi sağlanır.
Kaynak türü olarak GoogleBigQuerySource
Google BigQuery'den veri kopyalamak için kopyalama etkinliğindeki kaynak türünü GoogleBigQuerySource olarak ayarlayın. Kopyalama etkinliği kaynağı bölümünde aşağıdaki özellikler desteklenir.
Özellik | Açıklama | Gerekli |
---|---|---|
Tür | Kopyalama etkinliği kaynağının type özelliği GoogleBigQuerySource olarak ayarlanmalıdır. | Yes |
query | Verileri okumak için özel SQL sorgusunu kullanın. "SELECT * FROM MyTable" bunun bir örneğidir. |
Hayır (veri kümesinde "tableName" belirtilirse) |
Örnek:
"activities":[
{
"name": "CopyFromGoogleBigQuery",
"type": "Copy",
"inputs": [
{
"referenceName": "<GoogleBigQuery input dataset name>",
"type": "DatasetReference"
}
],
"outputs": [
{
"referenceName": "<output dataset name>",
"type": "DatasetReference"
}
],
"typeProperties": {
"source": {
"type": "GoogleBigQuerySource",
"query": "SELECT * FROM MyTable"
},
"sink": {
"type": "<sink type>"
}
}
}
]
Arama etkinliği özellikleri
Özellikler hakkında ayrıntılı bilgi edinmek için Arama etkinliği'ne bakın.
İlgili içerik
Kopyalama etkinliği tarafından kaynak ve havuz olarak desteklenen veri depolarının listesi için bkz . Desteklenen veri depoları.