Aracılığıyla paylaş


Azure Data Factory veya Synapse Analytics kullanarak Azure Veri Gezgini'a veya Azure'dan veri kopyalama

UYGULANANLAR: Azure Data Factory Azure Synapse Analytics

İpucu

Kuruluşlar için hepsi bir arada analiz çözümü olan Microsoft Fabric'te Data Factory'yi deneyin. Microsoft Fabric , veri taşımadan veri bilimine, gerçek zamanlı analize, iş zekasına ve raporlamaya kadar her şeyi kapsar. Yeni bir deneme sürümünü ücretsiz olarak başlatmayı öğrenin!

Bu makalede Azure Data Factory ve Synapse Analytics işlem hatlarındaki kopyalama etkinliğini kullanarak Azure Veri Gezgini'a veya Azure'dan veri kopyalama işleminin nasıl kullanılacağı açıklanır. Kopyalama etkinliğine genel bir genel bakış sunan kopyalama etkinliğine genel bakış makalesini oluşturur.

İpucu

Azure Veri Gezgini hizmetle tümleştirme hakkında daha fazla bilgi edinmek için azure Veri Gezgini tümleştirmeyi genel olarak okuyun.

Desteklenen özellikler

Bu Azure Veri Gezgini bağlayıcısı aşağıdaki özellikler için desteklenir:

Desteklenen özellikler IR
Kopyalama etkinliği (kaynak/havuz) (1) (2)
Eşleme veri akışı (kaynak/havuz) (1)
Arama etkinliği (1) (2)

(1) Azure tümleştirme çalışma zamanı (2) Şirket içinde barındırılan tümleştirme çalışma zamanı

Desteklenen herhangi bir kaynak veri deposundaki verileri Azure Veri Gezgini'a kopyalayabilirsiniz. Ayrıca Azure Veri Gezgini'dan desteklenen herhangi bir havuz veri deposuna da veri kopyalayabilirsiniz. Kopyalama etkinliğinin kaynak veya havuz olarak desteklediği veri depolarının listesi için Desteklenen veri depoları tablosuna bakın.

Not

Şirket içinde barındırılan tümleştirme çalışma zamanını kullanarak azure Veri Gezgini şirket içi veri deposu aracılığıyla veri kopyalama 3.14 ve sonraki sürümlerde desteklenir.

Azure Veri Gezgini bağlayıcısı ile aşağıdakileri yapabilirsiniz:

  • Hizmet sorumlusuyla Microsoft Entra uygulama belirteci kimlik doğrulamayı kullanarak verileri kopyalayın.
  • Kaynak olarak, KQL (Kusto) sorgusu kullanarak verileri alın.
  • Havuz olarak, hedef tabloya veri ekleme.

Başlarken

İpucu

Azure Veri Gezgini bağlayıcısının kılavuzu için bkz. Azure Veri Gezgini'a/Azure'a veri kopyalama ve Veritabanından Azure Veri Gezgini toplu kopyalama.

İşlem hattıyla Kopyalama etkinliği gerçekleştirmek için aşağıdaki araçlardan veya SDK'lardan birini kullanabilirsiniz:

Kullanıcı arabirimini kullanarak Azure Veri Gezgini bağlı hizmet oluşturma

Azure portalı kullanıcı arabiriminde Azure Veri Gezgini bağlı hizmet oluşturmak için aşağıdaki adımları kullanın.

  1. Azure Data Factory veya Synapse çalışma alanınızda Yönet sekmesine göz atın ve Bağlı Hizmetler'i seçin, ardından Yeni'ye tıklayın:

  2. Gezgin'i arayın ve Azure Veri Gezgini (Kusto) bağlayıcısını seçin.

    Azure Veri Gezgini (Kusto) bağlayıcısının ekran görüntüsü.

  3. Hizmet ayrıntılarını yapılandırın, bağlantıyı test edin ve yeni bağlı hizmeti oluşturun.

    Azure Veri Gezgini için bağlı hizmet yapılandırmasının ekran görüntüsü.

Bağlayıcı yapılandırma ayrıntıları

Aşağıdaki bölümlerde, Azure Veri Gezgini bağlayıcısına özgü varlıkları tanımlamak için kullanılan özelliklerle ilgili ayrıntılar sağlanır.

Bağlı hizmet özellikleri

Azure Veri Gezgini bağlayıcısı aşağıdaki kimlik doğrulama türlerini destekler. Ayrıntılar için ilgili bölümlere bakın:

Hizmet sorumlusu kimlik doğrulaması

Hizmet sorumlusu kimlik doğrulamasını kullanmak için, bir hizmet sorumlusu almak ve izinler vermek için şu adımları izleyin:

  1. Bir uygulamayı Microsoft kimlik platformu kaydedin. Nasıl yapılacağını öğrenmek için bkz. Hızlı Başlangıç: uygulamayı Microsoft kimlik platformu kaydetme. Bağlı hizmeti tanımlamak için kullandığınız şu değerleri not edin:

    • Uygulama Kimliği
    • Uygulama anahtarı
    • Kiracı kimliği
  2. Hizmet sorumlusuna Azure Veri Gezgini'da doğru izinleri verin. Roller ve izinler ve izinleri yönetme hakkında ayrıntılı bilgi için bkz. Azure Veri Gezgini veritabanı izinlerini yönetme. Genel olarak şunları kullanmanız gerekir:

    • Kaynak olarak veritabanınıza en azından Veritabanı görüntüleyici rolü verin
    • Havuz olarak veritabanınıza en azından Veritabanı kullanıcı rolü verin

Not

Yazmak için kullanıcı arabirimini kullandığınızda, oturum açma kullanıcı hesabınız varsayılan olarak Azure Veri Gezgini kümelerini, veritabanlarını ve tablolarını listelemek için kullanılır. Yenile düğmesinin yanındaki açılan menüye tıklayarak hizmet sorumlusunu kullanarak nesneleri listelemeyi seçebilir veya bu işlemler için izniniz yoksa adı el ile girebilirsiniz.

Azure Veri Gezgini bağlı hizmeti için aşağıdaki özellikler desteklenir:

Özellik Açıklama Gerekli
Tür tür özelliği AzureDataExplorer olarak ayarlanmalıdır. Yes
endpoint Biçiminde azure Veri Gezgini kümesinin uç nokta URL'sihttps://<clusterName>.<regionName>.kusto.windows.net. Yes
database Veritabanının adı. Yes
tenant Uygulamanızın bulunduğu kiracı bilgilerini (etki alanı adı veya kiracı kimliği) belirtin. Bu, Kusto bağlantı dizesi'da "Yetkili Kimliği" olarak bilinir. Fare işaretçisini Azure portalının sağ üst köşesine getirerek bunu alın. Yes
servicePrincipalId Uygulamanın istemci kimliğini belirtin. Bu, Kusto bağlantı dizesi'da "Microsoft Entra uygulama istemci kimliği" olarak bilinir. Yes
servicePrincipalKey Uygulamanın anahtarını belirtin. Bu, Kusto bağlantı dizesi'da "Microsoft Entra uygulama anahtarı" olarak bilinir. Güvenli bir şekilde depolamak için bu alanı SecureString olarak işaretleyin veya Azure Key Vault'ta depolanan güvenli verilere başvurun. Yes
connectVia Veri deposuna bağlanmak için kullanılacak tümleştirme çalışma zamanı . Veri deponuz özel bir ağdaysa Azure tümleştirme çalışma zamanını veya şirket içinde barındırılan tümleştirme çalışma zamanını kullanabilirsiniz. Belirtilmezse, varsayılan Azure tümleştirme çalışma zamanı kullanılır. Hayır

Örnek: hizmet sorumlusu anahtarı kimlik doğrulamayı kullanma

{
    "name": "AzureDataExplorerLinkedService",
    "properties": {
        "type": "AzureDataExplorer",
        "typeProperties": {
            "endpoint": "https://<clusterName>.<regionName>.kusto.windows.net ",
            "database": "<database name>",
            "tenant": "<tenant name/id e.g. microsoft.onmicrosoft.com>",
            "servicePrincipalId": "<service principal id>",
            "servicePrincipalKey": {
                "type": "SecureString",
                "value": "<service principal key>"
            }
        }
    }
}

Sistem tarafından atanan yönetilen kimlik kimlik doğrulaması

Azure kaynakları için yönetilen kimlikler hakkında daha fazla bilgi edinmek için bkz . Azure kaynakları için yönetilen kimlikler.

Sistem tarafından atanan yönetilen kimlik kimlik doğrulamasını kullanmak için şu adımları izleyerek izinler verin:

  1. Fabrikanız veya Synapse çalışma alanınızla birlikte oluşturulan yönetilen kimlik nesne kimliğinin değerini kopyalayarak yönetilen kimlik bilgilerini alın.

  2. Yönetilen kimliğe Azure Veri Gezgini'de doğru izinleri verin. Roller ve izinler ve izinleri yönetme hakkında ayrıntılı bilgi için bkz. Azure Veri Gezgini veritabanı izinlerini yönetme. Genel olarak şunları kullanmanız gerekir:

    • Kaynak olarak veritabanınıza Veritabanı görüntüleyici rolü verin.
    • Havuz olarak Veritabanı alıcısı ve Veritabanı görüntüleyicisi rollerini veritabanınıza verin.

Not

Yazmak için kullanıcı arabirimini kullandığınızda oturum açma kullanıcı hesabınız Azure Veri Gezgini kümelerini, veritabanlarını ve tablolarını listelemek için kullanılır. Bu işlemler için izniniz yoksa adı el ile girin.

Azure Veri Gezgini bağlı hizmeti için aşağıdaki özellikler desteklenir:

Özellik Açıklama Gerekli
Tür tür özelliği AzureDataExplorer olarak ayarlanmalıdır. Yes
endpoint Biçiminde azure Veri Gezgini kümesinin uç nokta URL'sihttps://<clusterName>.<regionName>.kusto.windows.net. Yes
database Veritabanının adı. Yes
connectVia Veri deposuna bağlanmak için kullanılacak tümleştirme çalışma zamanı . Veri deponuz özel bir ağdaysa Azure tümleştirme çalışma zamanını veya şirket içinde barındırılan tümleştirme çalışma zamanını kullanabilirsiniz. Belirtilmezse, varsayılan Azure tümleştirme çalışma zamanı kullanılır. Hayır

Örnek: sistem tarafından atanan yönetilen kimlik kimlik doğrulamayı kullanma

{
    "name": "AzureDataExplorerLinkedService",
    "properties": {
        "type": "AzureDataExplorer",
        "typeProperties": {
            "endpoint": "https://<clusterName>.<regionName>.kusto.windows.net ",
            "database": "<database name>",
        }
    }
}

Kullanıcı tarafından atanan yönetilen kimlik kimlik doğrulaması

Azure kaynakları için yönetilen kimlikler hakkında daha fazla bilgi edinmek için bkz. Azure kaynakları için yönetilen kimlikler

Kullanıcı tarafından atanan yönetilen kimlik kimlik doğrulamasını kullanmak için şu adımları izleyin:

  1. Azure Veri Gezgini'de kullanıcı tarafından atanan bir veya birden çok yönetilen kimlik oluşturun ve izin verin. Roller ve izinler ve izinleri yönetme hakkında ayrıntılı bilgi için bkz. Azure Veri Gezgini veritabanı izinlerini yönetme. Genel olarak şunları kullanmanız gerekir:

    • Kaynak olarak veritabanınıza en azından Veritabanı görüntüleyici rolü verin
    • Havuz olarak veritabanınıza en azından Veritabanı alma rolü verin
  2. Veri fabrikanıza veya Synapse çalışma alanınıza kullanıcı tarafından atanan bir veya birden çok yönetilen kimlik atayın ve kullanıcı tarafından atanan her bir yönetilen kimlik için kimlik bilgileri oluşturun.

Azure Veri Gezgini bağlı hizmeti için aşağıdaki özellikler desteklenir:

Özellik Açıklama Gerekli
Tür tür özelliği AzureDataExplorer olarak ayarlanmalıdır. Yes
endpoint Biçiminde azure Veri Gezgini kümesinin uç nokta URL'sihttps://<clusterName>.<regionName>.kusto.windows.net. Yes
database Veritabanının adı. Yes
kimlik bilgileri Kimlik bilgisi nesnesi olarak kullanıcı tarafından atanan yönetilen kimliği belirtin. Yes
connectVia Veri deposuna bağlanmak için kullanılacak tümleştirme çalışma zamanı . Veri deponuz özel bir ağdaysa Azure tümleştirme çalışma zamanını veya şirket içinde barındırılan tümleştirme çalışma zamanını kullanabilirsiniz. Belirtilmezse, varsayılan Azure tümleştirme çalışma zamanı kullanılır. Hayır

Örnek: kullanıcı tarafından atanan yönetilen kimlik kimlik doğrulamayı kullanma

{
    "name": "AzureDataExplorerLinkedService",
    "properties": {
        "type": "AzureDataExplorer",
        "typeProperties": {
            "endpoint": "https://<clusterName>.<regionName>.kusto.windows.net ",
            "database": "<database name>",
            "credential": {
                "referenceName": "credential1",
                "type": "CredentialReference"
            }
        }
    }
}

Veri kümesi özellikleri

Veri kümelerini tanımlamak için kullanılabilen bölümlerin ve özelliklerin tam listesi için bkz . Veri kümeleri. Bu bölümde Azure Veri Gezgini veri kümesinin desteklediği özellikler listelenir.

Verileri Azure Veri Gezgini kopyalamak için veri kümesinin tür özelliğini AzureDataExplorerTable olarak ayarlayın.

Aşağıdaki özellikler desteklenir:

Özellik Açıklama Gerekli
Tür type özelliği AzureDataExplorerTable olarak ayarlanmalıdır. Yes
table Bağlı hizmetin başvurduğu tablonun adı. Havuz için evet; Kaynak için hayır

Veri kümesi özellikleri örneği:

{
   "name": "AzureDataExplorerDataset",
    "properties": {
        "type": "AzureDataExplorerTable",
        "typeProperties": {
            "table": "<table name>"
        },
        "schema": [],
        "linkedServiceName": {
            "referenceName": "<Azure Data Explorer linked service name>",
            "type": "LinkedServiceReference"
        }
    }
}

Kopyalama etkinliğinin özellikleri

Etkinlikleri tanımlamak için kullanılabilen bölümlerin ve özelliklerin tam listesi için bkz . İşlem hatları ve etkinlikler. Bu bölümde, Azure Veri Gezgini kaynaklarının ve havuzlarının desteklediği özelliklerin listesi sağlanır.

Kaynak olarak Azure Veri Gezgini

Azure Veri Gezgini'dan veri kopyalamak için Kopyalama etkinliği kaynağındaki tür özelliğini AzureDataExplorerSource olarak ayarlayın. Kopyalama etkinliği kaynağı bölümünde aşağıdaki özellikler desteklenir:

Özellik Açıklama Gerekli
Tür Kopyalama etkinliği kaynağının type özelliği şu şekilde ayarlanmalıdır: AzureDataExplorerSource Yes
query KQL biçiminde verilen salt okunur istek. Başvuru olarak özel KQL sorgusunu kullanın. Yes
queryTimeout Sorgu isteğinin zaman aşımına uğraması için bekleme süresi. Varsayılan değer 10 dakikadır (00:10:00); izin verilen maksimum değer 1 saattir (01:00:00). Hayır
noTruncation Döndürülen sonuç kümesinin kesilip kesilmeymeyeceğini gösterir. Varsayılan olarak, sonuç 500.000 kayıttan veya 64 megabayttan (MB) sonra kesilir. Etkinliğin doğru davranışını sağlamak için kesilmesi kesinlikle önerilir. Hayır

Not

Varsayılan olarak, Azure Veri Gezgini kaynağı 500.000 kayıt veya 64 MB boyut sınırına sahiptir. Kesme olmadan tüm kayıtları almak için sorgunuzun başında belirtebilirsiniz set notruncation; . Daha fazla bilgi için bkz . Sorgu sınırları.

Örnek:

"activities":[
    {
        "name": "CopyFromAzureDataExplorer",
        "type": "Copy",
        "typeProperties": {
            "source": {
                "type": "AzureDataExplorerSource",
                "query": "TestTable1 | take 10",
                "queryTimeout": "00:10:00"
            },
            "sink": {
                "type": "<sink type>"
            }
        },
        "inputs": [
            {
                "referenceName": "<Azure Data Explorer input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<output dataset name>",
                "type": "DatasetReference"
            }
        ]
    }
]

Havuz olarak Azure Veri Gezgini

Verileri Azure Veri Gezgini kopyalamak için kopyalama etkinliği havuzundaki type özelliğini AzureDataExplorerSink olarak ayarlayın. Kopyalama etkinliği havuzu bölümünde aşağıdaki özellikler desteklenir:

Özellik Açıklama Gerekli
Tür Kopyalama etkinliği havuzu type özelliği şu şekilde ayarlanmalıdır: AzureDataExplorerSink. Yes
ingestionMappingName Kusto tablosunda önceden oluşturulmuş eşlemenin adı. Kaynak sütunlarını Azure Veri Gezgini (CSV/JSON/Avro biçimleri dahil olmak üzere desteklenen tüm kaynak depolar ve biçimler için geçerlidir) eşlemek için kopyalama etkinliği sütun eşlemesini (örtük olarak ada göre veya yapılandırıldığı gibi açıkça) ve/veya Azure Veri Gezgini eşlemelerini kullanabilirsiniz. Hayır
additionalProperties Azure Veri Gezgini Havuzu tarafından ayarlanmayan alım özelliklerinden herhangi birini belirtmek için kullanılabilecek özellik paketi. Özellikle, alım etiketlerini belirtmek için yararlı olabilir. Azure Data Explore veri alımı belgesinden daha fazla bilgi edinin. Hayır

Örnek:

"activities":[
    {
        "name": "CopyToAzureDataExplorer",
        "type": "Copy",
        "typeProperties": {
            "source": {
                "type": "<source type>"
            },
            "sink": {
                "type": "AzureDataExplorerSink",
                "ingestionMappingName": "<optional Azure Data Explorer mapping name>",
                "additionalProperties": {<additional settings for data ingestion>}
            }
        },
        "inputs": [
            {
                "referenceName": "<input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<Azure Data Explorer output dataset name>",
                "type": "DatasetReference"
            }
        ]
    }
]

Eşleme veri akışı özellikleri

Eşleme veri akışındaki verileri dönüştürürken, Azure Veri Gezgini'da tablolardan okuyup tablolara yazabilirsiniz. Daha fazla bilgi için bkz . Eşleme veri akışlarında kaynak dönüştürme ve havuz dönüşümü . Kaynak ve havuz türü olarak Azure Veri Gezgini veri kümesini veya satır içi veri kümesini kullanmayı seçebilirsiniz.

Kaynak dönüştürme

Aşağıdaki tabloda Azure Veri Gezgini kaynağı tarafından desteklenen özellikler listelenmektedir. Bu özellikleri Kaynak seçenekleri sekmesinde düzenleyebilirsiniz.

Veri Akışı Adı Açıklama Gerekli İzin verilen değerler Veri akışı betiği özelliği
Tablo Giriş olarak Tablo'yı seçerseniz veri akışı, satır içi veri kümesini kullanırken Azure Veri Gezgini veri kümesinde veya kaynak seçeneklerinde belirtilen tablodan tüm verileri getirir. Hayır String (yalnızca satır içi veri kümesi için)
tableName
Sorgu KQL biçiminde verilen salt okunur istek. Başvuru olarak özel KQL sorgusunu kullanın. Hayır String query
Timeout Sorgu isteğinin zaman aşımına uğraması için bekleme süresi. Varsayılan değer :'172000' (2 gün) Hayır Tamsayı timeout

Azure Veri Gezgini kaynak betiği örnekleri

Kaynak türü olarak Azure Veri Gezgini veri kümesini kullandığınızda, ilişkili veri akışı betiği şöyledir:

source(allowSchemaDrift: true,
	validateSchema: false,
	query: 'table | take 10',
	format: 'query') ~> AzureDataExplorerSource

Satır içi veri kümesi kullanıyorsanız, ilişkili veri akışı betiği şu şekildedir:

source(allowSchemaDrift: true,
    validateSchema: false,
    format: 'query',
    query: 'table | take 10',
    store: 'azuredataexplorer') ~> AzureDataExplorerSource

Havuz dönüşümü

Aşağıdaki tabloda Azure Veri Gezgini havuzu tarafından desteklenen özellikler listelenmektedir. Bu özellikleri Ayarlar sekmesinde düzenleyebilirsiniz. Satır içi veri kümesini kullanırken, veri kümesi özellikleri bölümünde açıklanan özelliklerle aynı olan ek ayarlar görürsünüz.

Veri Akışı Adı Açıklama Gerekli İzin verilen değerler Veri akışı betiği özelliği
Tablo eylemi Yazmadan önce hedef tablodan tüm satırların yeniden oluşturulmasını veya kaldırılıp kaldırılmayacağını belirler.
- Yok: Tabloda hiçbir eylem yapılmaz.
- Yeniden oluştur: Tablo bırakılır ve yeniden oluşturulur. Dinamik olarak yeni bir tablo oluşturuyorsanız gereklidir.
- Kesme: Hedef tablodaki tüm satırlar kaldırılır.
Hayır true veya false Yeni -den oluşturun
truncate
SQL Betikleri Öncesi ve Sonrası Havuz veritabanınıza veri yazıldıktan önce (ön işleme) ve sonra (işleme sonrası) yürütülecek birden çok Kusto denetim komutu betikleri belirtin. Hayır String preSQL'ler; postSQL'ler
Timeout Sorgu isteğinin zaman aşımına uğraması için bekleme süresi. Varsayılan değer :'172000' (2 gün) Hayır Tamsayı timeout

Azure Veri Gezgini havuz betiği örnekleri

Havuz türü olarak Azure Veri Gezgini veri kümesini kullandığınızda, ilişkili veri akışı betiği şöyledir:

IncomingStream sink(allowSchemaDrift: true,
	validateSchema: false,
	format: 'table',
	preSQLs:['pre SQL scripts'],
	postSQLs:['post SQL script'],
	skipDuplicateMapInputs: true,
	skipDuplicateMapOutputs: true) ~> AzureDataExplorerSink

Satır içi veri kümesi kullanıyorsanız, ilişkili veri akışı betiği şu şekildedir:

IncomingStream sink(allowSchemaDrift: true,
    validateSchema: false,
    format: 'table',
    store: 'azuredataexplorer',
    skipDuplicateMapInputs: true,
    skipDuplicateMapOutputs: true) ~> AzureDataExplorerSink

Arama etkinliği özellikleri

Özellikler hakkında daha fazla bilgi için bkz . Arama etkinliği.