Azure Data Factory veya Synapse Analytics kullanarak Azure AI Search dizinine veri kopyalama

UYGULANANLAR: Azure Data Factory Azure Synapse Analytics

Bahşiş

Kuruluşlar için hepsi bir arada analiz çözümü olan Microsoft Fabric'te Data Factory'yi deneyin. Microsoft Fabric , veri taşımadan veri bilimine, gerçek zamanlı analize, iş zekasına ve raporlamaya kadar her şeyi kapsar. Yeni bir deneme sürümünü ücretsiz olarak başlatmayı öğrenin!

Bu makalede verileri Azure AI Search dizinine kopyalamak için Azure Data Factory veya Synapse Analytics işlem hattında Kopyalama Etkinliğinin nasıl kullanılacağı özetlenmiştir. Kopyalama etkinliğine genel bir genel bakış sunan kopyalama etkinliğine genel bakış makalesini oluşturur.

Desteklenen özellikler

Bu Azure AI Search bağlayıcısı aşağıdaki özellikler için desteklenir:

Desteklenen özellikler IR Yönetilen özel uç nokta
Kopyalama etkinliği (-/sink) ① ②

(1) Azure tümleştirme çalışma zamanı (2) Şirket içinde barındırılan tümleştirme çalışma zamanı

Desteklenen herhangi bir kaynak veri deposundaki verileri arama dizinine kopyalayabilirsiniz. Kopyalama etkinliği tarafından kaynak/havuz olarak desteklenen veri depolarının listesi için Desteklenen veri depoları tablosuna bakın.

Başlarken

İşlem hattıyla Kopyalama etkinliği gerçekleştirmek için aşağıdaki araçlardan veya SDK'lardan birini kullanabilirsiniz:

Kullanıcı arabirimini kullanarak Azure Search'e bağlı hizmet oluşturma

Azure portalı kullanıcı arabiriminde Azure Search'e bağlı bir hizmet oluşturmak için aşağıdaki adımları kullanın.

  1. Azure Data Factory veya Synapse çalışma alanınızda Yönet sekmesine göz atın ve Bağlı Hizmetler'i seçin, ardından Yeni'ye tıklayın:

  2. Ara'yı arayın ve Azure Search bağlayıcısını seçin.

    Select the Azure Search connector.

  3. Hizmet ayrıntılarını yapılandırın, bağlantıyı test edin ve yeni bağlı hizmeti oluşturun.

    Configure a linked service to Azure Search.

Bağlan veya yapılandırma ayrıntıları

Aşağıdaki bölümlerde, Azure AI Search bağlayıcısına özgü Data Factory varlıklarını tanımlamak için kullanılan özelliklerle ilgili ayrıntılar sağlanır.

Bağlı hizmet özellikleri

Azure AI Search bağlı hizmeti için aşağıdaki özellikler desteklenir:

Özellik Açıklama Gerekli
type Tür özelliği şu şekilde ayarlanmalıdır: AzureSearch Evet
url Arama hizmetinin URL'si. Evet
anahtar Arama hizmeti için Yönetici anahtarı. Güvenli bir şekilde depolamak için bu alanı SecureString olarak işaretleyin veya Azure Key Vault'ta depolanan bir gizli diziye başvurun. Evet
connectVia Veri deposuna bağlanmak için kullanılacak Integration Runtime. Azure Integration Runtime veya Şirket İçinde Barındırılan Tümleştirme Çalışma Zamanı'nı (veri deponuz özel ağda bulunuyorsa) kullanabilirsiniz. Belirtilmezse, varsayılan Azure Integration Runtime'ı kullanır. No

Önemli

Bir bulut veri deposundan arama dizinine veri kopyalarken, Azure AI Search bağlı hizmetinde connactVia'da açık bölge içeren bir Azure Integration Runtime'a başvurmanız gerekir. Bölgeyi arama hizmetinizin bulunduğu bölge olarak ayarlayın. Azure Integration Runtime'dan daha fazla bilgi edinin.

Örnek:

{
    "name": "AzureSearchLinkedService",
    "properties": {
        "type": "AzureSearch",
        "typeProperties": {
            "url": "https://<service>.search.windows.net",
            "key": {
                "type": "SecureString",
                "value": "<AdminKey>"
            }
        },
        "connectVia": {
            "referenceName": "<name of Integration Runtime>",
            "type": "IntegrationRuntimeReference"
        }
    }
}

Veri kümesi özellikleri

Veri kümelerini tanımlamak için kullanılabilen bölümlerin ve özelliklerin tam listesi için veri kümeleri makalesine bakın. Bu bölümde, Azure AI Search veri kümesi tarafından desteklenen özelliklerin listesi sağlanır.

Azure AI Search'e veri kopyalamak için aşağıdaki özellikler desteklenir:

Özellik Açıklama Gerekli
type Veri kümesinin tür özelliği şu şekilde ayarlanmalıdır: AzureSearchIndex Evet
indexName Arama dizininin adı. Hizmet dizini oluşturmaz. Dizin, Azure AI Search'te mevcut olmalıdır. Evet

Örnek:

{
    "name": "AzureSearchIndexDataset",
    "properties": {
        "type": "AzureSearchIndex",
        "typeProperties" : {
            "indexName": "products"
        },
        "schema": [],
        "linkedServiceName": {
            "referenceName": "<Azure AI Search linked service name>",
            "type": "LinkedServiceReference"
        }
   }
}

Kopyalama etkinliğinin özellikleri

Etkinlikleri tanımlamak için kullanılabilen bölümlerin ve özelliklerin tam listesi için İşlem hatları makalesine bakın. Bu bölümde, Azure AI Arama kaynağı tarafından desteklenen özelliklerin listesi sağlanır.

Havuz olarak Azure AI Search

Azure AI Search'e veri kopyalamak için kopyalama etkinliğindeki kaynak türünü AzureSearchIndexSink olarak ayarlayın. Kopyalama etkinliği havuzu bölümünde aşağıdaki özellikler desteklenir:

Özellik Açıklama Gerekli
type Kopyalama etkinliği kaynağının type özelliği şu şekilde ayarlanmalıdır: AzureSearchIndexSink Evet
writeBehavior Dizinde bir belge zaten mevcut olduğunda birleştirilip birleştirilmeyeceğini veya değiştirilmeyeceğini belirtir. Bkz. WriteBehavior özelliği.

İzin verilen değerler şunlardır: Birleştir (varsayılan) ve Karşıya Yükle.
No
writeBatchSize Arabellek boyutu writeBatchSize değerine ulaştığında verileri arama dizinine yükler. Ayrıntılar için Bkz. WriteBatchSize özelliği.

İzin verilen değerler şunlardır: 1 - 1.000 tamsayı; varsayılan değer 1000'dir.
No
maxConcurrent Bağlan ions Etkinlik çalıştırması sırasında veri deposuna kurulan eş zamanlı bağlantıların üst sınırı. Yalnızca eşzamanlı bağlantıları sınırlamak istediğinizde bir değer belirtin. No

WriteBehavior özelliği

Veri yazarken AzureSearchSink upserts. Başka bir deyişle, belge yazarken, belge anahtarı arama dizininde zaten varsa, Azure AI Search çakışma özel durumu oluşturmak yerine var olan belgeyi güncelleştirir.

AzureSearchSink aşağıdaki iki upsert davranışı sağlar (AzureSearch SDK'sını kullanarak):

  • Birleştir: Yeni belgedeki tüm sütunları mevcut sütunla birleştirin. Yeni belgedeki null değere sahip sütunlar için, var olandaki değer korunur.
  • Karşıya yükleme: Yeni belge var olan belgenin yerini alır. Yeni belgede belirtilmeyen sütunlar için, var olan belgede null olmayan bir değer olsa da olmasa da değer null olarak ayarlanır.

Varsayılan davranış Birleştir'dir.

WriteBatchSize Özelliği

Azure AI Arama hizmeti, belgeleri toplu olarak yazmayı destekler. Toplu işlem 1 ile 1.000 Eylem içerebilir. Eylem, karşıya yükleme/birleştirme işlemini gerçekleştirmek için bir belgeyi işler.

Örnek:

"activities":[
    {
        "name": "CopyToAzureSearch",
        "type": "Copy",
        "inputs": [
            {
                "referenceName": "<input dataset name>",
                "type": "DatasetReference"
            }
        ],
        "outputs": [
            {
                "referenceName": "<Azure AI Search output dataset name>",
                "type": "DatasetReference"
            }
        ],
        "typeProperties": {
            "source": {
                "type": "<source type>"
            },
            "sink": {
                "type": "AzureSearchIndexSink",
                "writeBehavior": "Merge"
            }
        }
    }
]

Veri türü desteği

Aşağıdaki tabloda Azure AI Search veri türünün desteklenip desteklenmediği belirtiliyor.

Azure AI Search veri türü Azure AI Arama Havuzu'nda desteklenir
String Y
Int32 Y
Int64 Y
Çift Y
Boolean Y
DataTimeOffset Y
Dize Dizisi N
GeographyPoint N

Şu anda diğer veri türleri (örneğin, ComplexType) desteklenmez. Azure AI Search tarafından desteklenen veri türlerinin tam listesi için bkz . Desteklenen veri türleri (Azure AI Search).

Kopyalama etkinliği tarafından kaynak ve havuz olarak desteklenen veri depolarının listesi için bkz . desteklenen veri depoları.