Aracılığıyla paylaş


Dizinli OneLake bilgi kaynağı oluşturma

Uyarı

Bu özellik şu anda genel önizlemededir. Bu önizleme, hizmet düzeyi sözleşmesi olmadan sağlanır ve üretim iş yükleri için önerilmez. Bazı özellikler desteklenmiyor olabileceği gibi özellikleri sınırlandırılmış da olabilir. Daha fazla bilgi için bkz. Microsoft Azure Önizlemeleri için Ek Kullanım Koşulları.

Microsoft OneLake dosyalarını etkin bir geri alma işlem hattında dizine almak ve sorgulamak için dizine alınmış OneLake bilgi kaynağını kullanın. Bilgi kaynakları bağımsız olarak oluşturulur, bilgi bankasında başvurulur ve bir aracı veya sohbet botu sorgu zamanında alma eylemi çağırdığında temel veri olarak kullanılır.

Dizine alınan bir OneLake bilgi kaynağı oluşturduğunuzda, aşağıdaki Azure AI Search nesnelerini otomatik olarak oluşturmak için bir dış veri kaynağı, modeller ve özellikler belirtirsiniz:

  • Göl evi temsil eden bir veri kaynağı.
  • Göl evinden çok modüllü içeriği öbekleyen ve isteğe bağlı olarak vektörleştiren bir beceri kümesi.
  • Zenginleştirilmiş içeriği depolayan ve aracılı alma ölçütlerini karşılayan bir dizin.
  • Dizin oluşturma ve zenginleştirme işlem hattını yönlendirmek için önceki nesneleri kullanan bir dizin oluşturucu.

Oluşturulan dizin oluşturucu önkoşulları, desteklenen görevler, desteklenen belge biçimleri, desteklenen kısayollar ve sınırlamalar oneLake bilgi kaynakları için de geçerli olan OneLake dizin oluşturucusunun uyumluluğunu sağlar. Daha fazla bilgi için OneLake dizin oluşturucu belgelerine bakın.

Kullanım desteği

Azure portalı Microsoft Foundry portalı .NET SDK Python SDK'sı Java SDK'sı JavaScript SDK'sı REST API
✔️ ✔️ ✔️ ✔️ ✔️ ✔️ ✔️

Önkoşullar

Mevcut bilgi kaynaklarını denetleme

Bilgi kaynağı üst düzey, yeniden kullanılabilir bir nesnedir. Mevcut bilgi kaynakları hakkında bilgi edinmek, yeni nesneleri yeniden kullanmak veya adlandırmak için yararlıdır.

Bilgi kaynaklarını ada ve türe göre listelemek için aşağıdaki kodu çalıştırın.

// List knowledge sources by name and type
using Azure.Search.Documents.Indexes;

var indexClient = new SearchIndexClient(new Uri(searchEndpoint), credential);
var knowledgeSources = indexClient.GetKnowledgeSourcesAsync();

Console.WriteLine("Knowledge Sources:");

await foreach (var ks in knowledgeSources)
{
    Console.WriteLine($"  Name: {ks.Name}, Type: {ks.GetType().Name}");
}

JSON tanımını gözden geçirmek için ada göre tek bir bilgi kaynağı da döndürebilirsiniz.

using Azure.Search.Documents.Indexes;
using System.Text.Json;

var indexClient = new SearchIndexClient(new Uri(searchEndpoint), credential);

// Specify the knowledge source name to retrieve
string ksNameToGet = "earth-knowledge-source";

// Get its definition
var knowledgeSourceResponse = await indexClient.GetKnowledgeSourceAsync(ksNameToGet);
var ks = knowledgeSourceResponse.Value;

// Serialize to JSON for display
var jsonOptions = new JsonSerializerOptions 
{ 
    WriteIndented = true,
    DefaultIgnoreCondition = System.Text.Json.Serialization.JsonIgnoreCondition.Never
};
Console.WriteLine(JsonSerializer.Serialize(ks, ks.GetType(), jsonOptions));

Aşağıdaki JSON, dizine alınan OneLake bilgi kaynağı için örnek bir yanıttır.

{
  "name": "my-onelake-ks",
  "kind": "indexedOneLake",
  "description": "A sample indexed OneLake knowledge source.",
  "encryptionKey": null,
  "indexedOneLakeParameters": {
    "fabricWorkspaceId": "<REDACTED>",
    "lakehouseId": "<REDACTED>",
    "targetPath": null,
    "ingestionParameters": {
      "disableImageVerbalization": false,
      "ingestionPermissionOptions": [],
      "contentExtractionMode": "standard",
      "identity": null,
      "embeddingModel": {
        "kind": "azureOpenAI",
        "azureOpenAIParameters": {
          "resourceUri": "<REDACTED>",
          "deploymentId": "text-embedding-3-large",
          "apiKey": "<REDACTED>",
          "modelName": "text-embedding-3-large"
        }
      },
      "chatCompletionModel": {
        "kind": "azureOpenAI",
        "azureOpenAIParameters": {
          "resourceUri": "<REDACTED>",
          "deploymentId": "gpt-5-mini",
          "apiKey": "<REDACTED>",
          "modelName": "gpt-5-mini"
        }
      },
      "ingestionSchedule": null,
      "aiServices": {
        "uri": "<REDACTED>",
        "apiKey": "<REDACTED>"
      }
    },
    "createdResources": {
    "datasource": "my-onelake-ks-datasource",
    "indexer": "my-onelake-ks-indexer",
    "skillset": "my-onelake-ks-skillset",
    "index": "my-onelake-ks-index"
    }
  }
}

Uyarı

Hassas bilgiler yeniden oluşturulur. Oluşturulan kaynaklar yanıtın sonunda görünür.

Bilgi kaynağı oluşturma

Dizine alınan onelake bilgi kaynağı oluşturmak için aşağıdaki kodu çalıştırın.

// Create an IndexedOneLake knowledge source
using Azure.Search.Documents.Indexes;
using Azure.Search.Documents.Indexes.Models;
using Azure.Search.Documents.KnowledgeBases.Models;
using Azure;

var indexClient = new SearchIndexClient(new Uri(searchEndpoint), new AzureKeyCredential(apiKey));

var chatCompletionParams = new AzureOpenAIVectorizerParameters
{
    ResourceUri = new Uri(aoaiEndpoint),
    DeploymentName = aoaiGptDeployment,
    ModelName = aoaiGptModel
};

var embeddingParams = new AzureOpenAIVectorizerParameters
{
    ResourceUri = new Uri(aoaiEndpoint),
    DeploymentName = aoaiEmbeddingDeployment,
    ModelName = aoaiEmbeddingModel
};

var ingestionParams = new KnowledgeSourceIngestionParameters
{
    DisableImageVerbalization = false,
    ChatCompletionModel = new KnowledgeBaseAzureOpenAIModel(azureOpenAIParameters: chatCompletionParams),
    EmbeddingModel = new KnowledgeSourceAzureOpenAIVectorizer
    {
        AzureOpenAIParameters = embeddingParams
    }
};

var oneLakeParams = new IndexedOneLakeKnowledgeSourceParameters(
    fabricWorkspaceId: fabricWorkspaceId,
    lakehouseId: lakehouseId)
{
    IngestionParameters = ingestionParams
};

var knowledgeSource = new IndexedOneLakeKnowledgeSource(
    name: "my-onelake-ks",
    indexedOneLakeParameters: oneLakeParams)
{
    Description = "This knowledge source pulls content from a lakehouse."
};

await indexClient.CreateOrUpdateKnowledgeSourceAsync(knowledgeSource);
Console.WriteLine($"Knowledge source '{knowledgeSource.Name}' created or updated successfully.");

Kaynağa özgü özellikler

Dizine alınan onelake bilgi kaynağı oluşturmak için aşağıdaki özellikleri geçirebilirsiniz.

İsim Description Türü Düzenlenebilir Gerekli
Name Bilgi kaynakları koleksiyonunda benzersiz olması ve Azure AI Search'teki nesneler için adlandırma yönergelerini izlemesi gereken bilgi kaynağının adı. String Yes Yes
Description Bilgi kaynağının açıklaması. String Yes Hayı
EncryptionKey Hem bilgi kaynağındaki hem de oluşturulan nesnelerdeki hassas bilgileri şifrelemek için müşteri tarafından yönetilen anahtar . Nesne Yes Hayı
IndexedOneLakeKnowledgeSourceParameters OneLake bilgi kaynaklarına özgü parametreler: fabricWorkspaceId, lakehouseIdve targetPath. Nesne Yes
fabricWorkspaceId Lakehouse'un yer aldığı çalışma alanının GUID'i. String Hayı Yes
lakehouseId Göl evi GUID'i. String Hayı Yes
targetPath Göl evinde bir klasör veya kısayol. Belirtilmediğinde, tüm göl evi dizine eklenir. String Hayı Hayı

ingestionParameters özellikleri

Yalnızca dizine alınmış bilgi kaynakları için, içeriğin nasıl alınıp işlendiğini denetlemek için aşağıdaki ingestionParameters özellikleri geçirebilirsiniz.

İsim Description Türü Düzenlenebilir Gerekli
Identity Oluşturulan dizin oluşturucuda kullanılacak yönetilen kimlik . Nesne Yes Hayı
DisableImageVerbalization Görüntü sözelleştirme kullanımını etkinleştirir veya devre dışı bırakır. Varsayılan değer False olup, görüntü sözelleştirmeyi etkinleştirir. True Görüntü sözelleştirmesini devre dışı bırakmak için olarak ayarlayın. Boolean Hayı Hayı
ChatCompletionModel Görüntüleri sözlü hale getiren veya içerik ayıklayan bir sohbet tamamlama modeli. Desteklenen modeller , , gpt-4ogpt-4o-mini, , gpt-4.1, gpt-4.1-mini, gpt-4.1-nano, gpt-5ve gpt-5-minimodelleridirgpt-5-nano. GenAI prompt becerisi oluşturulan beceri kümesine dahil edilecek. Bu parametrenin ayarlanması için, disable_image_verbalization'ün False olarak ayarlanmış olması gerekir. Nesne Yalnızca api_key ve deployment_name düzenlenebilir Hayı
EmbeddingModel Dizin oluşturma sırasında ve sorgu zamanında metin ve görüntü içeriğini vektörleştiren bir metin ekleme modeli. Desteklenen modeller , text-embedding-ada-002ve text-embedding-3-smallşeklindedirtext-embedding-3-large. Azure OpenAI Ekleme becerisi oluşturulan beceri kümesine ve Azure OpenAI vektörleştiricisi de oluşturulan dizine dahil edilir. Nesne Yalnızca api_key ve deployment_name düzenlenebilir Hayı
ContentExtractionMode İçeriğin dosyalardan nasıl ayıklandığı denetler. Varsayılan değer, metin ve görüntüler için standart içerik ayıklama kullanan değeridir minimal. Azure İçerik Anlama becerisini kullanarak gelişmiş belge çatlama ve öbekleme için, oluşturulan beceri kümesine dahil edilmek üzere standard olarak ayarlayın. Yalnızca standardAiServices ve AssetStore parametreleri belirtimlidir. String Hayı Hayı
AiServices Foundry Araçları'nda Azure Content Understanding'e erişmek için bir Microsoft Foundry kaynağı. ContentExtractionMode parametresinin ayarlanabilmesi için standard olarak ayarlanması gerekir. Nesne Yalnızca api_key düzenlenebilir Yes
IngestionSchedule Oluşturulan dizin oluşturucuya zamanlama bilgileri ekler. Veri yenilemeyi otomatikleştirmek için daha sonra bir zamanlama da ekleyebilirsiniz . Nesne Yes Hayı
IngestionPermissionOptions Seçilen bilgi kaynaklarından belge düzeyinde veri getirme izinleri: ADLS 2. Nesil veya dizinlenmiş SharePoint. Eğer user_ids, group_ids veya rbac_scope belirtirseniz, oluşturulan ADLS 2. Nesil dizin oluşturucu veya SharePoint dizin oluşturucu alınan izinleri içerecektir. Array Hayı Hayı

Alım durumunu denetleme

Dizin oluşturucu işlem hattı oluşturan ve arama dizinini dolduran bilgi kaynaklarının dizin oluşturucu durumu da dahil olmak üzere alım ilerleme durumunu ve durumunu izlemek için aşağıdaki kodu çalıştırın.

// Get knowledge source ingestion status
using Azure.Search.Documents.Indexes;
using System.Text.Json;

var indexClient = new SearchIndexClient(new Uri(searchEndpoint), new AzureKeyCredential(apiKey));

// Get the knowledge source status
var statusResponse = await indexClient.GetKnowledgeSourceStatusAsync(knowledgeSourceName);
var status = statusResponse.Value;

// Serialize to JSON for display
var json = JsonSerializer.Serialize(status, new JsonSerializerOptions { WriteIndented = true });
Console.WriteLine(json);

Alma parametrelerini içeren ve etkin olarak içerik alan bir istek için yanıt aşağıdaki örneğe benzer olabilir.

{ 
  "synchronizationStatus": "active", // creating, active, deleting 
  "synchronizationInterval" : "1d", // null if no schedule 
  "currentSynchronizationState" : { // spans multiple indexer "runs" 
    "startTime": "2025-10-27T19:30:00Z", 
    "itemUpdatesProcessed": 1100, 
    "itemsUpdatesFailed": 100, 
    "itemsSkipped": 1100, 
  }, 
  "lastSynchronizationState" : {  // null on first sync 
    "startTime": "2025-10-27T19:30:00Z", 
    "endTime": "2025-10-27T19:40:01Z", // this value appears on the activity record on each /retrieve 
    "itemUpdatesProcessed": 1100, 
    "itemsUpdatesFailed": 100, 
    "itemsSkipped": 1100, 
  }, 
  "statistics": {  // null on first sync 
    "totalSynchronization": 25, 
    "averageSynchronizationDuration": "00:15:20", 
    "averageItemsProcessedPerSynchronization" : 500 
  } 
} 

Oluşturulan nesneleri gözden geçirme

Dizine alınan bir OneLake bilgi kaynağı oluşturduğunuzda, arama hizmetiniz bir dizin oluşturucu, dizin, beceri kümesi ve veri kaynağı da oluşturur. Bu nesneleri düzenlemenizi önermiyoruz çünkü bir hataya veya uyumsuzluğa neden olmak işlem hattını bozabilir.

Bir bilgi kaynağı oluşturduktan sonra yanıt, oluşturulan nesneleri listeler. Bu nesneler sabit bir şablona göre oluşturulur ve adları bilgi kaynağının adına göre oluşturulur. Nesne adlarını değiştiremezsiniz.

Çıktı oluşturmayı doğrulamak için Azure portalını kullanmanızı öneririz. İş akışı şu şekildedir:

  1. Dizin oluşturucuda başarılı veya başarısız iletileri olup olmadığını denetleyin. Bağlantı veya kota hataları burada görünür.
  2. Aranabilir içerik için dizine bakın. Sorgu çalıştırmak için Arama Gezgini'ni kullanın.
  3. İçeriğinizin nasıl öbeklendiğini ve isteğe bağlı olarak vektörleştirildiği hakkında bilgi edinmek için beceri kümesini denetleyin.
  4. Bağlantı ayrıntıları için veri kaynağını denetleyin. Örneğimizde kolaylık sağlamak için API anahtarları kullanılır, ancak kimlik doğrulaması için Microsoft Entra Id ve yetkilendirme için rol tabanlı erişim denetimi kullanabilirsiniz.

Bilgi bankasına atama

Bilgi kaynağından memnunsanız bir sonraki adıma geçin: Bilgi bankasında bilgi kaynağını belirtin.

Dizine alınmış bir OneLake bilgi kaynağını belirten herhangi bir bilgi bankası için, includeReferenceSourceData'i true olarak ayarladığınızdan emin olun. Bu adım, kaynak belge URL'sini alıntıya çekmek için gereklidir.

Bilgi bankası yapılandırıldıktan sonra, bilgi kaynağını sorgulamak için alma eylemini kullanın.

Bilgi kaynağını silme

Bilgi kaynağını silebilmeniz için önce, buna başvuran bilgi bankalarını silmeniz veya başvuruyu kaldırmak için bilgi bankası tanımını güncelleştirmeniz gerekir. Dizin ve dizin oluşturucu işlem hattı oluşturan bilgi kaynakları için , oluşturulan tüm nesneler de silinir. Ancak, bilgi kaynağı oluşturmak için mevcut bir dizini kullandıysanız dizininiz silinmez.

Kullanımda olan bir bilgi kaynağını silmeye çalışırsanız, eylem başarısız olur ve etkilenen bilgi bankalarının listesini döndürür.

Bilgi kaynağını silmek için:

  1. Arama hizmetinizdeki tüm bilgi bankalarının listesini alın.

    using Azure.Search.Documents.Indexes;
    
    var indexClient = new SearchIndexClient(new Uri(searchEndpoint), credential);
    var knowledgeBases = indexClient.GetKnowledgeBasesAsync();
    
    Console.WriteLine("Knowledge Bases:");
    
    await foreach (var kb in knowledgeBases)
    {
        Console.WriteLine($"  - {kb.Name}");
    }
    

    Örnek bir yanıt aşağıdaki gibi görünebilir:

     Knowledge Bases:
       - earth-knowledge-base
       - hotels-sample-knowledge-base
       - my-demo-knowledge-base
    
  2. Bilgi kaynağı başvurularını denetlemek için tek bir bilgi bankası tanımı alın.

    using Azure.Search.Documents.Indexes;
    using System.Text.Json;
    
    var indexClient = new SearchIndexClient(new Uri(searchEndpoint), credential);
    
    // Specify the knowledge base name to retrieve
    string kbNameToGet = "earth-knowledge-base";
    
    // Get a specific knowledge base definition
    var knowledgeBaseResponse = await indexClient.GetKnowledgeBaseAsync(kbNameToGet);
    var kb = knowledgeBaseResponse.Value;
    
    // Serialize to JSON for display
    string json = JsonSerializer.Serialize(kb, new JsonSerializerOptions { WriteIndented = true });
    Console.WriteLine(json);
    

    Örnek bir yanıt aşağıdaki gibi görünebilir:

     {
       "Name": "earth-knowledge-base",
       "KnowledgeSources": [
         {
           "Name": "earth-knowledge-source"
         }
       ],
       "Models": [
         {}
       ],
       "RetrievalReasoningEffort": {},
       "OutputMode": {},
       "ETag": "\u00220x8DE278629D782B3\u0022",
       "EncryptionKey": null,
       "Description": null,
       "RetrievalInstructions": null,
       "AnswerInstructions": null
     }
    
  3. Bilgi bankasını silin veya birden çok kaynağınız varsa bilgi kaynağını kaldırmak için bilgi bankasını güncelleştirin . Bu örnekte silme işlemi gösterilmektedir.

    using Azure.Search.Documents.Indexes;
    var indexClient = new SearchIndexClient(new Uri(searchEndpoint), credential);
    
    await indexClient.DeleteKnowledgeBaseAsync(knowledgeBaseName);
    System.Console.WriteLine($"Knowledge base '{knowledgeBaseName}' deleted successfully.");
    
  4. Bilgi kaynağını silin.

    await indexClient.DeleteKnowledgeSourceAsync(knowledgeSourceName);
    System.Console.WriteLine($"Knowledge source '{knowledgeSourceName}' deleted successfully.");
    

Uyarı

Bu özellik şu anda genel önizlemededir. Bu önizleme, hizmet düzeyi sözleşmesi olmadan sağlanır ve üretim iş yükleri için önerilmez. Bazı özellikler desteklenmiyor olabileceği gibi özellikleri sınırlandırılmış da olabilir. Daha fazla bilgi için bkz. Microsoft Azure Önizlemeleri için Ek Kullanım Koşulları.

Microsoft OneLake dosyalarını agentik bir alma işlem hattında dizine almak ve sorgulamak için dizine alınmış bir OneLake bilgi kaynağını kullanın. Bilgi kaynakları bağımsız olarak oluşturulur, bilgi bankasında başvurulur ve bir aracı veya sohbet botu sorgu zamanında alma eylemi çağırdığında temel veri olarak kullanılır.

Dizine alınan bir OneLake bilgi kaynağı oluşturduğunuzda, aşağıdaki Azure AI Search nesnelerini otomatik olarak oluşturmak için bir dış veri kaynağı, modeller ve özellikler belirtirsiniz:

  • Göl evi temsil eden bir veri kaynağı.
  • Göl evinden çok modüllü içeriği öbekleyen ve isteğe bağlı olarak vektörleştiren bir beceri kümesi.
  • Zenginleştirilmiş içeriği depolayan ve aracılı alma ölçütlerini karşılayan bir dizin.
  • Dizin oluşturma ve zenginleştirme işlem hattını yönlendirmek için önceki nesneleri kullanan bir dizin oluşturucu.

Oluşturulan dizin oluşturucu önkoşulları, desteklenen görevler, desteklenen belge biçimleri, desteklenen kısayollar ve sınırlamalar oneLake bilgi kaynakları için de geçerli olan OneLake dizin oluşturucusunun uyumluluğunu sağlar. Daha fazla bilgi için OneLake dizin oluşturucu belgelerine bakın.

Kullanım desteği

Azure portalı Microsoft Foundry portalı .NET SDK Python SDK'sı Java SDK'sı JavaScript SDK'sı REST API
✔️ ✔️ ✔️ ✔️ ✔️ ✔️ ✔️

Önkoşullar

Mevcut bilgi kaynaklarını denetleme

Bilgi kaynağı üst düzey, yeniden kullanılabilir bir nesnedir. Mevcut bilgi kaynakları hakkında bilgi edinmek, yeni nesneleri yeniden kullanmak veya adlandırmak için yararlıdır.

Bilgi kaynaklarını ada ve türe göre listelemek için aşağıdaki kodu çalıştırın.

# List knowledge sources by name and type
import requests
import json

endpoint = "{search_url}/knowledgesources"
params = {"api-version": "2025-11-01-preview", "$select": "name, kind"}
headers = {"api-key": "{api_key}"}

response = requests.get(endpoint, params = params, headers = headers)
print(json.dumps(response.json(), indent = 2))

JSON tanımını gözden geçirmek için ada göre tek bir bilgi kaynağı da döndürebilirsiniz.

# Get a knowledge source definition
import requests
import json

endpoint = "{search_url}/knowledgesources/{knowledge_source_name}"
params = {"api-version": "2025-11-01-preview"}
headers = {"api-key": "{api_key}"}

response = requests.get(endpoint, params = params, headers = headers)
print(json.dumps(response.json(), indent = 2))

Aşağıdaki JSON, dizine alınan OneLake bilgi kaynağı için örnek bir yanıttır.

{
  "name": "my-onelake-ks",
  "kind": "indexedOneLake",
  "description": "A sample indexed OneLake knowledge source.",
  "encryptionKey": null,
  "indexedOneLakeParameters": {
    "fabricWorkspaceId": "<REDACTED>",
    "lakehouseId": "<REDACTED>",
    "targetPath": null,
    "ingestionParameters": {
      "disableImageVerbalization": false,
      "ingestionPermissionOptions": [],
      "contentExtractionMode": "standard",
      "identity": null,
      "embeddingModel": {
        "kind": "azureOpenAI",
        "azureOpenAIParameters": {
          "resourceUri": "<REDACTED>",
          "deploymentId": "text-embedding-3-large",
          "apiKey": "<REDACTED>",
          "modelName": "text-embedding-3-large"
        }
      },
      "chatCompletionModel": {
        "kind": "azureOpenAI",
        "azureOpenAIParameters": {
          "resourceUri": "<REDACTED>",
          "deploymentId": "gpt-5-mini",
          "apiKey": "<REDACTED>",
          "modelName": "gpt-5-mini"
        }
      },
      "ingestionSchedule": null,
      "aiServices": {
        "uri": "<REDACTED>",
        "apiKey": "<REDACTED>"
      }
    },
    "createdResources": {
    "datasource": "my-onelake-ks-datasource",
    "indexer": "my-onelake-ks-indexer",
    "skillset": "my-onelake-ks-skillset",
    "index": "my-onelake-ks-index"
    }
  }
}

Uyarı

Hassas bilgiler yeniden oluşturulur. Oluşturulan kaynaklar yanıtın sonunda görünür.

Bilgi kaynağı oluşturma

Dizine alınan onelake bilgi kaynağı oluşturmak için aşağıdaki kodu çalıştırın.

# Create an indexed OneLake knowledge source
from azure.core.credentials import AzureKeyCredential
from azure.search.documents.indexes import SearchIndexClient
from azure.search.documents.indexes.models import IndexedOneLakeKnowledgeSource, IndexedOneLakeKnowledgeSourceParameters, KnowledgeBaseAzureOpenAIModel, AzureOpenAIVectorizerParameters, KnowledgeSourceAzureOpenAIVectorizer, KnowledgeSourceContentExtractionMode, KnowledgeSourceIngestionParameters

index_client = SearchIndexClient(endpoint = "search_url", credential = AzureKeyCredential("api_key"))

knowledge_source = IndexedOneLakeKnowledgeSource(
    name = "my-onelake-ks",
    description= "This knowledge source pulls content from a lakehouse.",
    encryption_key = None,
    indexed_one_lake_parameters = IndexedOneLakeKnowledgeSourceParameters(
        fabric_workspace_id = "fabric_workspace_id",
        lakehouse_id = "lakehouse_id",
        target_path = None,
        ingestion_parameters = KnowledgeSourceIngestionParameters(
            identity = None,
            disable_image_verbalization = False,
            chat_completion_model = KnowledgeBaseAzureOpenAIModel(
                azure_open_ai_parameters = AzureOpenAIVectorizerParameters(
                    # TRIMMED FOR BREVITY
                )
            ),
            embedding_model = KnowledgeSourceAzureOpenAIVectorizer(
                azure_open_ai_parameters=AzureOpenAIVectorizerParameters(
                    # TRIMMED FOR BREVITY
                )
            ),
            content_extraction_mode = KnowledgeSourceContentExtractionMode.MINIMAL,
            ingestion_schedule = None,
            ingestion_permission_options = None
        )
    )
)

index_client.create_or_update_knowledge_source(knowledge_source)
print(f"Knowledge source '{knowledge_source.name}' created or updated successfully.")

Kaynağa özgü özellikler

Dizine alınan onelake bilgi kaynağı oluşturmak için aşağıdaki özellikleri geçirebilirsiniz.

İsim Description Türü Düzenlenebilir Gerekli
name Bilgi kaynakları koleksiyonunda benzersiz olması ve Azure AI Search'teki nesneler için adlandırma yönergelerini izlemesi gereken bilgi kaynağının adı. String Yes Yes
description Bilgi kaynağının açıklaması. String Yes Hayı
encryption Hem bilgi kaynağındaki hem de oluşturulan nesnelerdeki hassas bilgileri şifrelemek için müşteri tarafından yönetilen anahtar . Nesne Yes Hayı
indexed_one_lake_parameters OneLake bilgi kaynaklarına özgü parametreler: fabric_workspace_id, lakehouse_idve target_path. Nesne Yes
fabric_workspace_id Lakehouse'un yer aldığı çalışma alanının GUID'i. String Hayı Yes
lakehouse_id Göl evi GUID'i. String Hayı Yes
target_path Göl evinde bir klasör veya kısayol. Belirtilmediğinde, tüm göl evi dizine eklenir. String Hayı Hayı

ingestionParameters özellikleri

Yalnızca dizine alınmış bilgi kaynakları için, içeriğin nasıl alınıp işlendiğini denetlemek için aşağıdaki ingestionParameters özellikleri geçirebilirsiniz.

İsim Description Türü Düzenlenebilir Gerekli
identity Oluşturulan dizin oluşturucuda kullanılacak yönetilen kimlik . Nesne Yes Hayı
disable_image_verbalization Görüntü sözelleştirme kullanımını etkinleştirir veya devre dışı bırakır. Varsayılan değer False olup, görüntü sözelleştirmeyi etkinleştirir. True Görüntü sözelleştirmesini devre dışı bırakmak için olarak ayarlayın. Boolean Hayı Hayı
chat_completion_model Görüntüleri sözlü hale getiren veya içerik ayıklayan bir sohbet tamamlama modeli. Desteklenen modeller , , gpt-4ogpt-4o-mini, , gpt-4.1, gpt-4.1-mini, gpt-4.1-nano, gpt-5ve gpt-5-minimodelleridirgpt-5-nano. GenAI prompt becerisi oluşturulan beceri kümesine dahil edilecek. Bu parametrenin ayarlanması için, disable_image_verbalization'ün False olarak ayarlanmış olması gerekir. Nesne Yalnızca api_key ve deployment_name düzenlenebilir Hayı
embedding_model Dizin oluşturma sırasında ve sorgu zamanında metin ve görüntü içeriğini vektörleştiren bir metin ekleme modeli. Desteklenen modeller , text-embedding-ada-002ve text-embedding-3-smallşeklindedirtext-embedding-3-large. Azure OpenAI Ekleme becerisi oluşturulan beceri kümesine ve Azure OpenAI vektörleştiricisi de oluşturulan dizine dahil edilir. Nesne Yalnızca api_key ve deployment_name düzenlenebilir Hayı
content_extraction_mode İçeriğin dosyalardan nasıl ayıklandığı denetler. Varsayılan değer, metin ve görüntüler için standart içerik ayıklama kullanan değeridir minimal. Azure İçerik Anlama becerisini kullanarak gelişmiş belge çatlama ve öbekleme için, oluşturulan beceri kümesine dahil edilmek üzere standard olarak ayarlayın. Yalnızca standardai_services ve asset_store parametreleri belirtimlidir. String Hayı Hayı
ai_services Foundry Araçları'nda Azure Content Understanding'e erişmek için bir Microsoft Foundry kaynağı. content_extraction_mode parametresinin ayarlanabilmesi için standard olarak ayarlanması gerekir. Nesne Yalnızca api_key düzenlenebilir Yes
asset_store Çıkarılan görüntüleri depolamak için bir blob kapsayıcısı. content_extraction_mode parametresinin ayarlanabilmesi için standard olarak ayarlanması gerekir. Nesne Hayı Hayı
ingestion_schedule Oluşturulan dizin oluşturucuya zamanlama bilgileri ekler. Veri yenilemeyi otomatikleştirmek için daha sonra bir zamanlama da ekleyebilirsiniz . Nesne Yes Hayı
ingestion_permission_options Seçilen bilgi kaynaklarından belge düzeyinde veri getirme izinleri: ADLS 2. Nesil veya dizinlenmiş SharePoint. Eğer user_ids, group_ids veya rbac_scope belirtirseniz, oluşturulan ADLS 2. Nesil dizin oluşturucu veya SharePoint dizin oluşturucu alınan izinleri içerecektir. Array Hayı Hayı

Alım durumunu denetleme

Dizin oluşturucu işlem hattı oluşturan ve arama dizinini dolduran bilgi kaynaklarının dizin oluşturucu durumu da dahil olmak üzere alım ilerleme durumunu ve durumunu izlemek için aşağıdaki kodu çalıştırın.

# Check knowledge source ingestion status
import requests
import json

endpoint = "{search_url}/knowledgesources/{knowledge_source_name}/status"
params = {"api-version": "2025-11-01-preview"}
headers = {"api-key": "{api_key}"}

response = requests.get(endpoint, params = params, headers = headers)
print(json.dumps(response.json(), indent = 2))

Alma parametrelerini içeren ve etkin olarak içerik alan bir istek için yanıt aşağıdaki örneğe benzer olabilir.

{ 
  "synchronizationStatus": "active", // creating, active, deleting 
  "synchronizationInterval" : "1d", // null if no schedule 
  "currentSynchronizationState" : { // spans multiple indexer "runs" 
    "startTime": "2025-10-27T19:30:00Z", 
    "itemUpdatesProcessed": 1100, 
    "itemsUpdatesFailed": 100, 
    "itemsSkipped": 1100, 
  }, 
  "lastSynchronizationState" : {  // null on first sync 
    "startTime": "2025-10-27T19:30:00Z", 
    "endTime": "2025-10-27T19:40:01Z", // this value appears on the activity record on each /retrieve 
    "itemUpdatesProcessed": 1100, 
    "itemsUpdatesFailed": 100, 
    "itemsSkipped": 1100, 
  }, 
  "statistics": {  // null on first sync 
    "totalSynchronization": 25, 
    "averageSynchronizationDuration": "00:15:20", 
    "averageItemsProcessedPerSynchronization" : 500 
  } 
} 

Oluşturulan nesneleri gözden geçirme

Dizine alınan bir OneLake bilgi kaynağı oluşturduğunuzda, arama hizmetiniz bir dizin oluşturucu, dizin, beceri kümesi ve veri kaynağı da oluşturur. Bu nesneleri düzenlemenizi önermiyoruz çünkü bir hataya veya uyumsuzluğa neden olmak işlem hattını bozabilir.

Bir bilgi kaynağı oluşturduktan sonra yanıt, oluşturulan nesneleri listeler. Bu nesneler sabit bir şablona göre oluşturulur ve adları bilgi kaynağının adına göre oluşturulur. Nesne adlarını değiştiremezsiniz.

Çıktı oluşturmayı doğrulamak için Azure portalını kullanmanızı öneririz. İş akışı şu şekildedir:

  1. Dizin oluşturucuda başarılı veya başarısız iletileri olup olmadığını denetleyin. Bağlantı veya kota hataları burada görünür.
  2. Aranabilir içerik için dizine bakın. Sorgu çalıştırmak için Arama Gezgini'ni kullanın.
  3. İçeriğinizin nasıl öbeklendiğini ve isteğe bağlı olarak vektörleştirildiği hakkında bilgi edinmek için beceri kümesini denetleyin.
  4. Bağlantı ayrıntıları için veri kaynağını denetleyin. Örneğimizde kolaylık sağlamak için API anahtarları kullanılır, ancak kimlik doğrulaması için Microsoft Entra Id ve yetkilendirme için rol tabanlı erişim denetimi kullanabilirsiniz.

Bilgi bankasına atama

Bilgi kaynağından memnunsanız bir sonraki adıma geçin: Bilgi bankasında bilgi kaynağını belirtin.

Herhangi bir bilgi bankası için, indekslenmiş bir OneLake bilgi kaynağı belirtilmişse, includeReferenceSourceData değerini true olarak ayarladığınızdan emin olun. Bu adım, kaynak belge URL'sini alıntıya çekmek için gereklidir.

Bilgi bankası yapılandırıldıktan sonra, bilgi kaynağını sorgulamak için alma eylemini kullanın.

Bilgi kaynağını silme

Bilgi kaynağını silebilmeniz için önce, buna başvuran bilgi bankalarını silmeniz veya başvuruyu kaldırmak için bilgi bankası tanımını güncelleştirmeniz gerekir. Dizin ve dizin oluşturucu işlem hattı oluşturan bilgi kaynakları için , oluşturulan tüm nesneler de silinir. Ancak, bilgi kaynağı oluşturmak için mevcut bir dizini kullandıysanız dizininiz silinmez.

Kullanımda olan bir bilgi kaynağını silmeye çalışırsanız, eylem başarısız olur ve etkilenen bilgi bankalarının listesini döndürür.

Bilgi kaynağını silmek için:

  1. Arama hizmetinizdeki tüm bilgi bankalarının listesini alın.

    # Get knowledge bases
    import requests
    import json
    
    endpoint = "{search_url}/knowledgebases"
    params = {"api-version": "2025-11-01-preview", "$select": "name"}
    headers = {"api-key": "{api_key}"}
    
    response = requests.get(endpoint, params = params, headers = headers)
    print(json.dumps(response.json(), indent = 2))
    

    Örnek bir yanıt aşağıdaki gibi görünebilir:

     {
         "@odata.context": "https://my-search-service.search.windows.net/$metadata#knowledgebases(name)",
         "value": [
         {
             "name": "my-kb"
         },
         {
             "name": "my-kb-2"
         }
         ]
     }
    
  2. Bilgi kaynağı başvurularını denetlemek için tek bir bilgi bankası tanımı alın.

    # Get a knowledge base definition
    import requests
    import json
    
    endpoint = "{search_url}/knowledgebases/{knowledge_base_name}"
    params = {"api-version": "2025-11-01-preview"}
    headers = {"api-key": "{api_key}"}
    
    response = requests.get(endpoint, params = params, headers = headers)
    print(json.dumps(response.json(), indent = 2))
    

    Örnek bir yanıt aşağıdaki gibi görünebilir:

     {
       "name": "my-kb",
       "description": null,
       "retrievalInstructions": null,
       "answerInstructions": null,
       "outputMode": null,
       "knowledgeSources": [
         {
           "name": "my-blob-ks",
         }
       ],
       "models": [],
       "encryptionKey": null,
       "retrievalReasoningEffort": {
         "kind": "low"
       }
     }
    
  3. Bilgi bankasını silin veya birden çok kaynağınız varsa bilgi kaynağını kaldırmak için bilgi bankasını güncelleştirin . Bu örnekte silme işlemi gösterilmektedir.

    # Delete a knowledge base
    from azure.core.credentials import AzureKeyCredential 
    from azure.search.documents.indexes import SearchIndexClient
    
    index_client = SearchIndexClient(endpoint = "search_url", credential = AzureKeyCredential("api_key"))
    index_client.delete_knowledge_base("knowledge_base_name")
    print(f"Knowledge base deleted successfully.")
    
  4. Bilgi kaynağını silin.

    # Delete a knowledge source
    from azure.core.credentials import AzureKeyCredential 
    from azure.search.documents.indexes import SearchIndexClient
    
    index_client = SearchIndexClient(endpoint = "search_url", credential = AzureKeyCredential("api_key"))
    index_client.delete_knowledge_source("knowledge_source_name")
    print(f"Knowledge source deleted successfully.")
    

Uyarı

Bu özellik şu anda genel önizlemededir. Bu önizleme, hizmet düzeyi sözleşmesi olmadan sağlanır ve üretim iş yükleri için önerilmez. Bazı özellikler desteklenmiyor olabileceği gibi özellikleri sınırlandırılmış da olabilir. Daha fazla bilgi için bkz. Microsoft Azure Önizlemeleri için Ek Kullanım Koşulları.

Ajanslı bir alma işlem hattında Microsoft OneLake dosyalarını dizine almak ve sorgulamak için dizine alınmış bir OneLake bilgi kaynağını kullanın. Bilgi kaynakları bağımsız olarak oluşturulur, bilgi bankasında başvurulur ve bir aracı veya sohbet botu sorgu zamanında alma eylemi çağırdığında temel veri olarak kullanılır.

Dizine alınan bir OneLake bilgi kaynağı oluşturduğunuzda, aşağıdaki Azure AI Search nesnelerini otomatik olarak oluşturmak için bir dış veri kaynağı, modeller ve özellikler belirtirsiniz:

  • Göl evi temsil eden bir veri kaynağı.
  • Göl evinden çok modüllü içeriği öbekleyen ve isteğe bağlı olarak vektörleştiren bir beceri kümesi.
  • Zenginleştirilmiş içeriği depolayan ve aracılı alma ölçütlerini karşılayan bir dizin.
  • Dizin oluşturma ve zenginleştirme işlem hattını yönlendirmek için önceki nesneleri kullanan bir dizin oluşturucu.

Oluşturulan dizin oluşturucu önkoşulları, desteklenen görevler, desteklenen belge biçimleri, desteklenen kısayollar ve sınırlamalar oneLake bilgi kaynakları için de geçerli olan OneLake dizin oluşturucusunun uyumluluğunu sağlar. Daha fazla bilgi için OneLake dizin oluşturucu belgelerine bakın.

Kullanım desteği

Azure portalı Microsoft Foundry portalı .NET SDK Python SDK'sı Java SDK'sı JavaScript SDK'sı REST API
✔️ ✔️ ✔️ ✔️ ✔️ ✔️ ✔️

Önkoşullar

Mevcut bilgi kaynaklarını denetleme

Bilgi kaynağı üst düzey, yeniden kullanılabilir bir nesnedir. Mevcut bilgi kaynakları hakkında bilgi edinmek, yeni nesneleri yeniden kullanmak veya adlandırmak için yararlıdır.

Bilgi kaynaklarını ada ve türe göre listelemek için Bilgi Kaynakları - Get (REST API) kullanın.

### List knowledge sources by name and type
GET {{search-url}}/knowledgesources?api-version=2025-11-01-preview&$select=name,kind
api-key: {{api-key}}

JSON tanımını gözden geçirmek için ada göre tek bir bilgi kaynağı da döndürebilirsiniz.

### Get a knowledge source definition
GET {{search-url}}/knowledgesources/{{knowledge-source-name}}?api-version=2025-11-01-preview
api-key: {{api-key}}

Aşağıdaki JSON, dizine alınan OneLake bilgi kaynağı için örnek bir yanıttır.

{
  "name": "my-onelake-ks",
  "kind": "indexedOneLake",
  "description": "A sample indexed OneLake knowledge source.",
  "encryptionKey": null,
  "indexedOneLakeParameters": {
    "fabricWorkspaceId": "<REDACTED>",
    "lakehouseId": "<REDACTED>",
    "targetPath": null,
    "ingestionParameters": {
      "disableImageVerbalization": false,
      "ingestionPermissionOptions": [],
      "contentExtractionMode": "standard",
      "identity": null,
      "embeddingModel": {
        "kind": "azureOpenAI",
        "azureOpenAIParameters": {
          "resourceUri": "<REDACTED>",
          "deploymentId": "text-embedding-3-large",
          "apiKey": "<REDACTED>",
          "modelName": "text-embedding-3-large"
        }
      },
      "chatCompletionModel": {
        "kind": "azureOpenAI",
        "azureOpenAIParameters": {
          "resourceUri": "<REDACTED>",
          "deploymentId": "gpt-5-mini",
          "apiKey": "<REDACTED>",
          "modelName": "gpt-5-mini"
        }
      },
      "ingestionSchedule": null,
      "aiServices": {
        "uri": "<REDACTED>",
        "apiKey": "<REDACTED>"
      }
    },
    "createdResources": {
    "datasource": "my-onelake-ks-datasource",
    "indexer": "my-onelake-ks-indexer",
    "skillset": "my-onelake-ks-skillset",
    "index": "my-onelake-ks-index"
    }
  }
}

Uyarı

Hassas bilgiler yeniden oluşturulur. Oluşturulan kaynaklar yanıtın sonunda görünür.

Bilgi kaynağı oluşturma

Dizine alınan OneLake bilgi kaynağı oluşturmak için Bilgi Kaynakları - Oluşturma veya Güncelleştirme (REST API) kullanın.

PUT {{search-url}}/knowledgesources/my-onelake-ks?api-version=2025-11-01-preview
api-key: {{api-key}}
Content-Type: application/json

{
    "name": "my-onelake-ks",
    "kind": "indexedOneLake",
    "description": "This knowledge source pulls content from a lakehouse.",
    "indexedOneLakeParameters": {
      "fabricWorkspaceId": "<YOUR FABRIC WORKSPACE GUID>",
      "lakehouseId": "<YOUR LAKEHOUSE GUID>",
      "targetPath": null,
      "ingestionParameters": {
        "identity": null,
        "disableImageVerbalization": null,
        "chatCompletionModel": { TRIMMED FOR BREVITY },
        "embeddingModel": { TRIMMED FOR BREVITY },
        "contentExtractionMode": "minimal",
        "ingestionSchedule": null,
        "ingestionPermissionOptions": []
    }
  }
}

Kaynağa özgü özellikler

Dizine alınan onelake bilgi kaynağı oluşturmak için aşağıdaki özellikleri geçirebilirsiniz.

İsim Description Türü Düzenlenebilir Gerekli
name Bilgi kaynakları koleksiyonunda benzersiz olması ve Azure AI Search'teki nesneler için adlandırma yönergelerini izlemesi gereken bilgi kaynağının adı. String Yes Yes
kind Söz konusu bilgi kaynağı türü bu örnekte indexedOneLake şeklindedir. String Hayı Yes
description Bilgi kaynağının açıklaması. String Yes Hayı
encryptionKey Hem bilgi kaynağındaki hem de oluşturulan nesnelerdeki hassas bilgileri şifrelemek için müşteri tarafından yönetilen anahtar . Nesne Yes Hayı
indexedOneLakeParameters OneLake bilgi kaynaklarına özgü parametreler: fabricWorkspaceId, lakehouseIdve targetPath. Nesne Yes
fabricWorkspaceId Lakehouse'un yer aldığı çalışma alanının GUID'i. String Hayı Yes
lakehouseId Göl evi GUID'i. String Hayı Yes
targetPath Göl evinde bir klasör veya kısayol. Belirtilmediğinde, tüm göl evi dizine eklenir. String Hayı Hayı

ingestionParameters özellikleri

Yalnızca dizine alınmış bilgi kaynakları için, içeriğin nasıl alınıp işlendiğini denetlemek için aşağıdaki ingestionParameters özellikleri geçirebilirsiniz.

İsim Description Türü Düzenlenebilir Gerekli
identity Oluşturulan dizin oluşturucuda kullanılacak yönetilen kimlik . Nesne Yes Hayı
disableImageVerbalization Görüntü sözelleştirme kullanımını etkinleştirir veya devre dışı bırakır. Varsayılan değer false olup, görüntü sözelleştirmeyi etkinleştirir. true Görüntü sözelleştirmesini devre dışı bırakmak için olarak ayarlayın. Boolean Hayı Hayı
chatCompletionModel Görüntüleri sözlü hale getiren veya içerik ayıklayan bir sohbet tamamlama modeli. Desteklenen modeller , , gpt-4ogpt-4o-mini, , gpt-4.1, gpt-4.1-mini, gpt-4.1-nano, gpt-5ve gpt-5-minimodelleridirgpt-5-nano. GenAI prompt becerisi oluşturulan beceri kümesine dahil edilecek. Bu parametrenin ayarlanması için, disableImageVerbalization'ün false olarak ayarlanmış olması gerekir. Nesne Yalnızca apiKey ve deploymentId düzenlenebilir Hayı
embeddingModel Dizin oluşturma sırasında ve sorgu zamanında metin ve görüntü içeriğini vektörleştiren bir metin ekleme modeli. Desteklenen modeller , text-embedding-ada-002ve text-embedding-3-smallşeklindedirtext-embedding-3-large. Azure OpenAI Ekleme becerisi oluşturulan beceri kümesine ve Azure OpenAI vektörleştiricisi de oluşturulan dizine dahil edilir. Nesne Yalnızca apiKey ve deploymentId düzenlenebilir Hayı
contentExtractionMode İçeriğin dosyalardan nasıl ayıklandığı denetler. Varsayılan değer, metin ve görüntüler için standart içerik ayıklama kullanan değeridir minimal. Azure İçerik Anlama becerisini kullanarak gelişmiş belge çatlama ve öbekleme için, oluşturulan beceri kümesine dahil edilmek üzere standard olarak ayarlayın. Yalnızca standardaiServices ve assetStore parametreleri belirtimlidir. String Hayı Hayı
aiServices Foundry Araçları'nda Azure Content Understanding'e erişmek için bir Microsoft Foundry kaynağı. contentExtractionMode parametresinin ayarlanabilmesi için standard olarak ayarlanması gerekir. Nesne Yalnızca apiKey düzenlenebilir Yes
assetStore Çıkarılan görüntüleri depolamak için bir blob kapsayıcısı. contentExtractionMode parametresinin ayarlanabilmesi için standard olarak ayarlanması gerekir. Nesne Hayı Hayı
ingestionSchedule Oluşturulan dizin oluşturucuya zamanlama bilgileri ekler. Veri yenilemeyi otomatikleştirmek için daha sonra bir zamanlama da ekleyebilirsiniz . Nesne Yes Hayı
ingestionPermissionOptions Seçilen bilgi kaynaklarından belge düzeyinde veri getirme izinleri: ADLS 2. Nesil veya dizinlenmiş SharePoint. Eğer userIds, groupIds veya rbacScope belirtirseniz, oluşturulan ADLS 2. Nesil dizin oluşturucu veya SharePoint dizin oluşturucu alınan izinleri içerecektir. Array Hayı Hayı

Alım durumunu denetleme

Bilgi Kaynakları - Durum (REST API)'yi, dizin oluşturucu işlem hattı oluşturan ve arama dizinini dolduran bilgi kaynaklarının dizin oluşturucu durumu da dahil olmak üzere, alım ilerleme durumunu ve sağlığını izlemek için kullanın.

### Check knowledge source ingestion status
GET {{search-url}}/knowledgesources/{{knowledge-source-name}}/status?api-version=2025-11-01-preview
api-key: {{api-key}}
Content-Type: application/json 

Alma parametrelerini içeren ve etkin olarak içerik alan bir istek için yanıt aşağıdaki örneğe benzer olabilir.

{ 
  "synchronizationStatus": "active", // creating, active, deleting 
  "synchronizationInterval" : "1d", // null if no schedule 
  "currentSynchronizationState" : { // spans multiple indexer "runs" 
    "startTime": "2025-10-27T19:30:00Z", 
    "itemUpdatesProcessed": 1100, 
    "itemsUpdatesFailed": 100, 
    "itemsSkipped": 1100, 
  }, 
  "lastSynchronizationState" : {  // null on first sync 
    "startTime": "2025-10-27T19:30:00Z", 
    "endTime": "2025-10-27T19:40:01Z", // this value appears on the activity record on each /retrieve 
    "itemUpdatesProcessed": 1100, 
    "itemsUpdatesFailed": 100, 
    "itemsSkipped": 1100, 
  }, 
  "statistics": {  // null on first sync 
    "totalSynchronization": 25, 
    "averageSynchronizationDuration": "00:15:20", 
    "averageItemsProcessedPerSynchronization" : 500 
  } 
} 

Oluşturulan nesneleri gözden geçirme

Dizine alınan bir OneLake bilgi kaynağı oluşturduğunuzda, arama hizmetiniz bir dizin oluşturucu, dizin, beceri kümesi ve veri kaynağı da oluşturur. Bu nesneleri düzenlemenizi önermiyoruz çünkü bir hataya veya uyumsuzluğa neden olmak işlem hattını bozabilir.

Bir bilgi kaynağı oluşturduktan sonra yanıt, oluşturulan nesneleri listeler. Bu nesneler sabit bir şablona göre oluşturulur ve adları bilgi kaynağının adına göre oluşturulur. Nesne adlarını değiştiremezsiniz.

Çıktı oluşturmayı doğrulamak için Azure portalını kullanmanızı öneririz. İş akışı şu şekildedir:

  1. Dizin oluşturucuda başarılı veya başarısız iletileri olup olmadığını denetleyin. Bağlantı veya kota hataları burada görünür.
  2. Aranabilir içerik için dizine bakın. Sorgu çalıştırmak için Arama Gezgini'ni kullanın.
  3. İçeriğinizin nasıl öbeklendiğini ve isteğe bağlı olarak vektörleştirildiği hakkında bilgi edinmek için beceri kümesini denetleyin.
  4. Bağlantı ayrıntıları için veri kaynağını denetleyin. Örneğimizde kolaylık sağlamak için API anahtarları kullanılır, ancak kimlik doğrulaması için Microsoft Entra Id ve yetkilendirme için rol tabanlı erişim denetimi kullanabilirsiniz.

Bilgi bankasına atama

Bilgi kaynağından memnunsanız bir sonraki adıma geçin: Bilgi bankasında bilgi kaynağını belirtin.

Belirtilmiş olan dizine alınmış OneLake bilgi kaynağı için, includeReferenceSourceData öğesini true olarak ayarladığınızdan emin olun. Bu adım, kaynak belge URL'sini alıntıya çekmek için gereklidir.

Bilgi bankası yapılandırıldıktan sonra, bilgi kaynağını sorgulamak için alma eylemini kullanın.

Bilgi kaynağını silme

Bilgi kaynağını silebilmeniz için önce, buna başvuran bilgi bankalarını silmeniz veya başvuruyu kaldırmak için bilgi bankası tanımını güncelleştirmeniz gerekir. Dizin ve dizin oluşturucu işlem hattı oluşturan bilgi kaynakları için , oluşturulan tüm nesneler de silinir. Ancak, bilgi kaynağı oluşturmak için mevcut bir dizini kullandıysanız dizininiz silinmez.

Kullanımda olan bir bilgi kaynağını silmeye çalışırsanız, eylem başarısız olur ve etkilenen bilgi bankalarının listesini döndürür.

Bilgi kaynağını silmek için:

  1. Arama hizmetinizdeki tüm bilgi bankalarının listesini alın.

    ### Get knowledge bases
    GET {{search-endpoint}}/knowledgebases?api-version=2025-11-01-preview&$select=name
    api-key: {{api-key}}
    

    Örnek bir yanıt aşağıdaki gibi görünebilir:

     {
         "@odata.context": "https://my-search-service.search.windows.net/$metadata#knowledgebases(name)",
         "value": [
         {
             "name": "my-kb"
         },
         {
             "name": "my-kb-2"
         }
         ]
     }
    
  2. Bilgi kaynağı başvurularını denetlemek için tek bir bilgi bankası tanımı alın.

    ### Get a knowledge base definition
    GET {{search-endpoint}}/knowledgebases/{{knowledge-base-name}}?api-version=2025-11-01-preview
    api-key: {{api-key}}
    

    Örnek bir yanıt aşağıdaki gibi görünebilir:

     {
       "name": "my-kb",
       "description": null,
       "retrievalInstructions": null,
       "answerInstructions": null,
       "outputMode": null,
       "knowledgeSources": [
         {
           "name": "my-blob-ks",
         }
       ],
       "models": [],
       "encryptionKey": null,
       "retrievalReasoningEffort": {
         "kind": "low"
       }
     }
    
  3. Bilgi bankasını silin veya birden çok kaynağınız varsa bilgi kaynağını kaldırarak bilgi bankasını güncelleştirin . Bu örnekte silme işlemi gösterilmektedir.

    ### Delete a knowledge base
    DELETE {{search-endpoint}}/knowledgebases/{{knowledge-base-name}}?api-version=2025-11-01-preview
    api-key: {{api-key}}
    
  4. Bilgi kaynağını silin.

    ### Delete a knowledge source
    DELETE {{search-endpoint}}/knowledgesources/{{knowledge-source-name}}?api-version=2025-11-01-preview
    api-key: {{api-key}}