Aracılığıyla paylaş


Indexers - Get

Dizin oluşturucu tanımını alır.

GET {endpoint}/indexers('{indexerName}')?api-version=2024-03-01-Preview

URI Parametreleri

Name İçinde Gerekli Tür Description
endpoint
path True

string

Arama hizmetinin uç nokta URL'si.

indexerName
path True

string

Alınacak dizin oluşturucunun adı.

api-version
query True

string

İstemci Api Sürümü.

İstek Başlığı

Name Gerekli Tür Description
x-ms-client-request-id

string

uuid

Hata ayıklamaya yardımcı olmak için istekle birlikte gönderilen izleme kimliği.

Yanıtlar

Name Tür Description
200 OK

SearchIndexer

Other Status Codes

ErrorResponse

Hata yanıtı.

Örnekler

SearchServiceGetIndexer

Örnek isteği

GET https://myservice.search.windows.net/indexers('myindexer')?api-version=2024-03-01-Preview

Örnek yanıt

{
  "name": "myindexer",
  "description": "a cool indexer",
  "dataSourceName": "mydatasource",
  "targetIndexName": "orders",
  "schedule": {
    "interval": "PT1H",
    "startTime": "2015-01-01T00:00:00Z"
  },
  "parameters": {
    "maxFailedItems": 10,
    "maxFailedItemsPerBatch": 5
  },
  "fieldMappings": [],
  "disabled": false,
  "encryptionKey": {
    "keyVaultKeyName": "myKeyName",
    "keyVaultKeyVersion": "myKeyVersion",
    "keyVaultUri": "https://myKeyVault.vault.azure.net",
    "accessCredentials": {
      "applicationId": "00000000-0000-0000-0000-000000000000",
      "applicationSecret": null
    }
  }
}

Tanımlar

Name Description
AzureActiveDirectoryApplicationCredentials

Arama hizmetiniz için oluşturulan ve Azure Key Vault depolanan şifreleme anahtarlarına kimliği doğrulanmış erişim için kullanılan kayıtlı bir uygulamanın kimlik bilgileri.

BlobIndexerDataToExtract

Azure blob depolamadan ayıklanması gereken verileri belirtir ve "imageAction" "none" dışında bir değere ayarlandığında dizin oluşturucuya görüntü içeriğinden hangi verilerin ayıklandığını bildirir. Bu, azure bloblarındaki .PDF veya başka bir uygulamadaki ekli görüntü içeriği ya da .jpg ve .png gibi görüntü dosyaları için geçerlidir.

BlobIndexerImageAction

Azure blob depolamada ekli görüntülerin ve görüntü dosyalarının nasıl işleneceğini belirler. "imageAction" yapılandırmasını "none" dışında bir değere ayarlamak için bir beceri kümesinin de bu dizin oluşturucuya eklenmesi gerekir.

BlobIndexerParsingMode

Azure blob veri kaynağından dizin oluşturma için ayrıştırma modunu temsil eder.

BlobIndexerPDFTextRotationAlgorithm

Azure blob depolamadaki PDF dosyalarından metin ayıklama algoritmasını belirler.

ErrorAdditionalInfo

Kaynak yönetimi hatası ek bilgileri.

ErrorDetail

Hata ayrıntısı.

ErrorResponse

Hata yanıtı

FieldMapping

Veri kaynağındaki bir alan ile dizindeki hedef alan arasında eşleme tanımlar.

FieldMappingFunction

Dizin oluşturmadan önce veri kaynağından bir değeri dönüştüren bir işlevi temsil eder.

IndexerExecutionEnvironment

Dizin oluşturucunun yürütülmesi gereken ortamı belirtir.

IndexingParameters

Dizin oluşturucu yürütme parametrelerini temsil eder.

IndexingParametersConfiguration

Dizin oluşturucuya özgü yapılandırma özelliklerinin sözlüğü. Her ad belirli bir özelliğin adıdır. Her değer ilkel türde olmalıdır.

IndexingSchedule

Dizin oluşturucu yürütme zamanlamasını temsil eder.

SearchIndexer

Dizin oluşturucuları temsil eder.

SearchIndexerCache
SearchIndexerDataNoneIdentity

Bir veri kaynağının kimlik özelliğini temizler.

SearchIndexerDataUserAssignedIdentity

Kullanılacak veri kaynağının kimliğini belirtir.

SearchResourceEncryptionKey

Azure Key Vault'da müşteri tarafından yönetilen bir şifreleme anahtarı. Oluşturduğunuz ve yönettiğiniz anahtarlar, dizinler ve eş anlamlı haritalar gibi bekleyen verileri şifrelemek veya şifresini çözmek için kullanılabilir.

AzureActiveDirectoryApplicationCredentials

Arama hizmetiniz için oluşturulan ve Azure Key Vault depolanan şifreleme anahtarlarına kimliği doğrulanmış erişim için kullanılan kayıtlı bir uygulamanın kimlik bilgileri.

Name Tür Description
applicationId

string

Bekleyen verilerinizi şifrelerken kullanılacak Azure Key Vault gerekli erişim izinlerine sahip bir AAD Uygulama Kimliği. Uygulama Kimliği, AAD Uygulamanızın Nesne Kimliği ile karıştırılmamalıdır.

applicationSecret

string

Belirtilen AAD uygulamasının kimlik doğrulama anahtarı.

BlobIndexerDataToExtract

Azure blob depolamadan ayıklanması gereken verileri belirtir ve "imageAction" "none" dışında bir değere ayarlandığında dizin oluşturucuya görüntü içeriğinden hangi verilerin ayıklandığını bildirir. Bu, azure bloblarındaki .PDF veya başka bir uygulamadaki ekli görüntü içeriği ya da .jpg ve .png gibi görüntü dosyaları için geçerlidir.

Name Tür Description
allMetadata

string

Azure blob depolama alt sistemi tarafından sağlanan meta verileri ve içerik türüne özgü meta verileri ayıklar (örneğin, yalnızca .png dosyalara özgü meta veriler dizine alınır).

contentAndMetadata

string

Her blobdan tüm meta verileri ve metin içeriğini ayıklar.

storageMetadata

string

Yalnızca standart blob özelliklerini ve kullanıcı tarafından belirtilen meta verileri dizinler.

BlobIndexerImageAction

Azure blob depolamada ekli görüntülerin ve görüntü dosyalarının nasıl işleneceğini belirler. "imageAction" yapılandırmasını "none" dışında bir değere ayarlamak için bir beceri kümesinin de bu dizin oluşturucuya eklenmesi gerekir.

Name Tür Description
generateNormalizedImagePerPage

string

Görüntülerdeki metinleri ayıklar (örneğin, trafik durdurma işaretinden "DURDUR" sözcüğü) ve bunu içerik alanına ekler, ancak her sayfanın resim olarak işlenip ekli görüntüleri ayıklamak yerine buna göre normalleştirileceğinden PDF dosyalarını farklı şekilde işler. PDF olmayan dosya türleri, "generateNormalizedImages" ayarlanmış gibi değerlendirilir.

generateNormalizedImages

string

Görüntülerdeki metinleri ayıklar (örneğin, trafik durdurma işaretinden "DURDUR" sözcüğü) ve içerik alanına ekler. Bu eylem için "dataToExtract" öğesinin "contentAndMetadata" olarak ayarlanması gerekir. Normalleştirilmiş görüntü, görsel arama sonuçlarına görüntü eklediğinizde tutarlı işlemeyi yükseltmek için boyutlandırılmış ve döndürülmüş tekdüzen görüntü çıkışına neden olan ek işlemeyi ifade eder. Bu seçeneği kullandığınızda her görüntü için bu bilgiler oluşturulur.

none

string

Veri kümesindeki eklenmiş görüntüleri veya görüntü dosyalarını yoksayar. Bu varsayılan seçenektir.

BlobIndexerParsingMode

Azure blob veri kaynağından dizin oluşturma için ayrıştırma modunu temsil eder.

Name Tür Description
default

string

Normal dosya işleme için varsayılan olarak ayarlayın.

delimitedText

string

Bloblar düz CSV dosyaları olduğunda delimitedText olarak ayarlayın.

json

string

Yapılandırılmış içeriği JSON dosyalarından ayıklamak için json olarak ayarlayın.

jsonArray

string

JSON dizisinin tek tek öğelerini ayrı belgeler olarak ayıklamak için jsonArray olarak ayarlayın.

jsonLines

string

Ayrı ayrı JSON varlıklarını ayrı belgeler olarak yeni bir satırla ayırarak ayıklamak için jsonLines olarak ayarlayın.

text

string

Blob depolamadaki düz metin dosyalarında dizin oluşturma performansını geliştirmek için metne ayarlayın.

BlobIndexerPDFTextRotationAlgorithm

Azure blob depolamadaki PDF dosyalarından metin ayıklama algoritmasını belirler.

Name Tür Description
detectAngles

string

İçinde metin döndürmüş PDF dosyalarından daha iyi ve daha okunabilir metin ayıklaması üretebilir. Bu parametre kullanıldığında performans hızının küçük bir etkisi olabileceğini unutmayın. Bu parametre yalnızca PDF dosyaları için ve yalnızca eklenmiş metin içeren PDF'ler için geçerlidir. Döndürülen metin PDF'deki eklenmiş bir görüntünün içinde görünüyorsa, bu parametre geçerli değildir.

none

string

Normal metin ayıklamadan yararlanıyor. Bu varsayılan seçenektir.

ErrorAdditionalInfo

Kaynak yönetimi hatası ek bilgileri.

Name Tür Description
info

object

Ek bilgiler.

type

string

Ek bilgi türü.

ErrorDetail

Hata ayrıntısı.

Name Tür Description
additionalInfo

ErrorAdditionalInfo[]

Hata ek bilgileri.

code

string

Hata kodu.

details

ErrorDetail[]

Hata ayrıntıları.

message

string

Hata iletisi.

target

string

Hata hedefi.

ErrorResponse

Hata yanıtı

Name Tür Description
error

ErrorDetail

Hata nesnesi.

FieldMapping

Veri kaynağındaki bir alan ile dizindeki hedef alan arasında eşleme tanımlar.

Name Tür Description
mappingFunction

FieldMappingFunction

Dizin oluşturmadan önce her kaynak alan değerine uygulanacak bir işlev.

sourceFieldName

string

Veri kaynağındaki alanın adı.

targetFieldName

string

Dizindeki hedef alanın adı. Varsayılan olarak kaynak alan adıyla aynıdır.

FieldMappingFunction

Dizin oluşturmadan önce veri kaynağından bir değeri dönüştüren bir işlevi temsil eder.

Name Tür Description
name

string

Alan eşleme işlevinin adı.

parameters

object

İşleve geçirilebilir parametre adı/değer çiftlerinin sözlüğü. Her değer ilkel türde olmalıdır.

IndexerExecutionEnvironment

Dizin oluşturucunun yürütülmesi gereken ortamı belirtir.

Name Tür Description
private

string

Dizin oluşturucunun arama hizmeti için özel olarak sağlanan ortamla çalışması gerektiğini gösterir. Bu yalnızca dizin oluşturucunun paylaşılan özel bağlantı kaynakları üzerinden kaynaklara güvenli bir şekilde erişmesi gerekiyorsa yürütme ortamı olarak belirtilmelidir.

standard

string

Arama hizmetinin dizin oluşturucunun yürütüleceği yeri belirleyebileceğini gösterir. Bu, hiçbir şey belirtilmediğinde varsayılan ortamdır ve önerilen değerdir.

IndexingParameters

Dizin oluşturucu yürütme parametrelerini temsil eder.

Name Tür Default value Description
batchSize

integer

Performansı geliştirmek için veri kaynağından okunan ve tek bir toplu iş olarak dizine alınan öğelerin sayısı. Varsayılan değer, veri kaynağı türüne bağlıdır.

configuration

IndexingParametersConfiguration

Dizin oluşturucuya özgü yapılandırma özelliklerinin sözlüğü. Her ad belirli bir özelliğin adıdır. Her değer ilkel türde olmalıdır.

maxFailedItems

integer

0

Dizin oluşturucu yürütmesi için dizin oluşturmada başarısız olabilecek en fazla öğe sayısı yine de başarılı olarak kabul edilir. -1 sınır yok anlamına gelir. Varsayılan değer 0'dır.

maxFailedItemsPerBatch

integer

0

Tek bir toplu işlemdeki en fazla öğe sayısı, toplu işlemin yine de başarılı olarak kabul edilmesi için dizin oluşturmada başarısız olabilir. -1 sınır yok anlamına gelir. Varsayılan değer 0'dır.

IndexingParametersConfiguration

Dizin oluşturucuya özgü yapılandırma özelliklerinin sözlüğü. Her ad belirli bir özelliğin adıdır. Her değer ilkel türde olmalıdır.

Name Tür Default value Description
allowSkillsetToReadFileData

boolean

False

True ise, blob veri kaynağınızdan indirilen özgün dosya verilerini temsil eden bir nesne olan //document//file_data yolunu oluşturur. Bu, özgün dosya verilerini zenginleştirme işlem hattı içinde işlenmek üzere özel bir beceriye veya Belge Ayıklama becerisine geçirmenizi sağlar.

dataToExtract

BlobIndexerDataToExtract

contentAndMetadata

Azure blob depolamadan ayıklanması gereken verileri belirtir ve "imageAction" "none" dışında bir değere ayarlandığında dizin oluşturucuya görüntü içeriğinden hangi verilerin ayıklandığını bildirir. Bu, Azure bloblarındaki .PDF veya başka bir uygulamadaki ekli görüntü içeriği ya da .jpg ve .png gibi görüntü dosyaları için geçerlidir.

delimitedTextDelimiter

string

CSV blobları için, her satırın yeni bir belge başlattığı CSV dosyaları için satır sonu tek karakter sınırlayıcısını belirtir (örneğin, "|").

delimitedTextHeaders

string

CSV blobları için, kaynak alanları bir dizindeki hedef alanlara eşlemek için yararlı olan, virgülle ayrılmış sütun başlıkları listesini belirtir.

documentRoot

string

Yapılandırılmış veya yarı yapılandırılmış bir belge verilip JSON dizileri için bu özelliği kullanarak dizinin yolunu belirtebilirsiniz.

excludedFileNameExtensions

string

Azure blob depolamadan işlenirken yoksayılması gereken dosya adı uzantılarının virgülle ayrılmış listesi. Örneğin, dizin oluşturma sırasında bu dosyaların üzerine atlamak için ".png, .mp4" hariç tutabilirsiniz.

executionEnvironment

IndexerExecutionEnvironment

standard

Dizin oluşturucunun yürütülmesi gereken ortamı belirtir.

failOnUnprocessableDocument

boolean

False

Azure blobları için, bir belge dizin oluşturmada başarısız olursa dizine eklemeye devam etmek istiyorsanız false olarak ayarlayın.

failOnUnsupportedContentType

boolean

False

Azure blobları için, desteklenmeyen bir içerik türüyle karşılaşıldığında dizine eklemeye devam etmek istiyorsanız ve tüm içerik türlerini (dosya uzantıları) önceden bilmiyorsanız false olarak ayarlayın.

firstLineContainsHeaders

boolean

True

CSV blobları için, her blobun ilk (boş olmayan) satırının üst bilgiler içerdiğini gösterir.

imageAction

BlobIndexerImageAction

none

Azure blob depolamada ekli görüntülerin ve görüntü dosyalarının nasıl işleneceğini belirler. "imageAction" yapılandırmasını "hiçbiri" dışında bir değere ayarlamak için bir beceri kümesinin de bu dizin oluşturucuya eklenmesi gerekir.

indexStorageMetadataOnlyForOversizedDocuments

boolean

False

Azure blobları için, işlenmek için çok büyük olan blob içeriğinin depolama meta verilerini dizine almaya devam etmek için bu özelliği true olarak ayarlayın. Büyük boyutlu bloblar varsayılan olarak hata olarak kabul edilir. Blob boyutuyla ilgili sınırlar için bkz https://docs.microsoft.com/azure/search/search-limits-quotas-capacity. .

indexedFileNameExtensions

string

Azure blob depolamadan işlenirken seçecek dosya adı uzantılarının virgülle ayrılmış listesi. Örneğin, özellikle bu dosya türlerini dahil etmek için ".docx, .pptx, .msg" belirli uygulama dosyalarına dizin oluşturmayı odaklayabilirsiniz.

parsingMode

BlobIndexerParsingMode

default

Azure blob veri kaynağından dizin oluşturma için ayrıştırma modunu temsil eder.

pdfTextRotationAlgorithm

BlobIndexerPDFTextRotationAlgorithm

none

Azure blob depolamadaki PDF dosyalarından metin ayıklama algoritmasını belirler.

queryTimeout

string

00:05:00

"ss:mm:ss" biçiminde belirtilen Azure SQL veritabanı veri kaynakları için zaman aşımını 5 dakikalık varsayılandan daha fazla artırır.

IndexingSchedule

Dizin oluşturucu yürütme zamanlamasını temsil eder.

Name Tür Description
interval

string

Dizin oluşturucu yürütmeleri arasındaki zaman aralığı.

startTime

string

Dizin oluşturucunun çalışmaya başlaması gereken zaman.

SearchIndexer

Dizin oluşturucuları temsil eder.

Name Tür Default value Description
@odata.etag

string

Dizin oluşturucunun ETag'i.

cache

SearchIndexerCache

Her seferinde dizini yeniden oluşturmak zorunda kalmadan artımlı değişiklik adımlarına olanak sağlamak için zenginleştirme işlem hattına önbelleğe alma ekler.

dataSourceName

string

Bu dizin oluşturucunun verileri okuduğu veri kaynağının adı.

description

string

Dizin oluşturucunun açıklaması.

disabled

boolean

False

Dizin oluşturucunun devre dışı bırakılıp bırakılmadığını gösteren bir değer. Varsayılan değer false’tur.

encryptionKey

SearchResourceEncryptionKey

Azure Key Vault'de oluşturduğunuz şifreleme anahtarının açıklaması. Bu anahtar, Microsoft'un bile değil, Microsoft'un bile şifresini çözemediğinin tam güvencesini istediğinizde dizin oluşturucu tanımınız için ek bir bekleyen şifreleme düzeyi (dizin oluşturucu yürütme durumunun yanı sıra) sağlamak için kullanılır. Dizin oluşturucu tanımınızı şifreledikten sonra her zaman şifrelenmiş olarak kalır. Arama hizmeti bu özelliği null olarak ayarlama girişimlerini yoksayar. Şifreleme anahtarınızı döndürmek istiyorsanız bu özelliği gerektiği gibi değiştirebilirsiniz; Dizin oluşturucu tanımınız (ve dizin oluşturucu yürütme durumunuz) etkilenmez. Müşteri tarafından yönetilen anahtarlarla şifreleme ücretsiz arama hizmetleri için kullanılamaz ve yalnızca 1 Ocak 2019 veya sonrasında oluşturulan ücretli hizmetler için kullanılabilir.

fieldMappings

FieldMapping[]

Veri kaynağındaki alanlar ile dizindeki karşılık gelen hedef alanlar arasındaki eşlemeleri tanımlar.

name

string

Dizin oluşturucunun adı.

outputFieldMappings

FieldMapping[]

Çıkış alanı eşlemeleri zenginleştirme sonrasında ve dizin oluşturmadan hemen önce uygulanır.

parameters

IndexingParameters

Dizin oluşturucu yürütme parametreleri.

schedule

IndexingSchedule

Bu dizin oluşturucunun zamanlaması.

skillsetName

string

Bu dizin oluşturucuyla yürütülen beceri kümesinin adı.

targetIndexName

string

Bu dizin oluşturucunun veri yazdığı dizinin adı.

SearchIndexerCache

Name Tür Description
enableReprocessing

boolean

Artımlı yeniden işlemenin etkinleştirilip etkinleştirilmediğini belirtir.

identity SearchIndexerDataIdentity:

Zenginleştirme önbelleğine bağlantılar için kullanılan kullanıcı tarafından atanan yönetilen kimlik. bağlantı dizesi bir kimliği (ResourceId) gösteriyorsa ve belirtilmemişse, sistem tarafından atanan yönetilen kimlik kullanılır. Dizin oluşturucu güncelleştirmelerinde kimlik belirtilmemişse değer değişmeden kalır. "hiçbiri" olarak ayarlanırsa, bu özelliğin değeri temizlenir.

storageConnectionString

string

Önbellek verilerinin kalıcı olacağı depolama hesabına bağlantı dizesi.

SearchIndexerDataNoneIdentity

Bir veri kaynağının kimlik özelliğini temizler.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.DataNoneIdentity

Kimlik türünü belirten bir URI parçası.

SearchIndexerDataUserAssignedIdentity

Kullanılacak veri kaynağının kimliğini belirtir.

Name Tür Description
@odata.type string:

#Microsoft.Azure.Search.DataUserAssignedIdentity

Kimlik türünü belirten bir URI parçası.

userAssignedIdentity

string

Kullanıcı tarafından atanan yönetilen kimliğin tam Azure kaynak kimliği genellikle arama hizmetine atanması gereken "/subscriptions/12345678-1234-1234-1234-123467890ab/resourceGroups/rg/providers/Microsoft.ManagedIdentity/userAssignedIdentities/myId" biçimindedir.

SearchResourceEncryptionKey

Azure Key Vault'da müşteri tarafından yönetilen bir şifreleme anahtarı. Oluşturduğunuz ve yönettiğiniz anahtarlar, dizinler ve eş anlamlı haritalar gibi bekleyen verileri şifrelemek veya şifresini çözmek için kullanılabilir.

Name Tür Description
accessCredentials

AzureActiveDirectoryApplicationCredentials

Azure Key Vault erişmek için kullanılan isteğe bağlı Azure Active Directory kimlik bilgileri. Bunun yerine yönetilen kimlik kullanılıyorsa gerekli değildir.

identity SearchIndexerDataIdentity:

Bu şifreleme anahtarı için kullanılacak açık bir yönetilen kimlik. Belirtilmezse ve erişim kimlik bilgileri özelliği null ise, sistem tarafından atanan yönetilen kimlik kullanılır. Kaynağa güncelleştirildiğinde, açık kimlik belirtilmemişse değişmeden kalır. "Hiçbiri" belirtilirse, bu özelliğin değeri temizlenir.

keyVaultKeyName

string

Bekleyen verilerinizi şifrelemek için kullanılacak Azure Key Vault anahtarınızın adı.

keyVaultKeyVersion

string

Bekleyen verilerinizi şifrelemek için kullanılacak Azure Key Vault anahtarınızın sürümü.

keyVaultUri

string

Bekleyen verilerinizi şifrelemek için kullanılacak anahtarı içeren DNS adı olarak da adlandırılan Azure Key Vault URI'niz. Örnek bir URI olabilir https://my-keyvault-name.vault.azure.net.