IndexingParametersConfiguration interface

Dizin oluşturucuya özgü yapılandırma özelliklerinin sözlüğü. Her ad belirli bir özelliğin adıdır. Her değer ilkel türde olmalıdır.

Özellikler

allowSkillsetToReadFileData

True ise, blob veri kaynağınızdan indirilen özgün dosya verilerini temsil eden bir nesne olan bir //document///file_data yolu oluşturur. Bu, özgün dosya verilerini zenginleştirme işlem hattı içinde işlenmek üzere özel bir beceriye veya Belge Ayıklama becerisine geçirmenizi sağlar.

dataToExtract

Azure blob depolamadan ayıklanması gereken verileri belirtir ve "imageAction" "none" dışında bir değere ayarlandığında dizin oluşturucuya görüntü içeriğinden ayıklanması gereken verileri bildirir. Bu, .PDF veya başka bir uygulamadaki ekli görüntü içeriği veya Azure bloblarında .jpg ve .pnggibi görüntü dosyaları için geçerlidir.

delimitedTextDelimiter

CSV blobları için, her satırın yeni bir belge başlattığı CSV dosyaları için satır sonu tek karakterli sınırlayıcıyı belirtir (örneğin, "|").

delimitedTextHeaders

CSV blobları için, kaynak alanları dizindeki hedef alanlara eşlemek için yararlı olan, virgülle ayrılmış sütun başlıkları listesini belirtir.

documentRoot

Yapılandırılmış veya yarı yapılandırılmış bir belge verilen JSON dizileri için bu özelliği kullanarak dizinin yolunu belirtebilirsiniz.

excludedFileNameExtensions

Azure blob depolamadan işlenirken yoksayılması gereken dosya adı uzantılarının virgülle ayrılmış listesi. Örneğin, dizin oluşturma sırasında bu dosyaları atlamak için ".png, .mp4" dışlayabilirsiniz.

executionEnvironment

Dizin oluşturucunun yürütülmesi gereken ortamı belirtir.

failOnUnprocessableDocument

Azure blobları için, bir belge dizin oluşturmada başarısız olursa dizine almaya devam etmek istiyorsanız false olarak ayarlayın.

failOnUnsupportedContentType

Azure blobları için, desteklenmeyen bir içerik türüyle karşılaşıldığında dizin oluşturma işlemine devam etmek istiyorsanız ve tüm içerik türlerini (dosya uzantıları) önceden bilmiyorsanız false olarak ayarlayın.

firstLineContainsHeaders

CSV blobları için, her blobun ilk (boş olmayan) satırının üst bilgi içerdiğini gösterir.

imageAction

Azure blob depolamada ekli görüntülerin ve görüntü dosyalarının nasıl işleneceğini belirler. "imageAction" yapılandırmasını "none" dışında bir değere ayarlamak için bir beceri kümesinin de bu dizin oluşturucuya eklenmesi gerekir.

indexedFileNameExtensions

Azure blob depolamadan işlenirken seçecek dosya adı uzantılarının virgülle ayrılmış listesi. Örneğin, özellikle bu dosya türlerini eklemek için ".docx, .pptx, .msg" belirli uygulama dosyalarında dizin oluşturmayı odaklayabilirsiniz.

indexStorageMetadataOnlyForOversizedDocuments

Azure blobları için, işlenmek için çok büyük olan blob içeriğinin depolama meta verilerini dizine almaya devam etmek için bu özelliği true olarak ayarlayın. Büyük büyük bloblar varsayılan olarak hata olarak değerlendirilir. Blob boyutuyla ilgili sınırlar için bkz. https://learn.microsoft.com/azure/search/search-limits-quotas-capacity.

markdownHeaderDepth

Markdown içeriği gruplandırılırken dikkate alınacak maksimum başlık derinliğini belirtir. Varsayılan h6 değeridir.

markdownParsingSubmode

Bir markdown dosyasının tam olarak bir arama belgesine mi yoksa birden çok arama belgesine mi ayrıştırılacağını belirleyecek alt modu belirtir. Varsayılan oneToMany değeridir.

parsingMode

Azure blob veri kaynağından dizin oluşturma için ayrıştırma modunu temsil eder.

pdfTextRotationAlgorithm

Azure blob depolamadaki PDF dosyalarından metin ayıklama algoritmasını belirler.

queryTimeout

Azure SQL veritabanı veri kaynakları için "hh:mm:ss" biçiminde belirtilen 5 dakikalık varsayılanın ötesinde zaman aşımını artırır.

Özellik Ayrıntıları

allowSkillsetToReadFileData

True ise, blob veri kaynağınızdan indirilen özgün dosya verilerini temsil eden bir nesne olan bir //document///file_data yolu oluşturur. Bu, özgün dosya verilerini zenginleştirme işlem hattı içinde işlenmek üzere özel bir beceriye veya Belge Ayıklama becerisine geçirmenizi sağlar.

allowSkillsetToReadFileData?: boolean

Özellik Değeri

boolean

dataToExtract

Azure blob depolamadan ayıklanması gereken verileri belirtir ve "imageAction" "none" dışında bir değere ayarlandığında dizin oluşturucuya görüntü içeriğinden ayıklanması gereken verileri bildirir. Bu, .PDF veya başka bir uygulamadaki ekli görüntü içeriği veya Azure bloblarında .jpg ve .pnggibi görüntü dosyaları için geçerlidir.

dataToExtract?: "storageMetadata" | "allMetadata" | "contentAndMetadata"

Özellik Değeri

"storageMetadata" | "allMetadata" | "contentAndMetadata"

delimitedTextDelimiter

CSV blobları için, her satırın yeni bir belge başlattığı CSV dosyaları için satır sonu tek karakterli sınırlayıcıyı belirtir (örneğin, "|").

delimitedTextDelimiter?: string

Özellik Değeri

string

delimitedTextHeaders

CSV blobları için, kaynak alanları dizindeki hedef alanlara eşlemek için yararlı olan, virgülle ayrılmış sütun başlıkları listesini belirtir.

delimitedTextHeaders?: string

Özellik Değeri

string

documentRoot

Yapılandırılmış veya yarı yapılandırılmış bir belge verilen JSON dizileri için bu özelliği kullanarak dizinin yolunu belirtebilirsiniz.

documentRoot?: string

Özellik Değeri

string

excludedFileNameExtensions

Azure blob depolamadan işlenirken yoksayılması gereken dosya adı uzantılarının virgülle ayrılmış listesi. Örneğin, dizin oluşturma sırasında bu dosyaları atlamak için ".png, .mp4" dışlayabilirsiniz.

excludedFileNameExtensions?: string

Özellik Değeri

string

executionEnvironment

Dizin oluşturucunun yürütülmesi gereken ortamı belirtir.

executionEnvironment?: "standard" | "private"

Özellik Değeri

"standard" | "private"

failOnUnprocessableDocument

Azure blobları için, bir belge dizin oluşturmada başarısız olursa dizine almaya devam etmek istiyorsanız false olarak ayarlayın.

failOnUnprocessableDocument?: boolean

Özellik Değeri

boolean

failOnUnsupportedContentType

Azure blobları için, desteklenmeyen bir içerik türüyle karşılaşıldığında dizin oluşturma işlemine devam etmek istiyorsanız ve tüm içerik türlerini (dosya uzantıları) önceden bilmiyorsanız false olarak ayarlayın.

failOnUnsupportedContentType?: boolean

Özellik Değeri

boolean

firstLineContainsHeaders

CSV blobları için, her blobun ilk (boş olmayan) satırının üst bilgi içerdiğini gösterir.

firstLineContainsHeaders?: boolean

Özellik Değeri

boolean

imageAction

Azure blob depolamada ekli görüntülerin ve görüntü dosyalarının nasıl işleneceğini belirler. "imageAction" yapılandırmasını "none" dışında bir değere ayarlamak için bir beceri kümesinin de bu dizin oluşturucuya eklenmesi gerekir.

imageAction?: "none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"

Özellik Değeri

"none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"

indexedFileNameExtensions

Azure blob depolamadan işlenirken seçecek dosya adı uzantılarının virgülle ayrılmış listesi. Örneğin, özellikle bu dosya türlerini eklemek için ".docx, .pptx, .msg" belirli uygulama dosyalarında dizin oluşturmayı odaklayabilirsiniz.

indexedFileNameExtensions?: string

Özellik Değeri

string

indexStorageMetadataOnlyForOversizedDocuments

Azure blobları için, işlenmek için çok büyük olan blob içeriğinin depolama meta verilerini dizine almaya devam etmek için bu özelliği true olarak ayarlayın. Büyük büyük bloblar varsayılan olarak hata olarak değerlendirilir. Blob boyutuyla ilgili sınırlar için bkz. https://learn.microsoft.com/azure/search/search-limits-quotas-capacity.

indexStorageMetadataOnlyForOversizedDocuments?: boolean

Özellik Değeri

boolean

markdownHeaderDepth

Markdown içeriği gruplandırılırken dikkate alınacak maksimum başlık derinliğini belirtir. Varsayılan h6 değeridir.

markdownHeaderDepth?: string

Özellik Değeri

string

markdownParsingSubmode

Bir markdown dosyasının tam olarak bir arama belgesine mi yoksa birden çok arama belgesine mi ayrıştırılacağını belirleyecek alt modu belirtir. Varsayılan oneToMany değeridir.

markdownParsingSubmode?: string

Özellik Değeri

string

parsingMode

Azure blob veri kaynağından dizin oluşturma için ayrıştırma modunu temsil eder.

parsingMode?: "text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines" | "markdown"

Özellik Değeri

"text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines" | "markdown"

pdfTextRotationAlgorithm

Azure blob depolamadaki PDF dosyalarından metin ayıklama algoritmasını belirler.

pdfTextRotationAlgorithm?: "none" | "detectAngles"

Özellik Değeri

"none" | "detectAngles"

queryTimeout

Azure SQL veritabanı veri kaynakları için "hh:mm:ss" biçiminde belirtilen 5 dakikalık varsayılanın ötesinde zaman aşımını artırır.

queryTimeout?: string

Özellik Değeri

string