Aracılığıyla paylaş


IndexingParametersConfiguration interface

Dizin oluşturucuya özgü yapılandırma özelliklerinin sözlüğü. Her ad belirli bir özelliğin adıdır. Her değer ilkel türde olmalıdır.

Özellikler

allowSkillsetToReadFileData

True ise, blob veri kaynağınızdan indirilen özgün dosya verilerini temsil eden bir nesne olan //document//file_data yolunu oluşturur. Bu, özgün dosya verilerini zenginleştirme işlem hattı içinde işlenmek üzere özel bir beceriye veya Belge Ayıklama becerisine geçirmenizi sağlar.

dataToExtract

Azure blob depolamadan ayıklanması gereken verileri belirtir ve "imageAction" "none" dışında bir değere ayarlandığında dizin oluşturucuya görüntü içeriğinden hangi verilerin ayıklandığını bildirir. Bu, Azure bloblarındaki .PDF veya başka bir uygulamadaki ekli görüntü içeriği ya da .jpg ve .png gibi görüntü dosyaları için geçerlidir.

delimitedTextDelimiter

CSV blobları için, her satırın yeni bir belge başlattığı CSV dosyaları için satır sonu tek karakter sınırlayıcısını belirtir (örneğin, "|").

delimitedTextHeaders

CSV blobları için, kaynak alanları bir dizindeki hedef alanlara eşlemek için yararlı olan, virgülle ayrılmış sütun başlıkları listesini belirtir.

documentRoot

Yapılandırılmış veya yarı yapılandırılmış bir belge verilip JSON dizileri için bu özelliği kullanarak dizinin yolunu belirtebilirsiniz.

excludedFileNameExtensions

Azure blob depolamadan işlenirken yoksayılması gereken dosya adı uzantılarının virgülle ayrılmış listesi. Örneğin, dizin oluşturma sırasında bu dosyaların üzerine atlamak için ".png, .mp4" hariç tutabilirsiniz.

executionEnvironment

Dizin oluşturucunun yürütülmesi gereken ortamı belirtir.

failOnUnprocessableDocument

Azure blobları için, bir belge dizin oluşturmada başarısız olursa dizine eklemeye devam etmek istiyorsanız false olarak ayarlayın.

failOnUnsupportedContentType

Azure blobları için, desteklenmeyen bir içerik türüyle karşılaşıldığında dizine eklemeye devam etmek istiyorsanız ve tüm içerik türlerini (dosya uzantıları) önceden bilmiyorsanız false olarak ayarlayın.

firstLineContainsHeaders

CSV blobları için, her blobun ilk (boş olmayan) satırının üst bilgiler içerdiğini gösterir.

imageAction

Azure blob depolamada ekli görüntülerin ve görüntü dosyalarının nasıl işleneceğini belirler. "imageAction" yapılandırmasını "hiçbiri" dışında bir değere ayarlamak için bir beceri kümesinin de bu dizin oluşturucuya eklenmesi gerekir.

indexedFileNameExtensions

Azure blob depolamadan işlenirken seçecek dosya adı uzantılarının virgülle ayrılmış listesi. Örneğin, özellikle bu dosya türlerini eklemek için ".docx, .pptx, .msg" belirli uygulama dosyalarına dizin oluşturmayı odaklayabilirsiniz.

indexStorageMetadataOnlyForOversizedDocuments

Azure blobları için, işlenmek için çok büyük olan blob içeriğinin depolama meta verilerini dizine almaya devam etmek için bu özelliği true olarak ayarlayın. Büyük boyutlu bloblar varsayılan olarak hata olarak kabul edilir. Blob boyutuyla ilgili sınırlar için bkz https://docs.microsoft.com/azure/search/search-limits-quotas-capacity. .

parsingMode

Azure blob veri kaynağından dizin oluşturma için ayrıştırma modunu temsil eder.

pdfTextRotationAlgorithm

Azure blob depolamadaki PDF dosyalarından metin ayıklama algoritmasını belirler.

queryTimeout

"ss:mm:ss" biçiminde belirtilen Azure SQL veritabanı veri kaynakları için zaman aşımını 5 dakikalık varsayılandan daha fazla artırır.

Özellik Ayrıntıları

allowSkillsetToReadFileData

True ise, blob veri kaynağınızdan indirilen özgün dosya verilerini temsil eden bir nesne olan //document//file_data yolunu oluşturur. Bu, özgün dosya verilerini zenginleştirme işlem hattı içinde işlenmek üzere özel bir beceriye veya Belge Ayıklama becerisine geçirmenizi sağlar.

allowSkillsetToReadFileData?: boolean

Özellik Değeri

boolean

dataToExtract

Azure blob depolamadan ayıklanması gereken verileri belirtir ve "imageAction" "none" dışında bir değere ayarlandığında dizin oluşturucuya görüntü içeriğinden hangi verilerin ayıklandığını bildirir. Bu, Azure bloblarındaki .PDF veya başka bir uygulamadaki ekli görüntü içeriği ya da .jpg ve .png gibi görüntü dosyaları için geçerlidir.

dataToExtract?: "storageMetadata" | "allMetadata" | "contentAndMetadata"

Özellik Değeri

"storageMetadata" | "allMetadata" | "contentAndMetadata"

delimitedTextDelimiter

CSV blobları için, her satırın yeni bir belge başlattığı CSV dosyaları için satır sonu tek karakter sınırlayıcısını belirtir (örneğin, "|").

delimitedTextDelimiter?: string

Özellik Değeri

string

delimitedTextHeaders

CSV blobları için, kaynak alanları bir dizindeki hedef alanlara eşlemek için yararlı olan, virgülle ayrılmış sütun başlıkları listesini belirtir.

delimitedTextHeaders?: string

Özellik Değeri

string

documentRoot

Yapılandırılmış veya yarı yapılandırılmış bir belge verilip JSON dizileri için bu özelliği kullanarak dizinin yolunu belirtebilirsiniz.

documentRoot?: string

Özellik Değeri

string

excludedFileNameExtensions

Azure blob depolamadan işlenirken yoksayılması gereken dosya adı uzantılarının virgülle ayrılmış listesi. Örneğin, dizin oluşturma sırasında bu dosyaların üzerine atlamak için ".png, .mp4" hariç tutabilirsiniz.

excludedFileNameExtensions?: string

Özellik Değeri

string

executionEnvironment

Dizin oluşturucunun yürütülmesi gereken ortamı belirtir.

executionEnvironment?: "standard" | "private"

Özellik Değeri

"standard" | "private"

failOnUnprocessableDocument

Azure blobları için, bir belge dizin oluşturmada başarısız olursa dizine eklemeye devam etmek istiyorsanız false olarak ayarlayın.

failOnUnprocessableDocument?: boolean

Özellik Değeri

boolean

failOnUnsupportedContentType

Azure blobları için, desteklenmeyen bir içerik türüyle karşılaşıldığında dizine eklemeye devam etmek istiyorsanız ve tüm içerik türlerini (dosya uzantıları) önceden bilmiyorsanız false olarak ayarlayın.

failOnUnsupportedContentType?: boolean

Özellik Değeri

boolean

firstLineContainsHeaders

CSV blobları için, her blobun ilk (boş olmayan) satırının üst bilgiler içerdiğini gösterir.

firstLineContainsHeaders?: boolean

Özellik Değeri

boolean

imageAction

Azure blob depolamada ekli görüntülerin ve görüntü dosyalarının nasıl işleneceğini belirler. "imageAction" yapılandırmasını "hiçbiri" dışında bir değere ayarlamak için bir beceri kümesinin de bu dizin oluşturucuya eklenmesi gerekir.

imageAction?: "none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"

Özellik Değeri

"none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"

indexedFileNameExtensions

Azure blob depolamadan işlenirken seçecek dosya adı uzantılarının virgülle ayrılmış listesi. Örneğin, özellikle bu dosya türlerini eklemek için ".docx, .pptx, .msg" belirli uygulama dosyalarına dizin oluşturmayı odaklayabilirsiniz.

indexedFileNameExtensions?: string

Özellik Değeri

string

indexStorageMetadataOnlyForOversizedDocuments

Azure blobları için, işlenmek için çok büyük olan blob içeriğinin depolama meta verilerini dizine almaya devam etmek için bu özelliği true olarak ayarlayın. Büyük boyutlu bloblar varsayılan olarak hata olarak kabul edilir. Blob boyutuyla ilgili sınırlar için bkz https://docs.microsoft.com/azure/search/search-limits-quotas-capacity. .

indexStorageMetadataOnlyForOversizedDocuments?: boolean

Özellik Değeri

boolean

parsingMode

Azure blob veri kaynağından dizin oluşturma için ayrıştırma modunu temsil eder.

parsingMode?: "text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"

Özellik Değeri

"text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"

pdfTextRotationAlgorithm

Azure blob depolamadaki PDF dosyalarından metin ayıklama algoritmasını belirler.

pdfTextRotationAlgorithm?: "none" | "detectAngles"

Özellik Değeri

"none" | "detectAngles"

queryTimeout

"ss:mm:ss" biçiminde belirtilen Azure SQL veritabanı veri kaynakları için zaman aşımını 5 dakikalık varsayılandan daha fazla artırır.

queryTimeout?: string

Özellik Değeri

string