IndexingParametersConfiguration interface
Dizin oluşturucuya özgü yapılandırma özelliklerinin sözlüğü. Her ad belirli bir özelliğin adıdır. Her değer ilkel türde olmalıdır.
Özellikler
| allow |
True ise, blob veri kaynağınızdan indirilen özgün dosya verilerini temsil eden bir nesne olan bir //document///file_data yolu oluşturur. Bu, özgün dosya verilerini zenginleştirme işlem hattı içinde işlenmek üzere özel bir beceriye veya Belge Ayıklama becerisine geçirmenizi sağlar. |
| data |
Azure blob depolamadan ayıklanması gereken verileri belirtir ve "imageAction" "none" dışında bir değere ayarlandığında dizin oluşturucuya görüntü içeriğinden ayıklanması gereken verileri bildirir. Bu, .PDF veya başka bir uygulamadaki ekli görüntü içeriği veya Azure bloblarında .jpg ve .pnggibi görüntü dosyaları için geçerlidir. |
| delimited |
CSV blobları için, her satırın yeni bir belge başlattığı CSV dosyaları için satır sonu tek karakterli sınırlayıcıyı belirtir (örneğin, "|"). |
| delimited |
CSV blobları için, kaynak alanları dizindeki hedef alanlara eşlemek için yararlı olan, virgülle ayrılmış sütun başlıkları listesini belirtir. |
| document |
Yapılandırılmış veya yarı yapılandırılmış bir belge verilen JSON dizileri için bu özelliği kullanarak dizinin yolunu belirtebilirsiniz. |
| excluded |
Azure blob depolamadan işlenirken yoksayılması gereken dosya adı uzantılarının virgülle ayrılmış listesi. Örneğin, dizin oluşturma sırasında bu dosyaları atlamak için ".png, .mp4" dışlayabilirsiniz. |
| execution |
Dizin oluşturucunun yürütülmesi gereken ortamı belirtir. |
| fail |
Azure blobları için, bir belge dizin oluşturmada başarısız olursa dizine almaya devam etmek istiyorsanız false olarak ayarlayın. |
| fail |
Azure blobları için, desteklenmeyen bir içerik türüyle karşılaşıldığında dizin oluşturma işlemine devam etmek istiyorsanız ve tüm içerik türlerini (dosya uzantıları) önceden bilmiyorsanız false olarak ayarlayın. |
| first |
CSV blobları için, her blobun ilk (boş olmayan) satırının üst bilgi içerdiğini gösterir. |
| image |
Azure blob depolamada ekli görüntülerin ve görüntü dosyalarının nasıl işleneceğini belirler. "imageAction" yapılandırmasını "none" dışında bir değere ayarlamak için bir beceri kümesinin de bu dizin oluşturucuya eklenmesi gerekir. |
| indexed |
Azure blob depolamadan işlenirken seçecek dosya adı uzantılarının virgülle ayrılmış listesi. Örneğin, özellikle bu dosya türlerini eklemek için ".docx, .pptx, .msg" belirli uygulama dosyalarında dizin oluşturmayı odaklayabilirsiniz. |
| index |
Azure blobları için, işlenmek için çok büyük olan blob içeriğinin depolama meta verilerini dizine almaya devam etmek için bu özelliği true olarak ayarlayın. Büyük büyük bloblar varsayılan olarak hata olarak değerlendirilir. Blob boyutuyla ilgili sınırlar için bkz. https://learn.microsoft.com/azure/search/search-limits-quotas-capacity. |
| markdown |
Markdown içeriği gruplandırılırken dikkate alınacak maksimum başlık derinliğini belirtir. Varsayılan |
| markdown |
Bir markdown dosyasının tam olarak bir arama belgesine mi yoksa birden çok arama belgesine mi ayrıştırılacağını belirleyecek alt modu belirtir. Varsayılan |
| parsing |
Azure blob veri kaynağından dizin oluşturma için ayrıştırma modunu temsil eder. |
| pdf |
Azure blob depolamadaki PDF dosyalarından metin ayıklama algoritmasını belirler. |
| query |
Azure SQL veritabanı veri kaynakları için "hh:mm:ss" biçiminde belirtilen 5 dakikalık varsayılanın ötesinde zaman aşımını artırır. |
Özellik Ayrıntıları
allowSkillsetToReadFileData
True ise, blob veri kaynağınızdan indirilen özgün dosya verilerini temsil eden bir nesne olan bir //document///file_data yolu oluşturur. Bu, özgün dosya verilerini zenginleştirme işlem hattı içinde işlenmek üzere özel bir beceriye veya Belge Ayıklama becerisine geçirmenizi sağlar.
allowSkillsetToReadFileData?: boolean
Özellik Değeri
boolean
dataToExtract
Azure blob depolamadan ayıklanması gereken verileri belirtir ve "imageAction" "none" dışında bir değere ayarlandığında dizin oluşturucuya görüntü içeriğinden ayıklanması gereken verileri bildirir. Bu, .PDF veya başka bir uygulamadaki ekli görüntü içeriği veya Azure bloblarında .jpg ve .pnggibi görüntü dosyaları için geçerlidir.
dataToExtract?: "storageMetadata" | "allMetadata" | "contentAndMetadata"
Özellik Değeri
"storageMetadata" | "allMetadata" | "contentAndMetadata"
delimitedTextDelimiter
CSV blobları için, her satırın yeni bir belge başlattığı CSV dosyaları için satır sonu tek karakterli sınırlayıcıyı belirtir (örneğin, "|").
delimitedTextDelimiter?: string
Özellik Değeri
string
delimitedTextHeaders
CSV blobları için, kaynak alanları dizindeki hedef alanlara eşlemek için yararlı olan, virgülle ayrılmış sütun başlıkları listesini belirtir.
delimitedTextHeaders?: string
Özellik Değeri
string
documentRoot
Yapılandırılmış veya yarı yapılandırılmış bir belge verilen JSON dizileri için bu özelliği kullanarak dizinin yolunu belirtebilirsiniz.
documentRoot?: string
Özellik Değeri
string
excludedFileNameExtensions
Azure blob depolamadan işlenirken yoksayılması gereken dosya adı uzantılarının virgülle ayrılmış listesi. Örneğin, dizin oluşturma sırasında bu dosyaları atlamak için ".png, .mp4" dışlayabilirsiniz.
excludedFileNameExtensions?: string
Özellik Değeri
string
executionEnvironment
Dizin oluşturucunun yürütülmesi gereken ortamı belirtir.
executionEnvironment?: "standard" | "private"
Özellik Değeri
"standard" | "private"
failOnUnprocessableDocument
Azure blobları için, bir belge dizin oluşturmada başarısız olursa dizine almaya devam etmek istiyorsanız false olarak ayarlayın.
failOnUnprocessableDocument?: boolean
Özellik Değeri
boolean
failOnUnsupportedContentType
Azure blobları için, desteklenmeyen bir içerik türüyle karşılaşıldığında dizin oluşturma işlemine devam etmek istiyorsanız ve tüm içerik türlerini (dosya uzantıları) önceden bilmiyorsanız false olarak ayarlayın.
failOnUnsupportedContentType?: boolean
Özellik Değeri
boolean
firstLineContainsHeaders
CSV blobları için, her blobun ilk (boş olmayan) satırının üst bilgi içerdiğini gösterir.
firstLineContainsHeaders?: boolean
Özellik Değeri
boolean
imageAction
Azure blob depolamada ekli görüntülerin ve görüntü dosyalarının nasıl işleneceğini belirler. "imageAction" yapılandırmasını "none" dışında bir değere ayarlamak için bir beceri kümesinin de bu dizin oluşturucuya eklenmesi gerekir.
imageAction?: "none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"
Özellik Değeri
"none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"
indexedFileNameExtensions
Azure blob depolamadan işlenirken seçecek dosya adı uzantılarının virgülle ayrılmış listesi. Örneğin, özellikle bu dosya türlerini eklemek için ".docx, .pptx, .msg" belirli uygulama dosyalarında dizin oluşturmayı odaklayabilirsiniz.
indexedFileNameExtensions?: string
Özellik Değeri
string
indexStorageMetadataOnlyForOversizedDocuments
Azure blobları için, işlenmek için çok büyük olan blob içeriğinin depolama meta verilerini dizine almaya devam etmek için bu özelliği true olarak ayarlayın. Büyük büyük bloblar varsayılan olarak hata olarak değerlendirilir. Blob boyutuyla ilgili sınırlar için bkz. https://learn.microsoft.com/azure/search/search-limits-quotas-capacity.
indexStorageMetadataOnlyForOversizedDocuments?: boolean
Özellik Değeri
boolean
markdownHeaderDepth
Markdown içeriği gruplandırılırken dikkate alınacak maksimum başlık derinliğini belirtir. Varsayılan h6 değeridir.
markdownHeaderDepth?: string
Özellik Değeri
string
markdownParsingSubmode
Bir markdown dosyasının tam olarak bir arama belgesine mi yoksa birden çok arama belgesine mi ayrıştırılacağını belirleyecek alt modu belirtir. Varsayılan oneToMany değeridir.
markdownParsingSubmode?: string
Özellik Değeri
string
parsingMode
Azure blob veri kaynağından dizin oluşturma için ayrıştırma modunu temsil eder.
parsingMode?: "text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines" | "markdown"
Özellik Değeri
"text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines" | "markdown"
pdfTextRotationAlgorithm
Azure blob depolamadaki PDF dosyalarından metin ayıklama algoritmasını belirler.
pdfTextRotationAlgorithm?: "none" | "detectAngles"
Özellik Değeri
"none" | "detectAngles"
queryTimeout
Azure SQL veritabanı veri kaynakları için "hh:mm:ss" biçiminde belirtilen 5 dakikalık varsayılanın ötesinde zaman aşımını artırır.
queryTimeout?: string
Özellik Değeri
string