IndexingParametersConfiguration interface
Kamus properti konfigurasi khusus pengindeks. Setiap nama adalah nama properti tertentu. Setiap nilai harus berjenis primitif.
Properti
allow |
Jika true, akan membuat jalur //document//file_data yang merupakan objek yang mewakili data file asli yang diunduh dari sumber data blob Anda. Ini memungkinkan Anda untuk meneruskan data file asli ke keterampilan kustom untuk diproses dalam alur pengayaan, atau ke keterampilan Ekstraksi Dokumen. |
data |
Menentukan data yang akan diekstrak dari penyimpanan blob Azure dan memberi tahu pengindeks data mana yang akan diekstrak dari konten gambar saat "imageAction" diatur ke nilai selain "tidak ada". Ini berlaku untuk konten gambar yang disematkan dalam .PDF atau aplikasi lain, atau file gambar seperti .jpg dan .png, di blob Azure. |
delimited |
Untuk blob CSV, menentukan pemisah karakter tunggal akhir baris untuk file CSV di mana setiap baris memulai dokumen baru (misalnya, "|"). |
delimited |
Untuk blob CSV, menentukan daftar header kolom yang dibatasi koma, berguna untuk memetakan bidang sumber ke bidang tujuan dalam indeks. |
document |
Untuk array JSON, dengan dokumen terstruktur atau semi terstruktur, Anda dapat menentukan jalur ke array menggunakan properti ini. |
excluded |
Daftar ekstensi nama file yang dibatasi koma untuk diabaikan saat memproses dari penyimpanan blob Azure. Misalnya, Anda dapat mengecualikan ".png, .mp4" untuk melewati file tersebut selama pengindeksan. |
execution |
Menentukan lingkungan tempat pengindeks harus dijalankan. |
fail |
Untuk blob Azure, atur ke false jika Anda ingin melanjutkan pengindeksan jika dokumen gagal diindeks. |
fail |
Untuk blob Azure, atur ke false jika Anda ingin melanjutkan pengindeksan saat jenis konten yang tidak didukung ditemui, dan Anda tidak tahu semua jenis konten (ekstensi file) terlebih dahulu. |
first |
Untuk blob CSV, menunjukkan bahwa baris pertama (tidak kosong) dari setiap blob berisi header. |
image |
Menentukan cara memproses gambar dan file gambar yang disematkan di penyimpanan blob Azure. Mengatur konfigurasi "imageAction" ke nilai apa pun selain "tidak ada" mengharuskan set keterampilan juga dilampirkan ke pengindeks tersebut. |
indexed |
Daftar ekstensi nama file yang dibatasi koma untuk dipilih saat memproses dari penyimpanan blob Azure. Misalnya, Anda dapat memfokuskan pengindeksan pada file aplikasi tertentu ".docx, .pptx, .msg" untuk secara khusus menyertakan jenis file tersebut. |
index |
Untuk blob Azure, atur properti ini ke true untuk masih mengindeks metadata penyimpanan untuk konten blob yang terlalu besar untuk diproses. Blob yang terlalu besar diperlakukan sebagai kesalahan secara default. Untuk batas ukuran blob, lihat https://docs.microsoft.com/azure/search/search-limits-quotas-capacity. |
parsing |
Mewakili mode penguraian untuk pengindeksan dari sumber data blob Azure. |
pdf |
Menentukan algoritma untuk ekstraksi teks dari file PDF di penyimpanan blob Azure. |
query |
Meningkatkan batas waktu di luar default 5 menit untuk Azure SQL sumber data database, yang ditentukan dalam format "hh:mm:ss". |
Detail Properti
allowSkillsetToReadFileData
Jika true, akan membuat jalur //document//file_data yang merupakan objek yang mewakili data file asli yang diunduh dari sumber data blob Anda. Ini memungkinkan Anda untuk meneruskan data file asli ke keterampilan kustom untuk diproses dalam alur pengayaan, atau ke keterampilan Ekstraksi Dokumen.
allowSkillsetToReadFileData?: boolean
Nilai Properti
boolean
dataToExtract
Menentukan data yang akan diekstrak dari penyimpanan blob Azure dan memberi tahu pengindeks data mana yang akan diekstrak dari konten gambar saat "imageAction" diatur ke nilai selain "tidak ada". Ini berlaku untuk konten gambar yang disematkan dalam .PDF atau aplikasi lain, atau file gambar seperti .jpg dan .png, di blob Azure.
dataToExtract?: "storageMetadata" | "allMetadata" | "contentAndMetadata"
Nilai Properti
"storageMetadata" | "allMetadata" | "contentAndMetadata"
delimitedTextDelimiter
Untuk blob CSV, menentukan pemisah karakter tunggal akhir baris untuk file CSV di mana setiap baris memulai dokumen baru (misalnya, "|").
delimitedTextDelimiter?: string
Nilai Properti
string
delimitedTextHeaders
Untuk blob CSV, menentukan daftar header kolom yang dibatasi koma, berguna untuk memetakan bidang sumber ke bidang tujuan dalam indeks.
delimitedTextHeaders?: string
Nilai Properti
string
documentRoot
Untuk array JSON, dengan dokumen terstruktur atau semi terstruktur, Anda dapat menentukan jalur ke array menggunakan properti ini.
documentRoot?: string
Nilai Properti
string
excludedFileNameExtensions
Daftar ekstensi nama file yang dibatasi koma untuk diabaikan saat memproses dari penyimpanan blob Azure. Misalnya, Anda dapat mengecualikan ".png, .mp4" untuk melewati file tersebut selama pengindeksan.
excludedFileNameExtensions?: string
Nilai Properti
string
executionEnvironment
Menentukan lingkungan tempat pengindeks harus dijalankan.
executionEnvironment?: "standard" | "private"
Nilai Properti
"standard" | "private"
failOnUnprocessableDocument
Untuk blob Azure, atur ke false jika Anda ingin melanjutkan pengindeksan jika dokumen gagal diindeks.
failOnUnprocessableDocument?: boolean
Nilai Properti
boolean
failOnUnsupportedContentType
Untuk blob Azure, atur ke false jika Anda ingin melanjutkan pengindeksan saat jenis konten yang tidak didukung ditemui, dan Anda tidak tahu semua jenis konten (ekstensi file) terlebih dahulu.
failOnUnsupportedContentType?: boolean
Nilai Properti
boolean
firstLineContainsHeaders
Untuk blob CSV, menunjukkan bahwa baris pertama (tidak kosong) dari setiap blob berisi header.
firstLineContainsHeaders?: boolean
Nilai Properti
boolean
imageAction
Menentukan cara memproses gambar dan file gambar yang disematkan di penyimpanan blob Azure. Mengatur konfigurasi "imageAction" ke nilai apa pun selain "tidak ada" mengharuskan set keterampilan juga dilampirkan ke pengindeks tersebut.
imageAction?: "none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"
Nilai Properti
"none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"
indexedFileNameExtensions
Daftar ekstensi nama file yang dibatasi koma untuk dipilih saat memproses dari penyimpanan blob Azure. Misalnya, Anda dapat memfokuskan pengindeksan pada file aplikasi tertentu ".docx, .pptx, .msg" untuk secara khusus menyertakan jenis file tersebut.
indexedFileNameExtensions?: string
Nilai Properti
string
indexStorageMetadataOnlyForOversizedDocuments
Untuk blob Azure, atur properti ini ke true untuk masih mengindeks metadata penyimpanan untuk konten blob yang terlalu besar untuk diproses. Blob yang terlalu besar diperlakukan sebagai kesalahan secara default. Untuk batas ukuran blob, lihat https://docs.microsoft.com/azure/search/search-limits-quotas-capacity.
indexStorageMetadataOnlyForOversizedDocuments?: boolean
Nilai Properti
boolean
parsingMode
Mewakili mode penguraian untuk pengindeksan dari sumber data blob Azure.
parsingMode?: "text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"
Nilai Properti
"text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"
pdfTextRotationAlgorithm
Menentukan algoritma untuk ekstraksi teks dari file PDF di penyimpanan blob Azure.
pdfTextRotationAlgorithm?: "none" | "detectAngles"
Nilai Properti
"none" | "detectAngles"
queryTimeout
Meningkatkan batas waktu di luar default 5 menit untuk Azure SQL sumber data database, yang ditentukan dalam format "hh:mm:ss".
queryTimeout?: string
Nilai Properti
string