IndexingParametersConfiguration interface
En ordlista med indexeringsspecifika konfigurationsegenskaper. Varje namn är namnet på en specifik egenskap. Varje värde måste vara av en primitiv typ.
Egenskaper
allow |
Om det är sant skapar en sökväg //document//file_data som är ett objekt som representerar de ursprungliga fildata som laddats ned från blobdatakällan. På så sätt kan du skicka ursprungliga fildata till en anpassad färdighet för bearbetning i berikningspipelinen eller till färdigheten Extrahering av dokument. |
data |
Anger vilka data som ska extraheras från Azure Blob Storage och talar om för indexeraren vilka data som ska extraheras från bildinnehåll när "imageAction" är inställt på ett annat värde än "none". Detta gäller inbäddat bildinnehåll i ett .PDF eller annat program, eller bildfiler som .jpg och .png, i Azure-blobar. |
delimited |
För CSV-blobar anger avgränsare för enskilda tecken i slutet för CSV-filer där varje rad startar ett nytt dokument (till exempel "|"). |
delimited |
För CSV-blobar anger en kommaavgränsad lista med kolumnrubriker som är användbar för att mappa källfält till målfält i ett index. |
document |
För JSON-matriser, givet ett strukturerat eller halvstrukturerat dokument, kan du ange en sökväg till matrisen med den här egenskapen. |
excluded |
Kommaavgränsad lista över filnamnstillägg som ska ignoreras vid bearbetning från Azure Blob Storage. Du kan till exempel exkludera ".png, .mp4" för att hoppa över dessa filer under indexeringen. |
execution |
Anger i vilken miljö indexeraren ska köras. |
fail |
För Azure-blobar anger du false om du vill fortsätta indexeringen om ett dokument inte indexerar. |
fail |
För Azure-blobar anger du false om du vill fortsätta indexeringen när en innehållstyp som inte stöds påträffas och du inte känner till alla innehållstyper (filtillägg) i förväg. |
first |
För CSV-blobar anger att den första raden (icke-tom) för varje blob innehåller rubriker. |
image |
Avgör hur inbäddade avbildningar och bildfiler ska bearbetas i Azure Blob Storage. Om du anger "imageAction"-konfigurationen till något annat värde än "none" krävs att en kompetensuppsättning också är kopplad till indexeraren. |
indexed |
Kommaavgränsad lista över filnamnstillägg som ska väljas vid bearbetning från Azure Blob Storage. Du kan till exempel fokusera indexeringen på specifika programfiler ".docx, .pptx, .msg" för att specifikt inkludera dessa filtyper. |
index |
För Azure-blobar anger du den här egenskapen till true för att fortfarande indexeras lagringsmetadata för blobinnehåll som är för stort för att bearbetas. Överdimensionerade blobbar behandlas som fel som standard. Begränsningar för blobstorlek finns i https://docs.microsoft.com/azure/search/search-limits-quotas-capacity. |
parsing |
Representerar parsningsläget för indexering från en Azure-blobdatakälla. |
pdf |
Avgör algoritmen för textextrahering från PDF-filer i Azure Blob Storage. |
query |
Ökar tidsgränsen utöver standardvärdet på 5 minuter för Azure SQL databasdatakällor, som anges i formatet "hh:mm:ss". |
Egenskapsinformation
allowSkillsetToReadFileData
Om det är sant skapar en sökväg //document//file_data som är ett objekt som representerar de ursprungliga fildata som laddats ned från blobdatakällan. På så sätt kan du skicka ursprungliga fildata till en anpassad färdighet för bearbetning i berikningspipelinen eller till färdigheten Extrahering av dokument.
allowSkillsetToReadFileData?: boolean
Egenskapsvärde
boolean
dataToExtract
Anger vilka data som ska extraheras från Azure Blob Storage och talar om för indexeraren vilka data som ska extraheras från bildinnehåll när "imageAction" är inställt på ett annat värde än "none". Detta gäller inbäddat bildinnehåll i ett .PDF eller annat program, eller bildfiler som .jpg och .png, i Azure-blobar.
dataToExtract?: "storageMetadata" | "allMetadata" | "contentAndMetadata"
Egenskapsvärde
"storageMetadata" | "allMetadata" | "contentAndMetadata"
delimitedTextDelimiter
För CSV-blobar anger avgränsare för enskilda tecken i slutet för CSV-filer där varje rad startar ett nytt dokument (till exempel "|").
delimitedTextDelimiter?: string
Egenskapsvärde
string
delimitedTextHeaders
För CSV-blobar anger en kommaavgränsad lista med kolumnrubriker som är användbar för att mappa källfält till målfält i ett index.
delimitedTextHeaders?: string
Egenskapsvärde
string
documentRoot
För JSON-matriser, givet ett strukturerat eller halvstrukturerat dokument, kan du ange en sökväg till matrisen med den här egenskapen.
documentRoot?: string
Egenskapsvärde
string
excludedFileNameExtensions
Kommaavgränsad lista över filnamnstillägg som ska ignoreras vid bearbetning från Azure Blob Storage. Du kan till exempel exkludera ".png, .mp4" för att hoppa över dessa filer under indexeringen.
excludedFileNameExtensions?: string
Egenskapsvärde
string
executionEnvironment
Anger i vilken miljö indexeraren ska köras.
executionEnvironment?: "standard" | "private"
Egenskapsvärde
"standard" | "private"
failOnUnprocessableDocument
För Azure-blobar anger du false om du vill fortsätta indexeringen om ett dokument inte indexerar.
failOnUnprocessableDocument?: boolean
Egenskapsvärde
boolean
failOnUnsupportedContentType
För Azure-blobar anger du false om du vill fortsätta indexeringen när en innehållstyp som inte stöds påträffas och du inte känner till alla innehållstyper (filtillägg) i förväg.
failOnUnsupportedContentType?: boolean
Egenskapsvärde
boolean
firstLineContainsHeaders
För CSV-blobar anger att den första raden (icke-tom) för varje blob innehåller rubriker.
firstLineContainsHeaders?: boolean
Egenskapsvärde
boolean
imageAction
Avgör hur inbäddade avbildningar och bildfiler ska bearbetas i Azure Blob Storage. Om du anger "imageAction"-konfigurationen till något annat värde än "none" krävs att en kompetensuppsättning också är kopplad till indexeraren.
imageAction?: "none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"
Egenskapsvärde
"none" | "generateNormalizedImages" | "generateNormalizedImagePerPage"
indexedFileNameExtensions
Kommaavgränsad lista över filnamnstillägg som ska väljas vid bearbetning från Azure Blob Storage. Du kan till exempel fokusera indexeringen på specifika programfiler ".docx, .pptx, .msg" för att specifikt inkludera dessa filtyper.
indexedFileNameExtensions?: string
Egenskapsvärde
string
indexStorageMetadataOnlyForOversizedDocuments
För Azure-blobar anger du den här egenskapen till true för att fortfarande indexeras lagringsmetadata för blobinnehåll som är för stort för att bearbetas. Överdimensionerade blobbar behandlas som fel som standard. Begränsningar för blobstorlek finns i https://docs.microsoft.com/azure/search/search-limits-quotas-capacity.
indexStorageMetadataOnlyForOversizedDocuments?: boolean
Egenskapsvärde
boolean
parsingMode
Representerar parsningsläget för indexering från en Azure-blobdatakälla.
parsingMode?: "text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"
Egenskapsvärde
"text" | "default" | "delimitedText" | "json" | "jsonArray" | "jsonLines"
pdfTextRotationAlgorithm
Avgör algoritmen för textextrahering från PDF-filer i Azure Blob Storage.
pdfTextRotationAlgorithm?: "none" | "detectAngles"
Egenskapsvärde
"none" | "detectAngles"
queryTimeout
Ökar tidsgränsen utöver standardvärdet på 5 minuter för Azure SQL databasdatakällor, som anges i formatet "hh:mm:ss".
queryTimeout?: string
Egenskapsvärde
string