Megosztás a következőn keresztül:


SplitSkill interface

A sztringek szövegtömbökre való felosztásának képessége.

Extends

Tulajdonságok

azureOpenAITokenizerParameters

Csak akkor érvényes, ha az egység azureOpenAITokens értékre van állítva. Ha meg van adva, a splitSkill ezeket a paramétereket fogja használni a tokenizálás végrehajtásakor. A paraméterek egy érvényes "encoderModelName" és egy opcionális "allowedSpecialTokens" tulajdonság.

defaultLanguageCode

Egy érték, amely jelzi, hogy melyik nyelvi kódot kell használni. Az alapértelmezett érték en.

maximumPagesToTake

Csak akkor alkalmazható, ha a textSplitMode értéke "pages". Ha meg van adva, a SplitSkill az első "maximumPagesToTake" oldalak feldolgozása után megszűnik a felosztással, hogy javuljon a teljesítmény, ha csak néhány kezdeti lapra van szükség az egyes dokumentumokból.

maxPageLength

A kívánt maximális oldalhossz. Az alapértelmezett érték 10000.

odatatype

Polimorfikus diszkriminatív, amely meghatározza az objektum különböző típusait

pageOverlapLength

Csak akkor alkalmazható, ha a textSplitMode értéke "pages". Ha meg van adva, az n+1. adattömb ekkora karakter/token számmal kezdődik az n. adattömb végétől kezdve.

textSplitMode

Egy érték, amely jelzi, hogy melyik felosztási módot kell végrehajtani.

unit

Csak akkor érvényes, ha a textSplitMode lapra van állítva. Két lehetséges érték létezik. Az értékek kiválasztása határozza meg a hossz (maximumPageLength és pageOverlapLength) mérést. Az alapértelmezett érték a "karakterek", ami azt jelenti, hogy a hossz karakter szerint lesz mérve.

Örökölt tulajdonságok

context

A műveletek végrehajtásának szintjét jelöli, például a dokumentum gyökerét vagy a dokumentum tartalmát (például /document vagy /document/content). Az alapértelmezett érték a /document.

description

A képesség leírása, amely leírja a képesség bemeneteit, kimeneteit és használatát.

inputs

A készségek bemenetei lehetnek a forrásadatkészlet oszlopai, vagy egy felsőbb rétegbeli képesség kimenete.

name

Annak a képességnek a neve, amely egyedileg azonosítja azt a képességkészleten belül. A névvel nem rendelkező képességek a képességtömb 1-alapú indexének alapértelmezett nevét kapják, "#" karakterrel előtaggal.

outputs

A szakértelem kimenete vagy egy keresési index mezője, vagy egy olyan érték, amelyet egy másik képesség bemenetként használhat fel.

Tulajdonság adatai

azureOpenAITokenizerParameters

Csak akkor érvényes, ha az egység azureOpenAITokens értékre van állítva. Ha meg van adva, a splitSkill ezeket a paramétereket fogja használni a tokenizálás végrehajtásakor. A paraméterek egy érvényes "encoderModelName" és egy opcionális "allowedSpecialTokens" tulajdonság.

azureOpenAITokenizerParameters?: AzureOpenAITokenizerParameters

Tulajdonság értéke

defaultLanguageCode

Egy érték, amely jelzi, hogy melyik nyelvi kódot kell használni. Az alapértelmezett érték en.

defaultLanguageCode?: "da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"

Tulajdonság értéke

"da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"

maximumPagesToTake

Csak akkor alkalmazható, ha a textSplitMode értéke "pages". Ha meg van adva, a SplitSkill az első "maximumPagesToTake" oldalak feldolgozása után megszűnik a felosztással, hogy javuljon a teljesítmény, ha csak néhány kezdeti lapra van szükség az egyes dokumentumokból.

maximumPagesToTake?: number

Tulajdonság értéke

number

maxPageLength

A kívánt maximális oldalhossz. Az alapértelmezett érték 10000.

maxPageLength?: number

Tulajdonság értéke

number

odatatype

Polimorfikus diszkriminatív, amely meghatározza az objektum különböző típusait

odatatype: "#Microsoft.Skills.Text.SplitSkill"

Tulajdonság értéke

"#Microsoft.Skills.Text.SplitSkill"

pageOverlapLength

Csak akkor alkalmazható, ha a textSplitMode értéke "pages". Ha meg van adva, az n+1. adattömb ekkora karakter/token számmal kezdődik az n. adattömb végétől kezdve.

pageOverlapLength?: number

Tulajdonság értéke

number

textSplitMode

Egy érték, amely jelzi, hogy melyik felosztási módot kell végrehajtani.

textSplitMode?: "pages" | "sentences"

Tulajdonság értéke

"pages" | "sentences"

unit

Csak akkor érvényes, ha a textSplitMode lapra van állítva. Két lehetséges érték létezik. Az értékek kiválasztása határozza meg a hossz (maximumPageLength és pageOverlapLength) mérést. Az alapértelmezett érték a "karakterek", ami azt jelenti, hogy a hossz karakter szerint lesz mérve.

unit?: string

Tulajdonság értéke

string

Örökölt tulajdonság részletei

context

A műveletek végrehajtásának szintjét jelöli, például a dokumentum gyökerét vagy a dokumentum tartalmát (például /document vagy /document/content). Az alapértelmezett érték a /document.

context?: string

Tulajdonság értéke

string

A SearchIndexerSkill.contextwebhelyről örökölt

description

A képesség leírása, amely leírja a képesség bemeneteit, kimeneteit és használatát.

description?: string

Tulajdonság értéke

string

A SearchIndexerSkill.descriptionwebhelyről örökölt

inputs

A készségek bemenetei lehetnek a forrásadatkészlet oszlopai, vagy egy felsőbb rétegbeli képesség kimenete.

inputs: InputFieldMappingEntry[]

Tulajdonság értéke

A SearchIndexerSkill.inputs fájlbólörökölt

name

Annak a képességnek a neve, amely egyedileg azonosítja azt a képességkészleten belül. A névvel nem rendelkező képességek a képességtömb 1-alapú indexének alapértelmezett nevét kapják, "#" karakterrel előtaggal.

name?: string

Tulajdonság értéke

string

SearchIndexerSkill.name-től örökölt

outputs

A szakértelem kimenete vagy egy keresési index mezője, vagy egy olyan érték, amelyet egy másik képesség bemenetként használhat fel.

outputs: OutputFieldMappingEntry[]

Tulajdonság értéke

A SearchIndexerSkill.outputs fájlbólörökölt