SplitSkill interface
A sztringek szövegtömbökre való felosztásának képessége.
- Extends
Tulajdonságok
| azure |
Csak akkor érvényes, ha az egység azureOpenAITokens értékre van állítva. Ha meg van adva, a splitSkill ezeket a paramétereket fogja használni a tokenizálás végrehajtásakor. A paraméterek egy érvényes "encoderModelName" és egy opcionális "allowedSpecialTokens" tulajdonság. |
| default |
Egy érték, amely jelzi, hogy melyik nyelvi kódot kell használni. Az alapértelmezett érték |
| maximum |
Csak akkor alkalmazható, ha a textSplitMode értéke "pages". Ha meg van adva, a SplitSkill az első "maximumPagesToTake" oldalak feldolgozása után megszűnik a felosztással, hogy javuljon a teljesítmény, ha csak néhány kezdeti lapra van szükség az egyes dokumentumokból. |
| max |
A kívánt maximális oldalhossz. Az alapértelmezett érték 10000. |
| odatatype | Polimorfikus diszkriminatív, amely meghatározza az objektum különböző típusait |
| page |
Csak akkor alkalmazható, ha a textSplitMode értéke "pages". Ha meg van adva, az n+1. adattömb ekkora karakter/token számmal kezdődik az n. adattömb végétől kezdve. |
| text |
Egy érték, amely jelzi, hogy melyik felosztási módot kell végrehajtani. |
| unit | Csak akkor érvényes, ha a textSplitMode lapra van állítva. Két lehetséges érték létezik. Az értékek kiválasztása határozza meg a hossz (maximumPageLength és pageOverlapLength) mérést. Az alapértelmezett érték a "karakterek", ami azt jelenti, hogy a hossz karakter szerint lesz mérve. |
Örökölt tulajdonságok
| context | A műveletek végrehajtásának szintjét jelöli, például a dokumentum gyökerét vagy a dokumentum tartalmát (például /document vagy /document/content). Az alapértelmezett érték a /document. |
| description | A képesség leírása, amely leírja a képesség bemeneteit, kimeneteit és használatát. |
| inputs | A készségek bemenetei lehetnek a forrásadatkészlet oszlopai, vagy egy felsőbb rétegbeli képesség kimenete. |
| name | Annak a képességnek a neve, amely egyedileg azonosítja azt a képességkészleten belül. A névvel nem rendelkező képességek a képességtömb 1-alapú indexének alapértelmezett nevét kapják, "#" karakterrel előtaggal. |
| outputs | A szakértelem kimenete vagy egy keresési index mezője, vagy egy olyan érték, amelyet egy másik képesség bemenetként használhat fel. |
Tulajdonság adatai
azureOpenAITokenizerParameters
Csak akkor érvényes, ha az egység azureOpenAITokens értékre van állítva. Ha meg van adva, a splitSkill ezeket a paramétereket fogja használni a tokenizálás végrehajtásakor. A paraméterek egy érvényes "encoderModelName" és egy opcionális "allowedSpecialTokens" tulajdonság.
azureOpenAITokenizerParameters?: AzureOpenAITokenizerParameters
Tulajdonság értéke
defaultLanguageCode
Egy érték, amely jelzi, hogy melyik nyelvi kódot kell használni. Az alapértelmezett érték en.
defaultLanguageCode?: "da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"
Tulajdonság értéke
"da" | "de" | "en" | "es" | "fi" | "fr" | "it" | "ko" | "pt" | "cs" | "nl" | "hu" | "ja" | "pl" | "ru" | "sv" | "tr" | "bs" | "et" | "he" | "hi" | "hr" | "id" | "lv" | "nb" | "sk" | "sl" | "zh" | "is" | "sr" | "ur" | "am" | "pt-br"
maximumPagesToTake
Csak akkor alkalmazható, ha a textSplitMode értéke "pages". Ha meg van adva, a SplitSkill az első "maximumPagesToTake" oldalak feldolgozása után megszűnik a felosztással, hogy javuljon a teljesítmény, ha csak néhány kezdeti lapra van szükség az egyes dokumentumokból.
maximumPagesToTake?: number
Tulajdonság értéke
number
maxPageLength
A kívánt maximális oldalhossz. Az alapértelmezett érték 10000.
maxPageLength?: number
Tulajdonság értéke
number
odatatype
Polimorfikus diszkriminatív, amely meghatározza az objektum különböző típusait
odatatype: "#Microsoft.Skills.Text.SplitSkill"
Tulajdonság értéke
"#Microsoft.Skills.Text.SplitSkill"
pageOverlapLength
Csak akkor alkalmazható, ha a textSplitMode értéke "pages". Ha meg van adva, az n+1. adattömb ekkora karakter/token számmal kezdődik az n. adattömb végétől kezdve.
pageOverlapLength?: number
Tulajdonság értéke
number
textSplitMode
Egy érték, amely jelzi, hogy melyik felosztási módot kell végrehajtani.
textSplitMode?: "pages" | "sentences"
Tulajdonság értéke
"pages" | "sentences"
unit
Csak akkor érvényes, ha a textSplitMode lapra van állítva. Két lehetséges érték létezik. Az értékek kiválasztása határozza meg a hossz (maximumPageLength és pageOverlapLength) mérést. Az alapértelmezett érték a "karakterek", ami azt jelenti, hogy a hossz karakter szerint lesz mérve.
unit?: string
Tulajdonság értéke
string
Örökölt tulajdonság részletei
context
A műveletek végrehajtásának szintjét jelöli, például a dokumentum gyökerét vagy a dokumentum tartalmát (például /document vagy /document/content). Az alapértelmezett érték a /document.
context?: string
Tulajdonság értéke
string
A SearchIndexerSkill.contextwebhelyről örökölt
description
A képesség leírása, amely leírja a képesség bemeneteit, kimeneteit és használatát.
description?: string
Tulajdonság értéke
string
A SearchIndexerSkill.descriptionwebhelyről örökölt
inputs
A készségek bemenetei lehetnek a forrásadatkészlet oszlopai, vagy egy felsőbb rétegbeli képesség kimenete.
inputs: InputFieldMappingEntry[]
Tulajdonság értéke
A SearchIndexerSkill.inputs fájlbólörökölt
name
outputs
A szakértelem kimenete vagy egy keresési index mezője, vagy egy olyan érték, amelyet egy másik képesség bemenetként használhat fel.
outputs: OutputFieldMappingEntry[]
Tulajdonság értéke
A SearchIndexerSkill.outputs fájlbólörökölt