Skillsets - Create
검색 서비스에서 새 기술 세트를 만듭니다.
POST {endpoint}/skillsets?api-version=2024-07-01
URI 매개 변수
Name | In(다음 안에) | 필수 | 형식 | Description |
---|---|---|---|---|
endpoint
|
path | True |
string |
검색 서비스의 엔드포인트 URL입니다. |
api-version
|
query | True |
string |
클라이언트 API 버전입니다. |
요청 헤더
Name | 필수 | 형식 | Description |
---|---|---|---|
x-ms-client-request-id |
string uuid |
디버깅에 도움이 되도록 요청과 함께 전송된 추적 ID입니다. |
요청 본문
Name | 필수 | 형식 | Description |
---|---|---|---|
name | True |
string |
기술 세트의 이름입니다. |
skills | True |
SearchIndexerSkill[]:
|
기술 세트의 기술 목록입니다. |
@odata.etag |
string |
기술 세트의 ETag입니다. |
|
cognitiveServices | CognitiveServicesAccount: |
기술을 실행할 때 사용할 Azure AI 서비스에 대한 세부 정보입니다. |
|
description |
string |
기술 세트에 대한 설명입니다. |
|
encryptionKey |
Azure Key Vault에서 만드는 암호화 키에 대한 설명입니다. 이 키는 Microsoft를 비롯한 누구도 기술 세트 정의를 해독할 수 없다는 완전한 보증을 원할 때 기술 세트 정의에 대한 추가 수준의 미사용 암호화를 제공하는 데 사용됩니다. 기술 세트 정의를 암호화한 후에는 항상 암호화된 상태로 유지됩니다. 검색 서비스는 이 속성을 null로 설정하려는 시도를 무시합니다. 암호화 키를 회전하려는 경우 필요에 따라 이 속성을 변경할 수 있습니다. 기술 세트 정의는 영향을 받지 않습니다. 고객 관리형 키를 사용한 암호화는 무료 검색 서비스에 사용할 수 없으며 2019년 1월 1일 이후 생성된 유료 서비스에만 사용할 수 있습니다. |
||
indexProjections |
보조 검색 인덱스에 대한 추가 프로젝션 정의입니다. |
||
knowledgeStore |
보강된 데이터의 Azure Blob, 테이블 또는 파일에 대한 추가 프로젝션 정의입니다. |
응답
Name | 형식 | Description |
---|---|---|
201 Created |
기술 세트가 성공적으로 생성되었습니다. |
|
Other Status Codes |
오류 응답입니다. |
예제
SearchServiceCreateSkillset
샘플 요청
POST https://myservice.search.windows.net/skillsets?api-version=2024-07-01
{
"name": "demoskillset",
"description": "Extract entities, detect language and extract key-phrases",
"skills": [
{
"@odata.type": "#Microsoft.Skills.Text.EntityRecognitionSkill",
"categories": [
"organization"
],
"defaultLanguageCode": "en",
"minimumPrecision": 0.7,
"inputs": [
{
"name": "text",
"source": "/document/content"
}
],
"outputs": [
{
"name": "organizations",
"targetName": "organizations"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
"inputs": [
{
"name": "text",
"source": "/document/content"
}
],
"outputs": [
{
"name": "languageCode",
"targetName": "languageCode"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.SplitSkill",
"textSplitMode": "pages",
"maximumPageLength": 4000,
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "textItems",
"targetName": "pages"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
"context": "/document/pages/*",
"inputs": [
{
"name": "text",
"source": "/document/pages/*"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "keyPhrases",
"targetName": "keyPhrases"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Custom.WebApiSkill",
"name": "MyCustomWebApiSkill",
"uri": "https://contoso.example.org",
"httpMethod": "POST",
"timeout": "PT30S",
"batchSize": 1,
"inputs": [
{
"name": "text",
"source": "/document/pages/*"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "customresult",
"targetName": "result"
}
],
"httpHeaders": {}
}
],
"knowledgeStore": {
"storageConnectionString": "DefaultEndpointsProtocol=https;AccountName=myStorage;AccountKey=myStorageKey;EndpointSuffix=core.windows.net",
"projections": [
{
"tables": [
{
"tableName": "Reviews",
"generatedKeyName": "ReviewId",
"source": "/document/Review",
"sourceContext": null,
"inputs": []
},
{
"tableName": "Sentences",
"generatedKeyName": "SentenceId",
"source": "/document/Review/Sentences/*",
"sourceContext": null,
"inputs": []
},
{
"tableName": "KeyPhrases",
"generatedKeyName": "KeyPhraseId",
"source": "/document/Review/Sentences/*/KeyPhrases",
"sourceContext": null,
"inputs": []
},
{
"tableName": "Entities",
"generatedKeyName": "EntityId",
"source": "/document/Review/Sentences/*/Entities/*",
"sourceContext": null,
"inputs": []
}
]
},
{
"objects": [
{
"storageContainer": "Reviews",
"source": "/document/Review",
"generatedKeyName": "/document/Review/Id"
}
]
}
]
},
"encryptionKey": {
"keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
"keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
"keyVaultUri": "https://myKeyVault.vault.azure.net",
"accessCredentials": {
"applicationId": "00000000-0000-0000-0000-000000000000",
"applicationSecret": "<applicationSecret>"
}
}
}
샘플 응답
{
"name": "demoskillset",
"description": "Extract entities, detect language and extract key-phrases",
"skills": [
{
"@odata.type": "#Microsoft.Skills.Text.EntityRecognitionSkill",
"name": "#1",
"description": null,
"context": null,
"inputs": [
{
"name": "text",
"source": "/document/content"
}
],
"outputs": [
{
"name": "organizations",
"targetName": "organizations"
}
],
"categories": [
"organization"
],
"defaultLanguageCode": "en",
"minimumPrecision": 0.7
},
{
"@odata.type": "#Microsoft.Skills.Text.LanguageDetectionSkill",
"name": "#2",
"description": null,
"context": null,
"inputs": [
{
"name": "text",
"source": "/document/content"
}
],
"outputs": [
{
"name": "languageCode",
"targetName": "languageCode"
}
]
},
{
"@odata.type": "#Microsoft.Skills.Text.SplitSkill",
"name": "#3",
"description": null,
"context": null,
"inputs": [
{
"name": "text",
"source": "/document/content"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "textItems",
"targetName": "pages"
}
],
"defaultLanguageCode": null,
"textSplitMode": "pages",
"maximumPageLength": 4000
},
{
"@odata.type": "#Microsoft.Skills.Text.KeyPhraseExtractionSkill",
"name": "#4",
"description": null,
"context": "/document/pages/*",
"inputs": [
{
"name": "text",
"source": "/document/pages/*"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "keyPhrases",
"targetName": "keyPhrases"
}
],
"defaultLanguageCode": null,
"maxKeyPhraseCount": null
},
{
"@odata.type": "#Microsoft.Skills.Custom.WebApiSkill",
"name": "MyCustomWebApiSkill",
"description": null,
"context": "/document",
"uri": "https://contoso.example.org",
"httpMethod": "POST",
"timeout": "PT30S",
"batchSize": 1,
"degreeOfParallelism": null,
"inputs": [
{
"name": "text",
"source": "/document/pages/*"
},
{
"name": "languageCode",
"source": "/document/languageCode"
}
],
"outputs": [
{
"name": "customresult",
"targetName": "result"
}
],
"httpHeaders": {}
}
],
"encryptionKey": {
"keyVaultKeyName": "myUserManagedEncryptionKey-createdinAzureKeyVault",
"keyVaultKeyVersion": "myKeyVersion-32charAlphaNumericString",
"keyVaultUri": "https://myKeyVault.vault.azure.net",
"accessCredentials": {
"applicationId": "00000000-0000-0000-0000-000000000000",
"applicationSecret": null
}
}
}
정의
Name | Description |
---|---|
Azure |
Azure Key Vault에 저장된 암호화 키에 대한 인증된 액세스에 사용되는 검색 서비스에 대해 생성된 등록된 애플리케이션의 자격 증명입니다. |
Azure |
Azure OpenAI 리소스를 사용하여 지정된 텍스트 입력에 대한 벡터 포함을 생성할 수 있습니다. |
Azure |
호출될 Azure Open AI 모델 이름입니다. |
Cognitive |
기술 세트에 연결된 Azure AI 서비스 리소스의 다중 지역 계정 키입니다. |
Conditional |
부울 작업이 필요한 시나리오에서 출력에 할당할 데이터를 결정할 수 있도록 하는 기술입니다. |
Custom |
찾은 일치 항목 및 관련 메타데이터에 대한 정보가 들어 있는 개체입니다. |
Custom |
루트 엔터티 이름에 대한 대체 맞춤법 또는 동의어를 지정하는 데 사용할 수 있는 복합 개체입니다. |
Custom |
기술은 사용자 정의 단어 및 구의 사용자 정의 목록에서 텍스트를 찾습니다. |
Custom |
CustomEntityLookupSkill의 입력 텍스트에 지원되는 언어 코드입니다. |
Default |
기술 세트의 기본 Azure AI 서비스 리소스를 나타내는 빈 개체입니다. |
Document |
보강 파이프라인 내의 파일에서 콘텐츠를 추출하는 기술입니다. |
Entity |
반환할 엔터티 범주를 나타내는 문자열입니다. |
Entity |
Text Analytics API를 사용하여 텍스트에서 연결된 엔터티를 추출합니다. |
Entity |
이 기술은 더 이상 사용되지 않습니다. V3를 사용합니다. 대신 EntityRecognitionSkill입니다. |
Entity |
되지 않는. EntityRecognitionSkill의 입력 텍스트에 지원되는 언어 코드입니다. |
Entity |
Text Analytics API를 사용하여 텍스트에서 다양한 형식의 엔터티를 추출합니다. |
Error |
리소스 관리 오류 추가 정보입니다. |
Error |
오류 세부 정보입니다. |
Error |
오류 응답 |
Image |
이미지 파일을 분석하는 기술입니다. 이미지 콘텐츠에 따라 다양한 시각적 기능 집합을 추출합니다. |
Image |
ImageAnalysisSkill에서 입력할 수 있는 언어 코드입니다. |
Image |
반환할 도메인별 세부 정보를 나타내는 문자열입니다. |
Index |
인덱서의 나머지 부분과 관련하여 인덱스 프로젝션의 동작을 정의합니다. |
Input |
기술에 대한 입력 필드 매핑입니다. |
Key |
핵심 구 추출에 텍스트 분석을 사용하는 기술입니다. |
Key |
KeyPhraseExtractionSkill의 입력 텍스트에 지원되는 언어 코드입니다. |
Language |
입력 텍스트의 언어를 감지하고 요청에 제출된 모든 문서에 대해 단일 언어 코드를 보고하는 기술입니다. 언어 코드는 분석의 신뢰도를 나타내는 점수와 쌍을 이깁니다. |
Line |
OCR 기술에서 인식하는 텍스트 줄 사이에 사용할 문자 시퀀스를 정의합니다. 기본값은 "space"입니다. |
Merge |
두 개 이상의 문자열을 단일 통합 문자열로 병합하는 기술로, 선택적 사용자 정의 구분 기호가 각 구성 요소 부분을 구분합니다. |
Ocr |
이미지 파일에서 텍스트를 추출하는 기술입니다. |
Ocr |
OcrSkill에서 입력할 수 있는 언어 코드입니다. |
Output |
기술에 대한 출력 필드 매핑입니다. |
PIIDetection |
Text Analytics API를 사용하여 입력 텍스트에서 개인 정보를 추출하고 마스킹 옵션을 제공합니다. |
PIIDetection |
입력 텍스트에서 검색된 개인 정보를 마스킹하는 데 사용할 maskingMode를 나타내는 문자열입니다. |
Search |
데이터 원본의 ID 속성을 지웁니다. |
Search |
사용할 데이터 원본의 ID를 지정합니다. |
Search |
보조 검색 인덱스에 대한 추가 프로젝션 정의입니다. |
Search |
지정된 검색 인덱스로 저장할 데이터에 대한 설명입니다. |
Search |
인덱스 프로젝션 관련 구성 속성의 사전입니다. 각 이름은 특정 속성의 이름입니다. 각 값은 기본 형식이어야 합니다. |
Search |
보강된 데이터의 Azure Blob, 테이블 또는 파일에 대한 추가 프로젝션 정의입니다. |
Search |
Azure Files에 저장할 데이터에 대한 프로젝션 정의입니다. |
Search |
Azure Blob에 저장할 데이터에 대한 프로젝션 정의입니다. |
Search |
다양한 프로젝션 선택기에 대한 컨테이너 개체입니다. |
Search |
Azure 테이블에 저장할 데이터에 대한 설명입니다. |
Search |
기술 목록입니다. |
Search |
Azure Key Vault의 고객 관리형 암호화 키입니다. 만들고 관리하는 키를 사용하여 인덱스 및 동의어 맵과 같은 미사용 데이터를 암호화하거나 암호 해독할 수 있습니다. |
Sentiment |
이 기술은 더 이상 사용되지 않습니다. V3를 사용합니다. 대신 SentimentSkill. |
Sentiment |
되지 않는. SentimentSkill의 입력 텍스트에 지원되는 언어 코드입니다. |
Sentiment |
Text Analytics API를 사용하여 구조화되지 않은 텍스트를 평가하고 각 레코드에 대해 문장 및 문서 수준에서 서비스에서 찾은 가장 높은 신뢰도 점수를 기반으로 감정 레이블(예: "부정", "중립" 및 "긍정")을 제공합니다. |
Shaper |
출력을 재구성하기 위한 기술입니다. 복합 필드(다중 파트 필드라고도 함)를 지원하는 복합 형식을 만듭니다. |
Split |
문자열을 텍스트 청크로 분할하는 기술입니다. |
Split |
SplitSkill의 입력 텍스트에 지원되는 언어 코드입니다. |
Text |
수행할 분할 모드를 나타내는 값입니다. |
Text |
텍스트를 한 언어에서 다른 언어로 번역하는 기술입니다. |
Text |
TextTranslationSkill의 입력 텍스트에 지원되는 언어 코드입니다. |
Visual |
반환할 시각적 기능 유형을 나타내는 문자열입니다. |
Web |
Web API 엔드포인트를 호출할 수 있는 기술로, 사용자 지정 코드를 호출하여 기술 세트를 확장할 수 있습니다. |
AzureActiveDirectoryApplicationCredentials
Azure Key Vault에 저장된 암호화 키에 대한 인증된 액세스에 사용되는 검색 서비스에 대해 생성된 등록된 애플리케이션의 자격 증명입니다.
Name | 형식 | Description |
---|---|---|
applicationId |
string |
미사용 데이터를 암호화할 때 사용할 Azure Key Vault에 필요한 액세스 권한이 부여된 AAD 애플리케이션 ID입니다. 애플리케이션 ID는 AAD 애플리케이션의 개체 ID와 혼동해서는 안 됩니다. |
applicationSecret |
string |
지정된 AAD 애플리케이션의 인증 키입니다. |
AzureOpenAIEmbeddingSkill
Azure OpenAI 리소스를 사용하여 지정된 텍스트 입력에 대한 벡터 포함을 생성할 수 있습니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
apiKey |
string |
지정된 Azure OpenAI 리소스의 API 키입니다. |
authIdentity | SearchIndexerDataIdentity: |
아웃바운드 연결에 사용되는 사용자 할당 관리 ID입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
deploymentId |
string |
지정된 리소스에 대한 Azure OpenAI 모델 배포의 ID입니다. |
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
dimensions |
integer |
결과 출력 포함에 포함해야 하는 차원의 수입니다. text-embedding-3 이상 모델에서만 지원됩니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
modelName |
제공된 deploymentId 경로에 배포되는 포함 모델의 이름입니다. |
|
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다. |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
|
resourceUri |
string |
Azure OpenAI 리소스의 리소스 URI입니다. |
AzureOpenAIModelName
호출될 Azure Open AI 모델 이름입니다.
Name | 형식 | Description |
---|---|---|
text-embedding-3-large |
string |
|
text-embedding-3-small |
string |
|
text-embedding-ada-002 |
string |
CognitiveServicesAccountKey
기술 세트에 연결된 Azure AI 서비스 리소스의 다중 지역 계정 키입니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 세트에 연결된 Azure AI 서비스 리소스의 유형을 지정하는 URI 조각입니다. |
description |
string |
기술 세트에 연결된 Azure AI 서비스 리소스에 대한 설명입니다. |
key |
string |
기술 세트에 연결된 Azure AI 서비스 리소스를 프로비전하는 데 사용되는 키입니다. |
ConditionalSkill
부울 작업이 필요한 시나리오에서 출력에 할당할 데이터를 결정할 수 있도록 하는 기술입니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다. |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
CustomEntity
찾은 일치 항목 및 관련 메타데이터에 대한 정보가 들어 있는 개체입니다.
Name | 형식 | Description |
---|---|---|
accentSensitive |
boolean |
기본값은 false입니다. 엔터티 이름과의 비교가 악센트에 민감해야 하는지 여부를 나타내는 부울 값입니다. |
aliases |
루트 엔터티 이름에 대한 대체 맞춤법 또는 동의어를 지정하는 데 사용할 수 있는 복합 개체의 배열입니다. |
|
caseSensitive |
boolean |
기본값은 false입니다. 엔터티 이름과의 비교가 문자 대/소문자를 구분해야 하는지 여부를 나타내는 부울 값입니다. "Microsoft"의 샘플 대/소문자를 구분하지 않는 일치 항목은 microsoft, microSoft, MICROSOFT일 수 있습니다. |
defaultAccentSensitive |
boolean |
이 엔터티의 기본 악센트 구분 값을 변경합니다. 모든 별칭 accentSensitive 값의 기본값을 변경하는 데 사용됩니다. |
defaultCaseSensitive |
boolean |
이 엔터티의 기본 대/소문자 구분 값을 변경합니다. 모든 별칭 caseSensitive 값의 기본값을 변경하는 데 사용됩니다. |
defaultFuzzyEditDistance |
integer |
이 엔터티의 기본 유사 항목 편집 거리 값을 변경합니다. 모든 별칭 fuzzyEditDistance 값의 기본값을 변경하는 데 사용할 수 있습니다. |
description |
string |
이 필드는 일치하는 텍스트에 대한 사용자 지정 메타데이터의 통과로 사용할 수 있습니다. 이 필드의 값은 기술 출력에서 엔터티의 모든 일치 항목과 함께 표시됩니다. |
fuzzyEditDistance |
integer |
기본값은 0입니다. 최대값은 5입니다. 엔터티 이름과 일치를 구성하는 허용되는 분기 문자 수를 나타냅니다. 지정된 일치 항목에 대해 가능한 가장 작은 유사 항목이 반환됩니다. 예를 들어 편집 거리가 3으로 설정된 경우 "Windows10"은 여전히 "Windows", "Windows10" 및 "Windows 7"과 일치합니다. 대/소문자 구분을 false로 설정하면 대/소문자 차이는 유사 허용 오차에 포함되지 않지만 그렇지 않습니다. |
id |
string |
이 필드는 일치하는 텍스트에 대한 사용자 지정 메타데이터의 통과로 사용할 수 있습니다. 이 필드의 값은 기술 출력에서 엔터티의 모든 일치 항목과 함께 표시됩니다. |
name |
string |
최상위 엔터티 설명자입니다. 기술 출력의 일치 항목은 이 이름으로 그룹화되며 찾은 텍스트의 "정규화된" 형식을 나타내야 합니다. |
subtype |
string |
이 필드는 일치하는 텍스트에 대한 사용자 지정 메타데이터의 통과로 사용할 수 있습니다. 이 필드의 값은 기술 출력에서 엔터티의 모든 일치 항목과 함께 표시됩니다. |
type |
string |
이 필드는 일치하는 텍스트에 대한 사용자 지정 메타데이터의 통과로 사용할 수 있습니다. 이 필드의 값은 기술 출력에서 엔터티의 모든 일치 항목과 함께 표시됩니다. |
CustomEntityAlias
루트 엔터티 이름에 대한 대체 맞춤법 또는 동의어를 지정하는 데 사용할 수 있는 복합 개체입니다.
Name | 형식 | Description |
---|---|---|
accentSensitive |
boolean |
별칭이 악센트를 구분하는지 확인합니다. |
caseSensitive |
boolean |
별칭이 대/소문자를 구분하는지 확인합니다. |
fuzzyEditDistance |
integer |
별칭의 유사 항목 편집 거리를 결정합니다. |
text |
string |
별칭의 텍스트입니다. |
CustomEntityLookupSkill
기술은 사용자 정의 단어 및 구의 사용자 정의 목록에서 텍스트를 찾습니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
defaultLanguageCode |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
|
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
entitiesDefinitionUri |
string |
일치시킬 모든 대상 텍스트가 포함된 JSON 또는 CSV 파일의 경로입니다. 이 엔터티 정의는 인덱서 실행의 시작 부분에서 읽습니다. 인덱서 실행 중에 이 파일에 대한 업데이트는 후속 실행까지 적용되지 않습니다. 이 구성은 HTTPS를 통해 액세스할 수 있어야 합니다. |
globalDefaultAccentSensitive |
boolean |
AccentSensitive의 전역 플래그입니다. CustomEntity에서 AccentSensitive가 설정되지 않은 경우 이 값이 기본값이 됩니다. |
globalDefaultCaseSensitive |
boolean |
CaseSensitive의 전역 플래그입니다. CustomEntity에서 CaseSensitive가 설정되지 않은 경우 이 값이 기본값이 됩니다. |
globalDefaultFuzzyEditDistance |
integer |
FuzzyEditDistance의 전역 플래그입니다. CustomEntity에서 FuzzyEditDistance가 설정되지 않은 경우 이 값이 기본값이 됩니다. |
inlineEntitiesDefinition |
인라인 CustomEntity 정의입니다. |
|
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다. |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
CustomEntityLookupSkillLanguage
CustomEntityLookupSkill의 입력 텍스트에 지원되는 언어 코드입니다.
Name | 형식 | Description |
---|---|---|
da |
string |
덴마크어 |
de |
string |
독일어 |
en |
string |
영어 |
es |
string |
스페인어 |
fi |
string |
핀란드어 |
fr |
string |
프랑스어 |
it |
string |
이탈리아어 |
ko |
string |
한국어 |
pt |
string |
포르투갈어 |
DefaultCognitiveServicesAccount
기술 세트의 기본 Azure AI 서비스 리소스를 나타내는 빈 개체입니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 세트에 연결된 Azure AI 서비스 리소스의 유형을 지정하는 URI 조각입니다. |
description |
string |
기술 세트에 연결된 Azure AI 서비스 리소스에 대한 설명입니다. |
DocumentExtractionSkill
보강 파이프라인 내의 파일에서 콘텐츠를 추출하는 기술입니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
configuration |
object |
기술에 대한 구성 사전입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
dataToExtract |
string |
기술에 대해 추출할 데이터의 형식입니다. 정의되지 않은 경우 'contentAndMetadata'로 설정됩니다. |
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다. |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
|
parsingMode |
string |
기술에 대한 parsingMode입니다. 정의되지 않은 경우 '기본값'으로 설정됩니다. |
EntityCategory
반환할 엔터티 범주를 나타내는 문자열입니다.
Name | 형식 | Description |
---|---|---|
datetime |
string |
날짜 및 시간을 설명하는 엔터티입니다. |
string |
전자 메일 주소를 설명하는 엔터티입니다. |
|
location |
string |
물리적 위치를 설명하는 엔터티입니다. |
organization |
string |
조직을 설명하는 엔터티입니다. |
person |
string |
사람을 설명하는 엔터티입니다. |
quantity |
string |
수량을 설명하는 엔터티입니다. |
url |
string |
URL을 설명하는 엔터티입니다. |
EntityLinkingSkill
Text Analytics API를 사용하여 텍스트에서 연결된 엔터티를 추출합니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
defaultLanguageCode |
string |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
minimumPrecision |
number |
신뢰도 점수가 지정된 값보다 큰 엔터티만 포함하는 데 사용되는 0에서 1 사이의 값입니다. 설정하지 않거나(기본값) 명시적으로 null로 설정하면 모든 엔터티가 포함됩니다. |
modelVersion |
string |
Text Analytics 서비스를 호출할 때 사용할 모델의 버전입니다. 지정하지 않으면 기본적으로 사용 가능한 최신 버전으로 설정됩니다. 반드시 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다. |
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다. |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
EntityRecognitionSkill
이 기술은 더 이상 사용되지 않습니다. V3를 사용합니다. 대신 EntityRecognitionSkill입니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
categories |
추출해야 하는 엔터티 범주 목록입니다. |
|
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
defaultLanguageCode |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
|
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
includeTypelessEntities |
boolean |
잘 알려져 있지만 미리 정의된 형식을 준수하지 않는 엔터티를 포함할지 여부를 결정합니다. 이 구성이 설정되지 않은 경우(기본값), null로 설정하거나 false로 설정하면 미리 정의된 형식 중 하나를 준수하지 않는 엔터티가 표시되지 않습니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
minimumPrecision |
number |
신뢰도 점수가 지정된 값보다 큰 엔터티만 포함하는 데 사용되는 0에서 1 사이의 값입니다. 설정하지 않거나(기본값) 명시적으로 null로 설정하면 모든 엔터티가 포함됩니다. |
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다. |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
EntityRecognitionSkillLanguage
되지 않는. EntityRecognitionSkill의 입력 텍스트에 지원되는 언어 코드입니다.
Name | 형식 | Description |
---|---|---|
ar |
string |
아랍어 |
cs |
string |
체코어 |
da |
string |
덴마크어 |
de |
string |
독일어 |
el |
string |
그리스어 |
en |
string |
영어 |
es |
string |
스페인어 |
fi |
string |
핀란드어 |
fr |
string |
프랑스어 |
hu |
string |
헝가리어 |
it |
string |
이탈리아어 |
ja |
string |
일본어 |
ko |
string |
한국어 |
nl |
string |
네덜란드어 |
no |
string |
노르웨이어(복말) |
pl |
string |
폴란드어 |
pt-BR |
string |
포르투갈어(브라질) |
pt-PT |
string |
포르투갈어(포르투갈) |
ru |
string |
러시아어 |
sv |
string |
스웨덴어 |
tr |
string |
터키어 |
zh-Hans |
string |
Chinese-Simplified |
zh-Hant |
string |
Chinese-Traditional |
EntityRecognitionSkillV3
Text Analytics API를 사용하여 텍스트에서 다양한 형식의 엔터티를 추출합니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
categories |
string[] |
추출해야 하는 엔터티 범주 목록입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
defaultLanguageCode |
string |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
minimumPrecision |
number |
신뢰도 점수가 지정된 값보다 큰 엔터티만 포함하는 데 사용되는 0에서 1 사이의 값입니다. 설정하지 않거나(기본값) 명시적으로 null로 설정하면 모든 엔터티가 포함됩니다. |
modelVersion |
string |
Text Analytics API를 호출할 때 사용할 모델의 버전입니다. 지정하지 않으면 기본적으로 사용 가능한 최신 버전으로 설정됩니다. 반드시 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다. |
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다. |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
ErrorAdditionalInfo
리소스 관리 오류 추가 정보입니다.
Name | 형식 | Description |
---|---|---|
info |
object |
추가 정보입니다. |
type |
string |
추가 정보 유형입니다. |
ErrorDetail
오류 세부 정보입니다.
Name | 형식 | Description |
---|---|---|
additionalInfo |
오류 추가 정보입니다. |
|
code |
string |
오류 코드입니다. |
details |
오류 세부 정보입니다. |
|
message |
string |
오류 메시지입니다. |
target |
string |
오류 대상입니다. |
ErrorResponse
오류 응답
Name | 형식 | Description |
---|---|---|
error |
오류 개체입니다. |
ImageAnalysisSkill
이미지 파일을 분석하는 기술입니다. 이미지 콘텐츠에 따라 다양한 시각적 기능 집합을 추출합니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
defaultLanguageCode |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
|
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
details |
반환할 도메인별 세부 정보를 나타내는 문자열입니다. |
|
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다. |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
|
visualFeatures |
시각적 기능 목록입니다. |
ImageAnalysisSkillLanguage
ImageAnalysisSkill에서 입력할 수 있는 언어 코드입니다.
Name | 형식 | Description |
---|---|---|
ar |
string |
아랍어 |
az |
string |
아제르바이잔어 |
bg |
string |
불가리어 |
bs |
string |
보스니아어(라틴 문자) |
ca |
string |
카탈로니아어 |
cs |
string |
체코어 |
cy |
string |
웨일스어 |
da |
string |
덴마크어 |
de |
string |
독일어 |
el |
string |
그리스어 |
en |
string |
영어 |
es |
string |
스페인어 |
et |
string |
에스토니아어 |
eu |
string |
바스크어 |
fi |
string |
핀란드어 |
fr |
string |
프랑스어 |
ga |
string |
아일랜드어 |
gl |
string |
갈리시아어 |
he |
string |
히브리어 |
hi |
string |
힌디어 |
hr |
string |
크로아티아어 |
hu |
string |
헝가리어 |
id |
string |
인도네시아어 |
it |
string |
이탈리아어 |
ja |
string |
일본어 |
kk |
string |
카자흐어 |
ko |
string |
한국어 |
lt |
string |
리투아니아어 |
lv |
string |
라트비아어 |
mk |
string |
마케도니아인 |
ms |
string |
말레이시아 |
nb |
string |
노르웨이어(복말) |
nl |
string |
네덜란드어 |
pl |
string |
폴란드어 |
prs |
string |
다리어 |
pt |
string |
Portuguese-Portugal |
pt-BR |
string |
Portuguese-Brazil |
pt-PT |
string |
Portuguese-Portugal |
ro |
string |
루마니아어 |
ru |
string |
러시아어 |
sk |
string |
슬로바키아어 |
sl |
string |
슬로베니아어 |
sr-Cyrl |
string |
세르비아어 - 키릴 자모 RS |
sr-Latn |
string |
세르비아어 - 라틴 RS |
sv |
string |
스웨덴어 |
th |
string |
태국어 |
tr |
string |
터키어 |
uk |
string |
우크라이나어 |
vi |
string |
베트남어 |
zh |
string |
중국어 간체 |
zh-Hans |
string |
중국어 간체 |
zh-Hant |
string |
중국어 번체 |
ImageDetail
반환할 도메인별 세부 정보를 나타내는 문자열입니다.
Name | 형식 | Description |
---|---|---|
celebrities |
string |
유명인으로 인식되는 세부 정보입니다. |
landmarks |
string |
랜드마크로 인식되는 세부 정보입니다. |
IndexProjectionMode
인덱서의 나머지 부분과 관련하여 인덱스 프로젝션의 동작을 정의합니다.
Name | 형식 | Description |
---|---|---|
includeIndexingParentDocuments |
string |
원본 문서는 인덱서의 대상 인덱스로 작성됩니다. 이것이 기본 패턴입니다. |
skipIndexingParentDocuments |
string |
원본 문서는 인덱서의 대상 인덱스로 작성하지 않습니다. |
InputFieldMappingEntry
기술에 대한 입력 필드 매핑입니다.
Name | 형식 | Description |
---|---|---|
inputs |
복합 형식을 만들 때 사용되는 재귀 입력입니다. |
|
name |
string |
입력의 이름입니다. |
source |
string |
입력의 소스입니다. |
sourceContext |
string |
재귀 입력을 선택하는 데 사용되는 원본 컨텍스트입니다. |
KeyPhraseExtractionSkill
핵심 구 추출에 텍스트 분석을 사용하는 기술입니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
defaultLanguageCode |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
|
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
maxKeyPhraseCount |
integer |
반환할 핵심 구 수를 나타내는 숫자입니다. 없는 경우 식별된 모든 핵심 구가 반환됩니다. |
modelVersion |
string |
Text Analytics 서비스를 호출할 때 사용할 모델의 버전입니다. 지정하지 않으면 기본적으로 사용 가능한 최신 버전으로 설정됩니다. 반드시 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다. |
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다. |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
KeyPhraseExtractionSkillLanguage
KeyPhraseExtractionSkill의 입력 텍스트에 지원되는 언어 코드입니다.
Name | 형식 | Description |
---|---|---|
da |
string |
덴마크어 |
de |
string |
독일어 |
en |
string |
영어 |
es |
string |
스페인어 |
fi |
string |
핀란드어 |
fr |
string |
프랑스어 |
it |
string |
이탈리아어 |
ja |
string |
일본어 |
ko |
string |
한국어 |
nl |
string |
네덜란드어 |
no |
string |
노르웨이어(복말) |
pl |
string |
폴란드어 |
pt-BR |
string |
포르투갈어(브라질) |
pt-PT |
string |
포르투갈어(포르투갈) |
ru |
string |
러시아어 |
sv |
string |
스웨덴어 |
LanguageDetectionSkill
입력 텍스트의 언어를 감지하고 요청에 제출된 모든 문서에 대해 단일 언어 코드를 보고하는 기술입니다. 언어 코드는 분석의 신뢰도를 나타내는 점수와 쌍을 이깁니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
defaultCountryHint |
string |
언어를 구분할 수 없는 경우 언어 감지 모델에 대한 힌트로 사용할 국가 코드입니다. |
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
modelVersion |
string |
Text Analytics 서비스를 호출할 때 사용할 모델의 버전입니다. 지정하지 않으면 기본적으로 사용 가능한 최신 버전으로 설정됩니다. 반드시 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다. |
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다. |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
LineEnding
OCR 기술에서 인식하는 텍스트 줄 사이에 사용할 문자 시퀀스를 정의합니다. 기본값은 "space"입니다.
Name | 형식 | Description |
---|---|---|
carriageReturn |
string |
줄은 캐리지 리턴('\r') 문자로 구분됩니다. |
carriageReturnLineFeed |
string |
줄은 캐리지 리턴과 줄 바꿈('\r\n') 문자로 구분됩니다. |
lineFeed |
string |
줄은 단일 줄 바꿈('\n') 문자로 구분됩니다. |
space |
string |
선은 단일 공백 문자로 구분됩니다. |
MergeSkill
두 개 이상의 문자열을 단일 통합 문자열로 병합하는 기술로, 선택적 사용자 정의 구분 기호가 각 구성 요소 부분을 구분합니다.
Name | 형식 | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
|
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
|
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
|
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
||
insertPostTag |
string |
태그는 병합된 텍스트의 끝을 나타냅니다. 기본적으로 태그는 빈 공간입니다. |
|
insertPreTag |
string |
태그는 병합된 텍스트의 시작을 나타냅니다. 기본적으로 태그는 빈 공간입니다. |
|
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다. |
|
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
OcrSkill
이미지 파일에서 텍스트를 추출하는 기술입니다.
Name | 형식 | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
|
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
|
defaultLanguageCode |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
||
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
|
detectOrientation |
boolean |
False |
방향 검색을 켜거나 설정하지 않음을 나타내는 값입니다. 기본값은 false입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
||
lineEnding |
OCR 기술에서 인식하는 텍스트 줄 사이에 사용할 문자 시퀀스를 정의합니다. 기본값은 "space"입니다. |
||
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다. |
|
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
OcrSkillLanguage
OcrSkill에서 입력할 수 있는 언어 코드입니다.
Name | 형식 | Description |
---|---|---|
Jns |
string |
Jaunsari(데바나기리) |
af |
string |
아프리칸스어 |
anp |
string |
앙기카어(데바나기리) |
ar |
string |
아랍어 |
ast |
string |
아스투리안 주 |
awa |
string |
Awadhi-Hindi(데바나기리) |
az |
string |
아제르바이잔어(라틴 문자) |
be |
string |
벨라루스어(키릴 자모 및 라틴 문자) |
be-cyrl |
string |
벨라루스어(키릴 자모) |
be-latn |
string |
벨라루스어(라틴 문자) |
bfy |
string |
바겔리 주 |
bfz |
string |
마하수 파하리 (데바나기리) |
bg |
string |
불가리어 |
bgc |
string |
하리얀비 주 |
bho |
string |
Bhojpuri-Hindi(데바나기리) |
bi |
string |
비슬라마 주 |
bns |
string |
Bundeli |
br |
string |
브루타뉴어 |
bra |
string |
브라이바 주 |
brx |
string |
보도(데바나기리) |
bs |
string |
보스니아어(라틴 문자) |
bua |
string |
부랴트(키릴 자모) |
ca |
string |
카탈로니아어 |
ceb |
string |
세부아노 주 |
ch |
string |
차모로 |
cnr-cyrl |
string |
몬테네그로어(키릴 자모) |
cnr-latn |
string |
몬테네그로어(라틴 문자) |
co |
string |
코르시카어 |
crh |
string |
크림 타타르어(라틴 문자) |
cs |
string |
체코어 |
csb |
string |
Kashubian |
cy |
string |
웨일스어 |
da |
string |
덴마크어 |
de |
string |
독일어 |
dhi |
string |
디말(데바나기리) |
doi |
string |
도그리어(데바나기리) |
dsb |
string |
로어 소르비안 |
el |
string |
그리스어 |
en |
string |
영어 |
es |
string |
스페인어 |
et |
string |
에스토니아어 |
eu |
string |
바스크어 |
fa |
string |
페르시아어 |
fi |
string |
핀란드어 |
fil |
string |
필리핀어 |
fj |
string |
피지어 |
fo |
string |
페로어 |
fr |
string |
프랑스어 |
fur |
string |
프룰리안 주 |
fy |
string |
서부 프리시안 |
ga |
string |
아일랜드어 |
gag |
string |
가가우즈어(라틴 문자) |
gd |
string |
스코틀랜드 게일어 |
gil |
string |
길베르테스 주 |
gl |
string |
갈리시아어 |
gon |
string |
곤디(데바나기리) |
gv |
string |
Manx |
gvr |
string |
구룽어(데바나기리) |
haw |
string |
하와이어 |
hi |
string |
힌디어 |
hlb |
string |
할비 (데바나기리) |
hne |
string |
차티스가리 (데바나기리) |
hni |
string |
하니 주 |
hoc |
string |
호 (데바나기리) |
hr |
string |
크로아티아어 |
hsb |
string |
어퍼 소르비안 |
ht |
string |
아이티어 |
hu |
string |
헝가리어 |
ia |
string |
인테르링구아 |
id |
string |
인도네시아어 |
is |
string |
아이슬란드어 |
it |
string |
이탈리아어 |
iu |
string |
이누크티투트어(라틴 문자) |
ja |
string |
일본어 |
jv |
string |
Javanese |
kaa |
string |
Kara-Kalpak(라틴 문자) |
kaa-cyrl |
string |
Kara-Kalpak(키릴 자모) |
kac |
string |
카친어(라틴 문자) |
kea |
string |
Kabuverdianu |
kfq |
string |
Korku |
kha |
string |
Khasi |
kk-cyrl |
string |
카자흐어(키릴 자모) |
kk-latn |
string |
카자흐어(라틴 문자) |
kl |
string |
그린란드어 |
klr |
string |
칼링 (주) |
kmj |
string |
말토어(데바나기리) |
ko |
string |
한국어 |
kos |
string |
Kosraean |
kpy |
string |
코리아크 주 |
krc |
string |
Karachay-Balkar |
kru |
string |
쿠루크어(데바나기리) |
ksh |
string |
리푸아리안 주 |
ku-arab |
string |
쿠르드어(아랍어) |
ku-latn |
string |
쿠르드어(라틴 문자) |
kum |
string |
Kumyk(키릴 자모) |
kw |
string |
콘월어 |
ky |
string |
키르기스어(키릴 자모) |
la |
string |
라틴어 |
lb |
string |
룩셈부르크어 |
lkt |
string |
라코타 주 |
lt |
string |
리투아니아어 |
mi |
string |
마오리어 |
mn |
string |
몽골어(키릴 자모) |
mr |
string |
마라티어 |
ms |
string |
말레이어(라틴 문자) |
mt |
string |
몰타어 |
mww |
string |
흐몽 도우(라틴 문자) |
myv |
string |
에르자(키릴 자모) |
nap |
string |
나폴리의 |
nb |
string |
노르웨이어 |
ne |
string |
네팔어 |
niu |
string |
니우에안 주 |
nl |
string |
네덜란드어 |
no |
string |
노르웨이어 |
nog |
string |
노게이 () |
oc |
string |
오크어 |
os |
string |
Ossetic |
pa |
string |
펀잡어(아랍어) |
pl |
string |
폴란드어 |
prs |
string |
다리어 |
ps |
string |
파슈토어 |
pt |
string |
포르투갈어 |
quc |
string |
K'iche' |
rab |
string |
Chamling |
rm |
string |
로만시 주 |
ro |
string |
루마니아어 |
ru |
string |
러시아어 |
sa |
string |
산스크리트어(데바나기리) |
sat |
string |
산타리 (데바나기리) |
sck |
string |
사드리 (데바나기리) |
sco |
string |
스코트어 |
sk |
string |
슬로바키아어 |
sl |
string |
슬로베니아어 |
sm |
string |
사모아어(라틴 문자) |
sma |
string |
서던 사미 |
sme |
string |
북부 사미어(라틴 문자) |
smj |
string |
룰레 사미 |
smn |
string |
사미 나리 |
sms |
string |
Skolt Sami |
so |
string |
소말리어(아랍어) |
sq |
string |
알바니아어 |
sr |
string |
세르비아어(라틴 문자) |
sr-Cyrl |
string |
세르비아어(키릴 자모) |
sr-Latn |
string |
세르비아어(라틴 문자) |
srx |
string |
시르마우리 (데바나기리) |
sv |
string |
스웨덴어 |
sw |
string |
스와힐리어(라틴 문자) |
tet |
string |
Tetum |
tg |
string |
타지크어(키릴 자모) |
thf |
string |
탄미 시 |
tk |
string |
투르크멘어(라틴 문자) |
to |
string |
통가 |
tr |
string |
터키어 |
tt |
string |
타타르어(라틴 문자) |
tyv |
string |
투반 (주) |
ug |
string |
위구르어(아랍어) |
unk |
string |
알 수 없음(모두) |
ur |
string |
우르두어 |
uz |
string |
우즈베키스탄어(라틴 문자) |
uz-arab |
string |
우즈베키스탄어(아랍어) |
uz-cyrl |
string |
우즈베크어(키릴 자모) |
vo |
string |
Volapük |
wae |
string |
Walser |
xnr |
string |
Kangri(Devanagiri) |
xsr |
string |
셰르파 (데바나기리) |
yua |
string |
유카텍 마야 |
za |
string |
주앙 시 |
zh-Hans |
string |
중국어 간체 |
zh-Hant |
string |
중국어 번체 |
zu |
string |
줄루어 |
OutputFieldMappingEntry
기술에 대한 출력 필드 매핑입니다.
Name | 형식 | Description |
---|---|---|
name |
string |
기술에서 정의한 출력의 이름입니다. |
targetName |
string |
출력의 대상 이름입니다. 선택 사항이며 기본적으로 이름을 지정합니다. |
PIIDetectionSkill
Text Analytics API를 사용하여 입력 텍스트에서 개인 정보를 추출하고 마스킹 옵션을 제공합니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
defaultLanguageCode |
string |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
domain |
string |
지정된 경우 엔터티 범주의 하위 집합만 포함하도록 PII 도메인을 설정합니다. 가능한 값은 'phi', 'none'입니다. 기본값은 'none'입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
maskingCharacter |
string |
maskingMode 매개 변수가 대체되도록 설정된 경우 텍스트를 마스킹하는 데 사용되는 문자입니다. 기본값은 '*'입니다. |
maskingMode |
입력 텍스트에서 검색된 개인 정보를 마스킹하는 다양한 방법을 제공하는 매개 변수입니다. 기본값은 'none'입니다. |
|
minimumPrecision |
number |
신뢰도 점수가 지정된 값보다 큰 엔터티만 포함하는 데 사용되는 0에서 1 사이의 값입니다. 설정하지 않거나(기본값) 명시적으로 null로 설정하면 모든 엔터티가 포함됩니다. |
modelVersion |
string |
Text Analytics 서비스를 호출할 때 사용할 모델의 버전입니다. 지정하지 않으면 기본적으로 사용 가능한 최신 버전으로 설정됩니다. 반드시 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다. |
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다. |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
|
piiCategories |
string[] |
추출하고 마스킹해야 하는 PII 엔터티 범주 목록입니다. |
PIIDetectionSkillMaskingMode
입력 텍스트에서 검색된 개인 정보를 마스킹하는 데 사용할 maskingMode를 나타내는 문자열입니다.
Name | 형식 | Description |
---|---|---|
none |
string |
마스킹이 발생하지 않으며 maskedText 출력이 반환되지 않습니다. |
replace |
string |
검색된 엔터티를 maskingCharacter 매개 변수에 지정된 문자로 바꿉니다. 이 문자는 검색된 엔터티의 길이로 반복되므로 오프셋이 입력 텍스트와 출력 maskedText 모두에 올바르게 해당합니다. |
SearchIndexerDataNoneIdentity
데이터 원본의 ID 속성을 지웁니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
ID 유형을 지정하는 URI 조각입니다. |
SearchIndexerDataUserAssignedIdentity
사용할 데이터 원본의 ID를 지정합니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
ID 유형을 지정하는 URI 조각입니다. |
userAssignedIdentity |
string |
일반적으로 검색 서비스에 할당되어야 하는 "/subscriptions/12345678-1234-1234-1234-1234567890ab/resourceGroups/rg/providers/Microsoft.ManagedIdentity/userAssignedIdentities/myId" 형식으로 사용자 할당 관리 ID의 정규화된 Azure 리소스 ID입니다. |
SearchIndexerIndexProjections
보조 검색 인덱스에 대한 추가 프로젝션 정의입니다.
Name | 형식 | Description |
---|---|---|
parameters |
인덱스 프로젝션 관련 구성 속성의 사전입니다. 각 이름은 특정 속성의 이름입니다. 각 값은 기본 형식이어야 합니다. |
|
selectors |
보조 검색 인덱스에 수행할 프로젝션 목록입니다. |
SearchIndexerIndexProjectionSelector
지정된 검색 인덱스로 저장할 데이터에 대한 설명입니다.
Name | 형식 | Description |
---|---|---|
mappings |
프로젝션에 대한 매핑 또는 대상 인덱스의 필드에 매핑해야 하는 원본입니다. |
|
parentKeyFieldName |
string |
상위 문서의 키 값을 매핑할 검색 인덱스의 필드 이름입니다. 키 필드가 아닌 필터링 가능한 문자열 필드여야 합니다. |
sourceContext |
string |
프로젝션의 원본 컨텍스트입니다. 문서가 여러 하위 문서로 분할되는 카디널리티를 나타냅니다. |
targetIndexName |
string |
프로젝트할 검색 인덱스의 이름입니다. '키워드' 분석기 집합이 있는 키 필드가 있어야 합니다. |
SearchIndexerIndexProjectionsParameters
인덱스 프로젝션 관련 구성 속성의 사전입니다. 각 이름은 특정 속성의 이름입니다. 각 값은 기본 형식이어야 합니다.
Name | 형식 | Description |
---|---|---|
projectionMode |
인덱서의 나머지 부분과 관련하여 인덱스 프로젝션의 동작을 정의합니다. |
SearchIndexerKnowledgeStore
보강된 데이터의 Azure Blob, 테이블 또는 파일에 대한 추가 프로젝션 정의입니다.
Name | 형식 | Description |
---|---|---|
projections |
인덱싱 중에 수행할 추가 프로젝션 목록입니다. |
|
storageConnectionString |
string |
스토리지 계정 프로젝션에 대한 연결 문자열이 저장됩니다. |
SearchIndexerKnowledgeStoreFileProjectionSelector
Azure Files에 저장할 데이터에 대한 프로젝션 정의입니다.
Name | 형식 | Description |
---|---|---|
generatedKeyName |
string |
프로젝션을 저장할 생성된 키의 이름입니다. |
inputs |
복잡한 프로젝션에 대한 중첩된 입력입니다. |
|
referenceKeyName |
string |
다른 프로젝션에 대한 참조 키의 이름입니다. |
source |
string |
프로젝트에 데이터를 원본으로 지정합니다. |
sourceContext |
string |
복잡한 프로젝션에 대한 원본 컨텍스트입니다. |
storageContainer |
string |
프로젝션을 저장할 Blob 컨테이너입니다. |
SearchIndexerKnowledgeStoreObjectProjectionSelector
Azure Blob에 저장할 데이터에 대한 프로젝션 정의입니다.
Name | 형식 | Description |
---|---|---|
generatedKeyName |
string |
프로젝션을 저장할 생성된 키의 이름입니다. |
inputs |
복잡한 프로젝션에 대한 중첩된 입력입니다. |
|
referenceKeyName |
string |
다른 프로젝션에 대한 참조 키의 이름입니다. |
source |
string |
프로젝트에 데이터를 원본으로 지정합니다. |
sourceContext |
string |
복잡한 프로젝션에 대한 원본 컨텍스트입니다. |
storageContainer |
string |
프로젝션을 저장할 Blob 컨테이너입니다. |
SearchIndexerKnowledgeStoreProjection
다양한 프로젝션 선택기에 대한 컨테이너 개체입니다.
Name | 형식 | Description |
---|---|---|
files |
Azure File Storage에 대한 프로젝션. |
|
objects |
Azure Blob Storage에 대한 프로젝션. |
|
tables |
Azure Table Storage에 대한 프로젝션. |
SearchIndexerKnowledgeStoreTableProjectionSelector
Azure 테이블에 저장할 데이터에 대한 설명입니다.
Name | 형식 | Description |
---|---|---|
generatedKeyName |
string |
프로젝션을 저장할 생성된 키의 이름입니다. |
inputs |
복잡한 프로젝션에 대한 중첩된 입력입니다. |
|
referenceKeyName |
string |
다른 프로젝션에 대한 참조 키의 이름입니다. |
source |
string |
프로젝트에 데이터를 원본으로 지정합니다. |
sourceContext |
string |
복잡한 프로젝션에 대한 원본 컨텍스트입니다. |
tableName |
string |
프로젝터된 데이터를 저장할 Azure 테이블의 이름입니다. |
SearchIndexerSkillset
기술 목록입니다.
Name | 형식 | Description |
---|---|---|
@odata.etag |
string |
기술 세트의 ETag입니다. |
cognitiveServices | CognitiveServicesAccount: |
기술을 실행할 때 사용할 Azure AI 서비스에 대한 세부 정보입니다. |
description |
string |
기술 세트에 대한 설명입니다. |
encryptionKey |
Azure Key Vault에서 만드는 암호화 키에 대한 설명입니다. 이 키는 Microsoft를 비롯한 누구도 기술 세트 정의를 해독할 수 없다는 완전한 보증을 원할 때 기술 세트 정의에 대한 추가 수준의 미사용 암호화를 제공하는 데 사용됩니다. 기술 세트 정의를 암호화한 후에는 항상 암호화된 상태로 유지됩니다. 검색 서비스는 이 속성을 null로 설정하려는 시도를 무시합니다. 암호화 키를 회전하려는 경우 필요에 따라 이 속성을 변경할 수 있습니다. 기술 세트 정의는 영향을 받지 않습니다. 고객 관리형 키를 사용한 암호화는 무료 검색 서비스에 사용할 수 없으며 2019년 1월 1일 이후 생성된 유료 서비스에만 사용할 수 있습니다. |
|
indexProjections |
보조 검색 인덱스에 대한 추가 프로젝션 정의입니다. |
|
knowledgeStore |
보강된 데이터의 Azure Blob, 테이블 또는 파일에 대한 추가 프로젝션 정의입니다. |
|
name |
string |
기술 세트의 이름입니다. |
skills |
SearchIndexerSkill[]:
|
기술 세트의 기술 목록입니다. |
SearchResourceEncryptionKey
Azure Key Vault의 고객 관리형 암호화 키입니다. 만들고 관리하는 키를 사용하여 인덱스 및 동의어 맵과 같은 미사용 데이터를 암호화하거나 암호 해독할 수 있습니다.
Name | 형식 | Description |
---|---|---|
accessCredentials |
Azure Key Vault에 액세스하는 데 사용되는 선택적 Azure Active Directory 자격 증명입니다. 대신 관리 ID를 사용하는 경우에는 필요하지 않습니다. |
|
keyVaultKeyName |
string |
미사용 데이터를 암호화하는 데 사용할 Azure Key Vault 키의 이름입니다. |
keyVaultKeyVersion |
string |
미사용 데이터를 암호화하는 데 사용할 Azure Key Vault 키의 버전입니다. |
keyVaultUri |
string |
미사용 데이터를 암호화하는 데 사용할 키를 포함하는 DNS 이름이라고도 하는 Azure Key Vault의 URI입니다. 예제 URI는 |
SentimentSkill
이 기술은 더 이상 사용되지 않습니다. V3를 사용합니다. 대신 SentimentSkill.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
defaultLanguageCode |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
|
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다. |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
SentimentSkillLanguage
되지 않는. SentimentSkill의 입력 텍스트에 지원되는 언어 코드입니다.
Name | 형식 | Description |
---|---|---|
da |
string |
덴마크어 |
de |
string |
독일어 |
el |
string |
그리스어 |
en |
string |
영어 |
es |
string |
스페인어 |
fi |
string |
핀란드어 |
fr |
string |
프랑스어 |
it |
string |
이탈리아어 |
nl |
string |
네덜란드어 |
no |
string |
노르웨이어(복말) |
pl |
string |
폴란드어 |
pt-PT |
string |
포르투갈어(포르투갈) |
ru |
string |
러시아어 |
sv |
string |
스웨덴어 |
tr |
string |
터키어 |
SentimentSkillV3
Text Analytics API를 사용하여 구조화되지 않은 텍스트를 평가하고 각 레코드에 대해 문장 및 문서 수준에서 서비스에서 찾은 가장 높은 신뢰도 점수를 기반으로 감정 레이블(예: "부정", "중립" 및 "긍정")을 제공합니다.
Name | 형식 | Default value | Description |
---|---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
|
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
|
defaultLanguageCode |
string |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
|
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
|
includeOpinionMining |
boolean |
False |
true로 설정하면 기술 출력에는 오피니언 마이닝에 대한 Text Analytics의 정보, 즉 대상(명사 또는 동사) 및 해당 관련 평가(형용사)가 텍스트에 포함됩니다. 기본값은 false입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
||
modelVersion |
string |
Text Analytics 서비스를 호출할 때 사용할 모델의 버전입니다. 지정하지 않으면 기본적으로 사용 가능한 최신 버전으로 설정됩니다. 반드시 필요한 경우가 아니면 이 값을 지정하지 않는 것이 좋습니다. |
|
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다. |
|
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
ShaperSkill
출력을 재구성하기 위한 기술입니다. 복합 필드(다중 파트 필드라고도 함)를 지원하는 복합 형식을 만듭니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다. |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
SplitSkill
문자열을 텍스트 청크로 분할하는 기술입니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
defaultLanguageCode |
사용할 언어 코드를 나타내는 값입니다. 기본값은 |
|
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
maximumPageLength |
integer |
원하는 최대 페이지 길이입니다. 기본값은 10000입니다. |
maximumPagesToTake |
integer |
textSplitMode가 'pages'로 설정된 경우에만 적용됩니다. 지정한 경우 SplitSkill은 각 문서에서 몇 개의 초기 페이지만 필요한 경우 성능을 향상시키기 위해 첫 번째 'maximumPagesToTake' 페이지를 처리한 후 분할을 중단합니다. |
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다. |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
|
pageOverlapLength |
integer |
textSplitMode가 'pages'로 설정된 경우에만 적용됩니다. 지정된 경우 n+1번째 청크는 n번째 청크의 끝에서 이 수의 문자/토큰으로 시작됩니다. |
textSplitMode |
수행할 분할 모드를 나타내는 값입니다. |
SplitSkillLanguage
SplitSkill의 입력 텍스트에 지원되는 언어 코드입니다.
Name | 형식 | Description |
---|---|---|
am |
string |
암하라어 |
bs |
string |
보스니아어 |
cs |
string |
체코어 |
da |
string |
덴마크어 |
de |
string |
독일어 |
en |
string |
영어 |
es |
string |
스페인어 |
et |
string |
에스토니아어 |
fi |
string |
핀란드어 |
fr |
string |
프랑스어 |
he |
string |
히브리어 |
hi |
string |
힌디어 |
hr |
string |
크로아티아어 |
hu |
string |
헝가리어 |
id |
string |
인도네시아어 |
is |
string |
아이슬란드어 |
it |
string |
이탈리아어 |
ja |
string |
일본어 |
ko |
string |
한국어 |
lv |
string |
라트비아어 |
nb |
string |
노르웨이어 |
nl |
string |
네덜란드어 |
pl |
string |
폴란드어 |
pt |
string |
포르투갈어(포르투갈) |
pt-br |
string |
포르투갈어(브라질) |
ru |
string |
러시아어 |
sk |
string |
슬로바키아어 |
sl |
string |
슬로베니아어 |
sr |
string |
세르비아어 |
sv |
string |
스웨덴어 |
tr |
string |
터키어 |
ur |
string |
우르두어 |
zh |
string |
중국어(간체) |
TextSplitMode
수행할 분할 모드를 나타내는 값입니다.
Name | 형식 | Description |
---|---|---|
pages |
string |
텍스트를 개별 페이지로 분할합니다. |
sentences |
string |
텍스트를 개별 문장으로 분할합니다. |
TextTranslationSkill
텍스트를 한 언어에서 다른 언어로 번역하는 기술입니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
defaultFromLanguageCode |
원본 언어를 명시적으로 지정하지 않는 문서의 문서를 번역할 언어 코드입니다. |
|
defaultToLanguageCode |
to 언어를 명시적으로 지정하지 않는 문서에 대해 문서를 번역할 언어 코드입니다. |
|
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다. |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
|
suggestedFrom |
fromLanguageCode 입력이나 defaultFromLanguageCode 매개 변수가 제공되지 않고 자동 언어 검색에 실패한 경우 문서를 번역할 언어 코드입니다. 기본값은 |
TextTranslationSkillLanguage
TextTranslationSkill의 입력 텍스트에 지원되는 언어 코드입니다.
Name | 형식 | Description |
---|---|---|
af |
string |
아프리칸스어 |
ar |
string |
아랍어 |
bg |
string |
불가리어 |
bn |
string |
벵골어 |
bs |
string |
보스니아어(라틴 문자) |
ca |
string |
카탈로니아어 |
cs |
string |
체코어 |
cy |
string |
웨일스어 |
da |
string |
덴마크어 |
de |
string |
독일어 |
el |
string |
그리스어 |
en |
string |
영어 |
es |
string |
스페인어 |
et |
string |
에스토니아어 |
fa |
string |
페르시아어 |
fi |
string |
핀란드어 |
fil |
string |
필리핀어 |
fj |
string |
피지어 |
fr |
string |
프랑스어 |
ga |
string |
아일랜드어 |
he |
string |
히브리어 |
hi |
string |
힌디어 |
hr |
string |
크로아티아어 |
ht |
string |
아이티어 |
hu |
string |
헝가리어 |
id |
string |
인도네시아어 |
is |
string |
아이슬란드어 |
it |
string |
이탈리아어 |
ja |
string |
일본어 |
kn |
string |
칸나다어 |
ko |
string |
한국어 |
lt |
string |
리투아니아어 |
lv |
string |
라트비아어 |
mg |
string |
마다가스카르 |
mi |
string |
마오리어 |
ml |
string |
말라얄람어 |
ms |
string |
말레이어 |
mt |
string |
몰타어 |
mww |
string |
흐몽 도우 |
nb |
string |
노르웨이어 |
nl |
string |
네덜란드어 |
otq |
string |
오토미 케레타로 |
pa |
string |
펀잡어 |
pl |
string |
폴란드어 |
pt |
string |
포르투갈어 |
pt-PT |
string |
포르투갈어(포르투갈) |
pt-br |
string |
포르투갈어(브라질) |
ro |
string |
루마니아어 |
ru |
string |
러시아어 |
sk |
string |
슬로바키아어 |
sl |
string |
슬로베니아어 |
sm |
string |
사모아 |
sr-Cyrl |
string |
세르비아어(키릴 자모) |
sr-Latn |
string |
세르비아어(라틴 문자) |
sv |
string |
스웨덴어 |
sw |
string |
키스와힐리 |
ta |
string |
타밀어 |
te |
string |
텔루구어 |
th |
string |
태국어 |
tlh |
string |
클링온 (주) |
tlh-Latn |
string |
클링온(라틴어 스크립트) |
tlh-Piqd |
string |
클링온(클링온 스크립트) |
to |
string |
통가 |
tr |
string |
터키어 |
ty |
string |
타히티어 |
uk |
string |
우크라이나어 |
ur |
string |
우르두어 |
vi |
string |
베트남어 |
yua |
string |
유카텍 마야 |
yue |
string |
광둥어(번체) |
zh-Hans |
string |
중국어 간체 |
zh-Hant |
string |
중국어 번체 |
VisualFeature
반환할 시각적 기능 유형을 나타내는 문자열입니다.
Name | 형식 | Description |
---|---|---|
adult |
string |
성인으로 인식되는 시각적 기능입니다. |
brands |
string |
상업용 브랜드로 인식되는 시각적 기능입니다. |
categories |
string |
카테고리. |
description |
string |
묘사. |
faces |
string |
사람 얼굴로 인식되는 시각적 기능입니다. |
objects |
string |
개체로 인식되는 시각적 기능입니다. |
tags |
string |
태그. |
WebApiSkill
Web API 엔드포인트를 호출할 수 있는 기술로, 사용자 지정 코드를 호출하여 기술 세트를 확장할 수 있습니다.
Name | 형식 | Description |
---|---|---|
@odata.type |
string:
#Microsoft. |
기술 유형을 지정하는 URI 조각입니다. |
authIdentity | SearchIndexerDataIdentity: |
아웃바운드 연결에 사용되는 사용자 할당 관리 ID입니다. authResourceId가 제공되고 지정되지 않은 경우 시스템 할당 관리 ID가 사용됩니다. 인덱서 업데이트 시 ID가 지정되지 않은 경우 값은 변경되지 않은 상태로 유지됩니다. "none"으로 설정하면 이 속성의 값이 지워집니다. |
authResourceId |
string |
Azure 함수 또는 변환을 제공하는 다른 애플리케이션의 외부 코드에 연결하는 사용자 지정 기술에 적용됩니다. 이 값은 함수 또는 앱이 Azure Active Directory에 등록되었을 때 만든 애플리케이션 ID여야 합니다. 지정된 경우 사용자 지정 기술은 검색 서비스의 관리 ID(시스템 또는 사용자 할당)와 함수 또는 앱의 액세스 토큰을 사용하여 함수 또는 앱에 연결합니다. 이 값을 액세스 토큰의 범위를 만들기 위한 리소스 ID로 사용합니다. |
batchSize |
integer |
문서 수를 나타내는 원하는 일괄 처리 크기입니다. |
context |
string |
문서 루트 또는 문서 콘텐츠(예: /document 또는 /document/content)와 같은 작업이 수행되는 수준을 나타냅니다. 기본값은 /document입니다. |
degreeOfParallelism |
integer |
설정된 경우 Web API에 대해 수행할 수 있는 병렬 호출 수입니다. |
description |
string |
기술의 입력, 출력 및 사용을 설명하는 기술에 대한 설명입니다. |
httpHeaders |
object |
http 요청을 만드는 데 필요한 헤더입니다. |
httpMethod |
string |
http 요청에 대한 메서드입니다. |
inputs |
기술 입력은 원본 데이터 집합의 열 또는 업스트림 기술의 출력일 수 있습니다. |
|
name |
string |
기술 세트 내에서 고유하게 식별하는 기술의 이름입니다. 이름이 정의되지 않은 기술에는 '#' 문자 앞에 접두사로 지정된 기술 배열에서 1부터 시작하는 인덱스의 기본 이름이 지정됩니다. |
outputs |
기술의 출력은 검색 인덱스의 필드이거나 다른 기술의 입력으로 사용할 수 있는 값입니다. |
|
timeout |
string |
요청에 대해 원하는 시간 제한입니다. 기본값은 30초입니다. |
uri |
string |
Web API의 URL입니다. |