Ingestion Jobs - Create
Cria um trabalho de ingestão com a ID de trabalho especificada.
PUT {endpoint}/openai/ingestion/jobs/{job-id}?api-version=2025-03-01-preview
Parâmetros URI
| Nome | Em | Necessário | Tipo | Descrição |
|---|---|---|---|---|
|
endpoint
|
path | True |
string (url) |
Pontos de extremidade de Serviços Cognitivos suportados (protocolo e nome do host, por exemplo: https://aoairesource.openai.azure.com. Substitua "aoairesource" pelo nome da sua conta do Azure OpenAI). |
|
job-id
|
path | True |
string |
O id do trabalho que será criado. |
|
api-version
|
query | True |
string |
A versão da API solicitada. |
Cabeçalho de Pedido
| Nome | Necessário | Tipo | Descrição |
|---|---|---|---|
| mgmt-user-token |
string |
O token usado para acessar o espaço de trabalho (necessário apenas para trabalhos de computação do usuário). |
|
| aml-user-token |
string |
O token usado para acessar os recursos dentro do trabalho no espaço de trabalho (necessário apenas para trabalhos de computação do usuário). |
Órgão do Pedido
O órgão do pedido pode ser um dos seguintes:
| Nome | Descrição |
|---|---|
|
Ingestion |
|
|
Ingestion |
IngestionJobSystemCompute
| Nome | Necessário | Tipo | Descrição |
|---|---|---|---|
| kind | True |
string:
System |
IngestionJobType |
| completionAction |
A ação de conclusão. |
||
| dataRefreshIntervalInHours |
integer |
||
| datasource | SystemComputeDatasource: |
SystemComputeDatasource |
|
| jobId |
string |
||
| searchServiceConnection | BaseConnection: |
BaseConnection |
IngestionJobUserCompute
| Nome | Necessário | Tipo | Descrição |
|---|---|---|---|
| kind | True |
string:
User |
IngestionJobType |
| workspaceId | True |
string |
|
| compute | JobCompute: |
JobCompute |
|
| dataRefreshIntervalInHours |
integer |
||
| datasource | UserComputeDatasource: |
UserComputeDatasource |
|
| jobId |
string |
||
| target | TargetIndex: |
TargetIndex |
Respostas
| Nome | Tipo | Descrição |
|---|---|---|
| 200 OK | IngestionJob: |
Sucesso |
| Other Status Codes |
Ocorreu um erro. |
Segurança
api-key
Autenticação de chave de API
Tipo:
apiKey
Em:
header
OAuth2Auth
Autenticação OAuth2
Tipo:
oauth2
Flow:
implicit
URL de autorização:
https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Alcances
| Nome | Descrição |
|---|---|
| https://cognitiveservices.azure.com/.default |
Exemplos
| Create a system-compute ingestion job |
| Create a user-compute ingestion job |
Create a system-compute ingestion job
Pedido de exemplo
PUT {endpoint}/openai/ingestion/jobs/ingestion-job?api-version=2025-03-01-preview
{
"kind": "SystemCompute",
"searchServiceConnection": {
"kind": "EndpointWithManagedIdentity",
"endpoint": "https://aykame-dev-search.search.windows.net"
},
"datasource": {
"kind": "Storage",
"connection": {
"kind": "EndpointWithManagedIdentity",
"endpoint": "https://mystorage.blob.core.windows.net/",
"resourceId": "/subscriptions/1234567-abcd-1234-5678-1234abcd/resourceGroups/my-resource/providers/Microsoft.Storage/storageAccounts/mystorage"
},
"containerName": "container",
"chunking": {
"maxChunkSizeInTokens": 2048
},
"embeddings": [
{
"connection": {
"kind": "RelativeConnection"
},
"deploymentName": "Ada"
}
]
},
"dataRefreshIntervalInHours": 24,
"completionAction": "keepAllAssets"
}
Resposta de exemplo
operation-location: https://aoairesource.openai.azure.com/openai/ingestion/jobs/ingestion-job/runs/72a2792ef7d24ba7b82c7fe4a37e379f?api-version=2025-03-01-preview
{
"kind": "SystemCompute",
"jobId": "ingestion-job",
"searchServiceConnection": {
"kind": "EndpointWithManagedIdentity",
"endpoint": "https://aykame-dev-search.search.windows.net"
},
"datasource": {
"kind": "Storage",
"connection": {
"kind": "EndpointWithManagedIdentity",
"endpoint": "https://mystorage.blob.core.windows.net/",
"resourceId": "/subscriptions/1234567-abcd-1234-5678-1234abcd/resourceGroups/my-resource/providers/Microsoft.Storage/storageAccounts/mystorage"
},
"containerName": "container",
"chunking": {
"maxChunkSizeInTokens": 2048
},
"embeddings": [
{
"connection": {
"kind": "RelativeConnection"
},
"deploymentName": "Ada"
}
]
},
"dataRefreshIntervalInHours": 24,
"completionAction": "keepAllAssets"
}
Create a user-compute ingestion job
Pedido de exemplo
PUT {endpoint}/openai/ingestion/jobs/ingestion-job?api-version=2025-03-01-preview
{
"kind": "UserCompute",
"workspaceId": "/subscriptions/f375b912-331c-4fc5-8e9f-2d7205e3e036/resourceGroups/adrama-copilot-demo/providers/Microsoft.MachineLearningServices/workspaces/adrama-rag-dev",
"compute": {
"kind": "ServerlessCompute"
},
"target": {
"kind": "AzureAISearch",
"connectionId": "/subscriptions/f375b912-331c-4fc5-8e9f-2d7205e3e036/resourceGroups/adrama-copilot-demo/providers/Microsoft.MachineLearningServices/workspaces/adrama-rag-dev/connections/search-connection"
},
"datasource": {
"kind": "Dataset",
"datasetId": "azureml://locations/centraluseuap/workspaces/83317fe6-efa6-4e4a-b020-d0edd11ec382/data/PlainText/versions/1",
"datasetType": "uri_folder"
}
}
Resposta de exemplo
operation-location: https://aoairesource.openai.azure.com/openai/ingestion/jobs/ingestion-job/runs/72a2792ef7d24ba7b82c7fe4a37e379f?api-version=2025-03-01-preview
{
"kind": "UserCompute",
"jobId": "ingestion-job",
"workspaceId": "/subscriptions/f375b912-331c-4fc5-8e9f-2d7205e3e036/resourceGroups/adrama-copilot-demo/providers/Microsoft.MachineLearningServices/workspaces/adrama-rag-dev",
"compute": {
"kind": "ServerlessCompute"
},
"target": {
"kind": "AzureAISearch",
"connectionId": "/subscriptions/f375b912-331c-4fc5-8e9f-2d7205e3e036/resourceGroups/adrama-copilot-demo/providers/Microsoft.MachineLearningServices/workspaces/adrama-rag-dev/connections/search-connection"
},
"datasource": {
"kind": "Dataset",
"datasetId": "azureml://locations/centraluseuap/workspaces/83317fe6-efa6-4e4a-b020-d0edd11ec382/data/PlainText/versions/1",
"datasetType": "uri_folder"
}
}
Definições
| Nome | Descrição |
|---|---|
|
Azure |
Azure AI Search Index. |
|
Chunking |
ChunkingSettings |
|
Compute |
O tipo de computação. |
|
Connection |
Conexão de cadeia de conexão. |
|
Connection |
O tipo de conexão. |
|
Cosmos |
Índice CosmosDB. |
|
Crawling |
CrawlingSettings |
|
Custom |
Computação personalizada. |
|
Deployment |
Conexão de implantação relativa. |
|
Endpoint |
Conexão de chave de ponto de extremidade. |
|
Endpoint |
Conexão de identidade gerenciada de ponto de extremidade. |
| Error |
Erro |
|
Error |
Código de Erro |
|
Error |
Resposta de Erro |
|
Generic |
ConnectionEmbeddingSettings |
|
Ingestion |
A ação de conclusão. |
|
Ingestion |
|
|
Ingestion |
IngestionJobType |
|
Ingestion |
|
|
Inner |
InnerError |
|
Inner |
InnerErrorCode |
|
Pinecone |
Índice de pinha. |
|
Serverless |
Computação sem servidor. |
|
System |
O tipo de fonte de dados. |
|
System |
SystemComputeStorage |
|
System |
SystemComputeUrl |
|
Target |
O tipo de destino. |
|
User |
UserComputeStorage |
|
User |
O tipo de fonte de dados. |
|
User |
UserComputeUrl |
|
Workspace |
Conexão do espaço de trabalho AML. |
|
Workspace |
WorkspaceConnectionEmbeddingSettings |
AzureAISearchIndex
Azure AI Search Index.
| Nome | Tipo | Descrição |
|---|---|---|
| connectionId |
string |
A id da conexão apontando para o Índice de Pesquisa do Azure AI. |
| kind |
string:
Azure |
O tipo de destino. |
ChunkingSettings
ChunkingSettings
| Nome | Tipo | Descrição |
|---|---|---|
| maxChunkSizeInTokens |
integer |
ComputeType
O tipo de computação.
| Valor | Descrição |
|---|---|
| ServerlessCompute |
Computação de usuário sem servidor. |
| CustomCompute |
Computação personalizada do usuário. |
ConnectionStringConnection
Conexão de cadeia de conexão.
| Nome | Tipo | Descrição |
|---|---|---|
| connectionString |
string |
Cadeia de ligação |
| kind |
string:
Connection |
O tipo de conexão. |
ConnectionType
O tipo de conexão.
| Valor | Descrição |
|---|---|
| EndpointWithKey |
Ponto final e conexão de chave. |
| ConnectionString |
Cadeia de conexão. |
| EndpointWithManagedIdentity |
Ponto de extremidade e identidade gerenciada. |
| WorkspaceConnection |
Conexão do espaço de trabalho AML. |
| RelativeConnection |
Implantação relativa |
CosmosDBIndex
Índice CosmosDB.
| Nome | Tipo | Descrição |
|---|---|---|
| collectionName |
string |
O nome da coleção cosmos DB. |
| connectionId |
string |
O id da conexão apontando para o cosmos DB. |
| databaseName |
string |
O nome do banco de dados do cosmos DB. |
| kind |
string:
CosmosDB |
O tipo de destino. |
CrawlingSettings
CrawlingSettings
| Nome | Tipo | Descrição |
|---|---|---|
| maxCrawlDepth |
integer |
|
| maxCrawlTimeInMins |
integer |
|
| maxDownloadTimeInMins |
integer |
|
| maxFileSize |
integer |
|
| maxFiles |
integer |
|
| maxRedirects |
integer |
CustomCompute
Computação personalizada.
| Nome | Tipo | Descrição |
|---|---|---|
| computeId |
string |
Id do cálculo personalizado |
| kind | string: |
O tipo de computação. |
DeploymentConnection
Conexão de implantação relativa.
| Nome | Tipo | Descrição |
|---|---|---|
| kind |
string:
Relative |
O tipo de conexão. |
EndpointKeyConnection
Conexão de chave de ponto de extremidade.
| Nome | Tipo | Descrição |
|---|---|---|
| endpoint |
string |
Ponto final |
| key |
string |
Chave |
| kind |
string:
Endpoint |
O tipo de conexão. |
EndpointMIConnection
Conexão de identidade gerenciada de ponto de extremidade.
| Nome | Tipo | Descrição |
|---|---|---|
| endpoint |
string |
Ponto final |
| kind |
string:
Endpoint |
O tipo de conexão. |
| resourceId |
string |
ID do recurso |
Error
Erro
| Nome | Tipo | Descrição |
|---|---|---|
| code |
Código de Erro |
|
| details |
Error[] |
Os detalhes do erro, se disponíveis. |
| innererror |
InnerError |
|
| message |
string minLength: 1 |
A mensagem deste erro. |
| target |
string |
O local onde o erro aconteceu, se disponível. |
ErrorCode
Código de Erro
| Valor | Descrição |
|---|---|
| conflict |
A operação solicitada entra em conflito com o estado atual do recurso. |
| invalidPayload |
Os dados da solicitação são inválidos para esta operação. |
| forbidden |
A operação é proibida para a chave de usuário/api atual. |
| notFound |
O recurso não foi encontrado. |
| unexpectedEntityState |
A operação não pode ser executada no estado do recurso atual. |
| itemDoesAlreadyExist |
O item já existe. |
| serviceUnavailable |
O serviço não está disponível no momento. |
| internalFailure |
Erro interno. Tente novamente. |
| quotaExceeded |
Quota excedida. |
| jsonlValidationFailed |
Falha na validação dos dados jsonl. |
| fileImportFailed |
Falha na importação do arquivo. |
| tooManyRequests |
Demasiados pedidos. Tente novamente mais tarde |
| unauthorized |
A chave de usuário/api atual não está autorizada para a operação. |
| contentFilter |
A geração de imagens falhou como resultado do nosso sistema de segurança. |
ErrorResponse
Resposta de Erro
| Nome | Tipo | Descrição |
|---|---|---|
| error |
Erro |
GenericEmbeddingSettings
ConnectionEmbeddingSettings
| Nome | Tipo | Descrição |
|---|---|---|
| connection | BaseConnection: |
BaseConnection |
| deploymentName |
string |
|
| modelName |
string |
IngestionJobCompletionAction
A ação de conclusão.
| Valor | Descrição |
|---|---|
| cleanUpTempAssets |
Limpará ativos intermediários criados durante o processo de ingestão. |
| keepAllAssets |
Não limpará nenhum dos ativos intermediários criados durante o processo de ingestão. |
IngestionJobSystemCompute
| Nome | Tipo | Descrição |
|---|---|---|
| completionAction |
A ação de conclusão. |
|
| dataRefreshIntervalInHours |
integer |
|
| datasource | SystemComputeDatasource: |
SystemComputeDatasource |
| jobId |
string |
|
| kind |
string:
System |
IngestionJobType |
| searchServiceConnection | BaseConnection: |
BaseConnection |
IngestionJobType
IngestionJobType
| Valor | Descrição |
|---|---|
| SystemCompute |
Trabalhos executados em recursos de propriedade do serviço. |
| UserCompute |
Trabalhos executados no espaço de trabalho de propriedade do usuário. |
IngestionJobUserCompute
| Nome | Tipo | Descrição |
|---|---|---|
| compute | JobCompute: |
JobCompute |
| dataRefreshIntervalInHours |
integer |
|
| datasource | UserComputeDatasource: |
UserComputeDatasource |
| jobId |
string |
|
| kind |
string:
User |
IngestionJobType |
| target | TargetIndex: |
TargetIndex |
| workspaceId |
string |
InnerError
InnerError
| Nome | Tipo | Descrição |
|---|---|---|
| code |
InnerErrorCode |
|
| innererror |
InnerError |
InnerErrorCode
InnerErrorCode
| Valor | Descrição |
|---|---|
| invalidPayload |
Os dados da solicitação são inválidos para esta operação. |
PineconeIndex
Índice de pinha.
| Nome | Tipo | Descrição |
|---|---|---|
| connectionId |
string |
O id da conexão apontando para a pinha. |
| kind |
string:
Pinecone |
O tipo de destino. |
ServerlessCompute
Computação sem servidor.
| Nome | Tipo | Descrição |
|---|---|---|
| instanceCount |
integer |
A contagem de instâncias para executar o trabalho. |
| kind | string: |
O tipo de computação. |
| sku |
string |
Nível de SKU |
SystemComputeDatasourceType
O tipo de fonte de dados.
| Valor | Descrição |
|---|---|
| Storage |
Conta de Armazenamento do Azure. |
| Urls |
URLs. |
SystemComputeStorage
SystemComputeStorage
| Nome | Tipo | Descrição |
|---|---|---|
| chunking |
ChunkingSettings |
|
| connection | BaseConnection: |
BaseConnection |
| containerName |
string |
nome do contêiner |
| embeddings |
ConnectionEmbeddingSettings |
|
| kind |
string:
Storage |
O tipo de fonte de dados. |
SystemComputeUrl
SystemComputeUrl
| Nome | Tipo | Descrição |
|---|---|---|
| chunking |
ChunkingSettings |
|
| connection | BaseConnection: |
BaseConnection |
| containerName |
string |
nome do contêiner |
| crawling |
CrawlingSettings |
|
| embeddings |
ConnectionEmbeddingSettings |
|
| kind |
string:
Urls |
O tipo de fonte de dados. |
| urls |
string[] |
TargetType
O tipo de destino.
| Valor | Descrição |
|---|---|
| AzureAISearch |
Azure AI Search Index. |
| CosmosDB |
Índice CosmosDB. |
| Pinecone |
Índice de pinha. |
UserComputeDataset
UserComputeStorage
| Nome | Tipo | Descrição |
|---|---|---|
| chunking |
ChunkingSettings |
|
| datasetId |
string |
|
| datasetType |
string |
|
| embeddings |
WorkspaceConnectionEmbeddingSettings |
|
| kind |
string:
Dataset |
O tipo de fonte de dados. |
UserComputeDatasourceType
O tipo de fonte de dados.
| Valor | Descrição |
|---|---|
| Dataset |
Conjunto de dados do espaço de trabalho. |
| Urls |
URLs. |
UserComputeUrl
UserComputeUrl
| Nome | Tipo | Descrição |
|---|---|---|
| chunking |
ChunkingSettings |
|
| crawling |
CrawlingSettings |
|
| embeddings |
WorkspaceConnectionEmbeddingSettings |
|
| kind |
string:
Urls |
O tipo de fonte de dados. |
| urls |
string[] |
WorkspaceConnection
Conexão do espaço de trabalho AML.
| Nome | Tipo | Descrição |
|---|---|---|
| connectionId |
string |
ConnectionId |
| kind | string: |
O tipo de conexão. |
WorkspaceConnectionEmbeddingSettings
WorkspaceConnectionEmbeddingSettings
| Nome | Tipo | Descrição |
|---|---|---|
| connectionId |
string |
|
| deploymentName |
string |
|
| modelName |
string |