Ingestion Jobs - Create
Crea un trabajo de ingesta con el identificador de trabajo especificado.
PUT {endpoint}/openai/ingestion/jobs/{job-id}?api-version=2024-05-01-preview
Parámetros de identificador URI
Nombre | En | Requerido | Tipo | Description |
---|---|---|---|---|
endpoint
|
path | True |
string url |
Puntos de conexión de Cognitive Services admitidos (protocolo y nombre de host, por ejemplo: https://aoairesource.openai.azure.com. Reemplace "aoairesource" por el nombre de la cuenta de Azure OpenAI). |
job-id
|
path | True |
string |
Identificador del trabajo que se creará. |
api-version
|
query | True |
string |
La versión de API solicitada. |
Encabezado de la solicitud
Nombre | Requerido | Tipo | Description |
---|---|---|---|
api-key | True |
string |
Proporcione aquí la clave de cuenta de Azure OpenAI de Cognitive Services. |
mgmt-user-token |
string |
Token que se usa para acceder al área de trabajo (solo es necesario para trabajos de proceso de usuario). |
|
aml-user-token |
string |
Token que se usa para acceder a los recursos del trabajo en el área de trabajo (solo es necesario para los trabajos de proceso de usuario). |
Cuerpo de la solicitud
El cuerpo de la solicitud puede ser uno de los siguientes:
Nombre | Description |
---|---|
Ingestion |
|
Ingestion |
IngestionJobSystemCompute
Nombre | Requerido | Tipo | Description |
---|---|---|---|
kind | True |
string:
system |
IngestionJobType |
completionAction |
Acción de finalización. |
||
dataRefreshIntervalInHours |
integer |
||
datasource | SystemComputeDatasource: |
SystemComputeDatasource |
|
jobId |
string |
||
searchServiceConnection | BaseConnection: |
BaseConnection |
IngestionJobUserCompute
Nombre | Requerido | Tipo | Description |
---|---|---|---|
kind | True |
string:
user |
IngestionJobType |
workspaceId | True |
string |
|
compute | JobCompute: |
JobCompute |
|
dataRefreshIntervalInHours |
integer |
||
datasource | UserComputeDatasource: |
UserComputeDatasource |
|
jobId |
string |
||
target | TargetIndex: |
TargetIndex |
Respuestas
Nombre | Tipo | Description |
---|---|---|
200 OK | IngestionJob: |
Correcto |
Other Status Codes |
Se produjo un error. |
Seguridad
api-key
Proporcione aquí la clave de cuenta de Azure OpenAI de Cognitive Services.
Tipo:
apiKey
En:
header
Ejemplos
Create a system-compute ingestion job |
Create a user-compute ingestion job |
Create a system-compute ingestion job
Solicitud de ejemplo
PUT {endpoint}/openai/ingestion/jobs/{job-id}?api-version=2024-05-01-preview
{
"kind": "SystemCompute",
"searchServiceConnection": {
"kind": "EndpointWithManagedIdentity",
"endpoint": "https://aykame-dev-search.search.windows.net"
},
"datasource": {
"kind": "Storage",
"storageAccountConnection": {
"kind": "EndpointWithManagedIdentity",
"endpoint": "https://mystorage.blob.core.windows.net/",
"resourceId": "ResourceId=/subscriptions/1234567-abcd-1234-5678-1234abcd/resourceGroups/my-resource/providers/Microsoft.Storage/storageAccounts/mystorage"
},
"containerName": "container",
"chunkingSettings": {
"maxChunkSizeInTokens": 2048
},
"embeddingsSettings": [
{
"embeddingResourceConnection": {
"kind": "RelativeConnection"
},
"modelProvider": "AOAI",
"deploymentName": "Ada"
}
]
},
"dataRefreshIntervalInHours": 24,
"completionAction": 0
}
Respuesta de muestra
operation-location: https://aoairesource.openai.azure.com/openai/ingestion/jobs/ingestion-job/runs/72a2792ef7d24ba7b82c7fe4a37e379f?api-version=2024-05-01-preview
{
"kind": "SystemCompute",
"jobId": "ingestion-job",
"searchServiceConnection": {
"kind": "EndpointWithManagedIdentity",
"endpoint": "https://aykame-dev-search.search.windows.net"
},
"datasource": {
"kind": "Storage",
"storageAccountConnection": {
"kind": "EndpointWithManagedIdentity",
"endpoint": "https://mystorage.blob.core.windows.net/",
"resourceId": "ResourceId=/subscriptions/1234567-abcd-1234-5678-1234abcd/resourceGroups/my-resource/providers/Microsoft.Storage/storageAccounts/mystorage"
},
"containerName": "container",
"chunkingSettings": {
"maxChunkSizeInTokens": 2048
},
"embeddingsSettings": [
{
"embeddingResourceConnection": {
"kind": "RelativeConnection"
},
"modelProvider": "AOAI",
"deploymentName": "Ada"
}
]
},
"dataRefreshIntervalInHours": 24,
"completionAction": 0
}
Create a user-compute ingestion job
Solicitud de ejemplo
PUT {endpoint}/openai/ingestion/jobs/{job-id}?api-version=2024-05-01-preview
{
"kind": "UserCompute",
"workspaceId": "/subscriptions/f375b912-331c-4fc5-8e9f-2d7205e3e036/resourceGroups/adrama-copilot-demo/providers/Microsoft.MachineLearningServices/workspaces/adrama-rag-dev",
"compute": {
"kind": "ServerlessCompute"
},
"target": {
"kind": "AzureAISearch",
"connectionId": "/subscriptions/f375b912-331c-4fc5-8e9f-2d7205e3e036/resourceGroups/adrama-copilot-demo/providers/Microsoft.MachineLearningServices/workspaces/adrama-rag-dev/connections/search-connection"
},
"datasource": {
"kind": "Dataset",
"datasetId": "azureml://locations/centraluseuap/workspaces/83317fe6-efa6-4e4a-b020-d0edd11ec382/data/PlainText/versions/1",
"datasetType": "uri_folder"
}
}
Respuesta de muestra
operation-location: https://aoairesource.openai.azure.com/openai/ingestion/jobs/ingestion-job/runs/72a2792ef7d24ba7b82c7fe4a37e379f?api-version=2024-05-01-preview
{
"kind": "UserCompute",
"jobId": "ingestion-job",
"workspaceId": "/subscriptions/f375b912-331c-4fc5-8e9f-2d7205e3e036/resourceGroups/adrama-copilot-demo/providers/Microsoft.MachineLearningServices/workspaces/adrama-rag-dev",
"compute": {
"kind": "ServerlessCompute"
},
"target": {
"kind": "AzureAISearch",
"connectionId": "/subscriptions/f375b912-331c-4fc5-8e9f-2d7205e3e036/resourceGroups/adrama-copilot-demo/providers/Microsoft.MachineLearningServices/workspaces/adrama-rag-dev/connections/search-connection"
},
"datasource": {
"kind": "Dataset",
"datasetId": "azureml://locations/centraluseuap/workspaces/83317fe6-efa6-4e4a-b020-d0edd11ec382/data/PlainText/versions/1",
"datasetType": "uri_folder"
}
}
Definiciones
Nombre | Description |
---|---|
ACSIndex |
Índice de ACS. |
Base |
BaseConnection |
Chunking |
ChunkingSettings |
Compute |
Tipo de proceso. |
Connection |
Conexión de cadena de conexión. |
Connection |
Tipo de conexión. |
Cosmos |
Índice de CosmosDB. |
Crawling |
CrawlingSettings |
Custom |
Proceso personalizado. |
Datasource |
Tipo de origen de datos. |
Deployment |
Conexión de implementación relativa. |
Endpoint |
Conexión de clave de punto de conexión. |
Endpoint |
Conexión de identidad administrada del punto de conexión. |
Error |
Error |
Error |
ErrorCode |
Error |
ErrorResponse |
Generic |
ConnectionEmbeddingSettings |
Ingestion |
Acción de finalización. |
Ingestion |
|
Ingestion |
IngestionJobType |
Ingestion |
|
Inner |
InnerError |
Inner |
InnerErrorCode |
Pinecone |
Índice pinecone. |
Serverless |
Proceso sin servidor. |
System |
SystemComputeDatasource |
System |
SystemComputeStorage |
System |
SystemComputeUrl |
Target |
Tipo de destino. |
User |
UserComputeStorage |
User |
UserComputeUrl |
Workspace |
Conexión del área de trabajo de AML. |
Workspace |
WorkspaceConnectionEmbeddingSettings |
ACSIndex
Índice de ACS.
Nombre | Tipo | Description |
---|---|---|
connectionId |
string |
Identificador de la conexión que apunta al índice de ACS. |
kind |
string:
acs |
Tipo de destino. |
BaseConnection
BaseConnection
Nombre | Tipo | Description |
---|---|---|
kind |
Tipo de conexión. |
ChunkingSettings
ChunkingSettings
Nombre | Tipo | Description |
---|---|---|
maxChunkSizeInTokens |
integer |
ComputeType
Tipo de proceso.
Nombre | Tipo | Description |
---|---|---|
custom |
string |
Proceso de usuario personalizado. |
serverless |
string |
Proceso de usuario sin servidor. |
ConnectionStringConnection
Conexión de cadena de conexión.
Nombre | Tipo | Description |
---|---|---|
connectionString |
string |
Cadena de conexión |
kind |
Tipo de conexión. |
ConnectionType
Tipo de conexión.
Nombre | Tipo | Description |
---|---|---|
connectionString |
string |
Cadena de conexión |
endpointKey |
string |
Punto de conexión y conexión de clave. |
endpointMI |
string |
Punto de conexión e identidad administrada. |
workspace |
string |
Conexión del área de trabajo de AML. |
CosmosDBIndex
Índice de CosmosDB.
Nombre | Tipo | Description |
---|---|---|
collectionName |
string |
Nombre de la colección de cosmos DB. |
connectionId |
string |
Identificador de la conexión que apunta a cosmos DB. |
databaseName |
string |
Nombre de la base de datos de Cosmos DB. |
kind |
string:
cosmosdb |
Tipo de destino. |
CrawlingSettings
CrawlingSettings
Nombre | Tipo | Description |
---|---|---|
maxCrawlDepth |
integer |
|
maxCrawlTimeInMins |
integer |
|
maxDownloadTimeInMins |
integer |
|
maxFileSize |
integer |
|
maxFiles |
integer |
|
maxRedirects |
integer |
CustomCompute
Proceso personalizado.
Nombre | Tipo | Description |
---|---|---|
computeId |
string |
Identificador del proceso personalizado |
kind |
string:
custom |
Tipo de proceso. |
DatasourceType
Tipo de origen de datos.
Nombre | Tipo | Description |
---|---|---|
storage |
string |
Cuenta de Azure Storage. |
urls |
string |
Direcciones URL. |
DeploymentConnection
Conexión de implementación relativa.
Nombre | Tipo | Description |
---|---|---|
kind |
Tipo de conexión. |
EndpointKeyConnection
Conexión de clave de punto de conexión.
Nombre | Tipo | Description |
---|---|---|
endpoint |
string |
Punto de conexión |
key |
string |
Clave |
kind |
Tipo de conexión. |
EndpointMIConnection
Conexión de identidad administrada del punto de conexión.
Nombre | Tipo | Description |
---|---|---|
endpoint |
string |
Punto de conexión |
kind |
Tipo de conexión. |
Error
Error
Nombre | Tipo | Description |
---|---|---|
code |
ErrorCode |
|
details |
Error[] |
Detalles del error si está disponible. |
innererror |
InnerError |
|
message |
string |
Mensaje de este error. |
target |
string |
Ubicación donde se produjo el error si está disponible. |
ErrorCode
ErrorCode
Nombre | Tipo | Description |
---|---|---|
conflict |
string |
La operación solicitada entra en conflicto con el estado de recurso actual. |
contentFilter |
string |
Se produjo un error en la generación de imágenes como resultado de nuestro sistema de seguridad. |
fileImportFailed |
string |
Error en la importación del archivo. |
forbidden |
string |
La operación está prohibida para la clave de usuario o API actual. |
internalFailure |
string |
Error interno. Inténtelo de nuevo. |
invalidPayload |
string |
Los datos de solicitud no son válidos para esta operación. |
itemDoesAlreadyExist |
string |
El elemento ya existe. |
jsonlValidationFailed |
string |
Error en la validación de datos jsonl. |
notFound |
string |
No se encuentra el recurso. |
quotaExceeded |
string |
Cuota superada. |
serviceUnavailable |
string |
El servicio no está disponible actualmente. |
tooManyRequests |
string |
Demasiadas solicitudes. Inténtelo de nuevo más tarde. |
unauthorized |
string |
La clave de usuario o API actual no está autorizada para la operación. |
unexpectedEntityState |
string |
La operación no se puede ejecutar en el estado del recurso actual. |
ErrorResponse
ErrorResponse
Nombre | Tipo | Description |
---|---|---|
error |
Error |
GenericEmbeddingSettings
ConnectionEmbeddingSettings
Nombre | Tipo | Description |
---|---|---|
connection | BaseConnection: |
BaseConnection |
deploymentName |
string |
|
modelName |
string |
IngestionJobCompletionAction
Acción de finalización.
Nombre | Tipo | Description |
---|---|---|
cleanUpAssets |
string |
Limpiará los recursos intermedios creados durante el proceso de ingesta. |
keepAllAssets |
string |
No limpiará ninguno de los recursos intermedios creados durante el proceso de ingesta. |
IngestionJobSystemCompute
Nombre | Tipo | Description |
---|---|---|
completionAction |
Acción de finalización. |
|
dataRefreshIntervalInHours |
integer |
|
datasource | SystemComputeDatasource: |
SystemComputeDatasource |
jobId |
string |
|
kind |
string:
system |
IngestionJobType |
searchServiceConnection | BaseConnection: |
BaseConnection |
IngestionJobType
IngestionJobType
Nombre | Tipo | Description |
---|---|---|
system |
string |
Trabajos que se ejecutan en recursos propiedad del servicio. |
user |
string |
Trabajos que se ejecutan en el área de trabajo propiedad del usuario. |
IngestionJobUserCompute
Nombre | Tipo | Description |
---|---|---|
compute | JobCompute: |
JobCompute |
dataRefreshIntervalInHours |
integer |
|
datasource | UserComputeDatasource: |
UserComputeDatasource |
jobId |
string |
|
kind |
string:
user |
IngestionJobType |
target | TargetIndex: |
TargetIndex |
workspaceId |
string |
InnerError
InnerError
Nombre | Tipo | Description |
---|---|---|
code |
InnerErrorCode |
|
innererror |
InnerError |
InnerErrorCode
InnerErrorCode
Nombre | Tipo | Description |
---|---|---|
invalidPayload |
string |
Los datos de solicitud no son válidos para esta operación. |
PineconeIndex
Índice pinecone.
Nombre | Tipo | Description |
---|---|---|
connectionId |
string |
Identificador de la conexión que apunta al pinecono. |
kind |
string:
pinecone |
Tipo de destino. |
ServerlessCompute
Proceso sin servidor.
Nombre | Tipo | Description |
---|---|---|
instanceCount |
integer |
Recuento de instancias en las que se va a ejecutar el trabajo. |
kind |
string:
serverless |
Tipo de proceso. |
sku |
string |
Nivel de SKU |
SystemComputeDatasource
SystemComputeDatasource
Nombre | Tipo | Description |
---|---|---|
kind |
Tipo de origen de datos. |
SystemComputeStorage
SystemComputeStorage
Nombre | Tipo | Description |
---|---|---|
chunking |
ChunkingSettings |
|
connection | BaseConnection: |
BaseConnection |
containerName |
string |
container name |
embeddings |
ConnectionEmbeddingSettings |
|
kind |
Tipo de origen de datos. |
SystemComputeUrl
SystemComputeUrl
Nombre | Tipo | Description |
---|---|---|
chunking |
ChunkingSettings |
|
connection | BaseConnection: |
BaseConnection |
containerName |
string |
container name |
crawling |
CrawlingSettings |
|
embeddings |
ConnectionEmbeddingSettings |
|
kind |
Tipo de origen de datos. |
|
urls |
string[] |
TargetType
Tipo de destino.
Nombre | Tipo | Description |
---|---|---|
acs |
string |
Índice de Azure AI Search. |
cosmosdb |
string |
Índice de CosmosDB. |
pinecone |
string |
Índice pinecone. |
UserComputeDataset
UserComputeStorage
Nombre | Tipo | Description |
---|---|---|
chunking |
ChunkingSettings |
|
datasetId |
string |
|
datasetType |
string |
|
embeddings |
WorkspaceConnectionEmbeddingSettings |
|
kind |
string:
dataset |
Tipo de origen de datos. |
UserComputeUrl
UserComputeUrl
Nombre | Tipo | Description |
---|---|---|
chunking |
ChunkingSettings |
|
crawling |
CrawlingSettings |
|
embeddings |
WorkspaceConnectionEmbeddingSettings |
|
kind |
string:
urls |
Tipo de origen de datos. |
urls |
string[] |
WorkspaceConnection
Conexión del área de trabajo de AML.
Nombre | Tipo | Description |
---|---|---|
connectionId |
string |
ConnectionId |
kind |
Tipo de conexión. |
WorkspaceConnectionEmbeddingSettings
WorkspaceConnectionEmbeddingSettings
Nombre | Tipo | Description |
---|---|---|
connectionId |
string |
|
deploymentName |
string |
|
modelName |
string |