Delen via


Fine Tunes - Create

Hiermee maakt u een taak waarmee een opgegeven model wordt afgestemd op basis van een bepaald trainingsbestand. Het antwoord bevat details van de ge-enqueued-taak, waaronder de taakstatus en hyperparameters. De naam van het nauwkeurig afgestemde model wordt toegevoegd aan het antwoord zodra dit is voltooid.

POST {endpoint}/openai/fine-tunes?api-version=2023-05-15

URI-parameters

Name In Vereist Type Description
endpoint
path True

string

url

Ondersteunde Cognitive Services-eindpunten (protocol- en hostnaam, bijvoorbeeld: https://aoairesource.openai.azure.com. Vervang 'aoairesource' door de naam van uw Azure OpenAI-account).

api-version
query True

string

De aangevraagde API-versie.

Aanvraagkoptekst

Name Vereist Type Description
api-key True

string

Geef hier uw Azure OpenAI-accountsleutel voor Cognitive Services op.

Aanvraagbody

Name Vereist Type Description
model True

string

De id (model-id) van het basismodel dat voor deze fine-tune wordt gebruikt.

training_file True

string

De bestandsidentiteit (bestands-id) die wordt gebruikt voor het trainen van dit verfijnde model.

batch_size

integer

De batchgrootte die moet worden gebruikt voor training. De batchgrootte is het aantal trainingsvoorbeelden dat wordt gebruikt voor het trainen van één voorwaartse en achterwaartse pass. Over het algemeen hebben we vastgesteld dat grotere batchgrootten meestal beter werken voor grotere gegevenssets. De standaardwaarde en de maximumwaarde voor deze eigenschap zijn specifiek voor een basismodel.

classification_betas

number[]

De bètawaarden voor classificatie. Als dit is opgegeven, berekenen we F-bèta-scores op de opgegeven bètawaarden. De F-beta-score is een generalisatie van de F-1-score. Dit wordt alleen gebruikt voor binaire classificatie. Met een bèta van 1 (de F-1-score) krijgen precisie en relevante overeenkomsten hetzelfde gewicht. Een grotere bètascore geeft meer gewicht aan relevante overeenkomsten en minder aan precisie. Een kleinere bètascore legt meer gewicht op precisie en minder op relevante overeenkomsten.

classification_n_classes

integer

Het aantal klassen in een classificatietaak. Deze parameter is vereist voor classificatie met meerdere klassen.

classification_positive_class

string

De positieve klasse in binaire classificatie. Deze parameter is nodig voor het genereren van precisie-, relevante en F1-metrische gegevens bij het uitvoeren van binaire classificatie.

compute_classification_metrics

boolean

Een waarde die aangeeft of metrische classificatiegegevens moeten worden berekend. Indien ingesteld, berekenen we classificatiespecifieke metrische gegevens, zoals nauwkeurigheid en F-1-score, met behulp van de validatieset aan het einde van elk tijdvak. Deze metrische gegevens kunnen worden weergegeven in het resultatenbestand. Als u metrische classificatiegegevens wilt berekenen, moet u een validation_file opgeven. Daarnaast moet u classification_n_classes opgeven voor classificatie met meerdere klassen of classification_positive_class voor binaire classificatie.

learning_rate_multiplier

number

De vermenigvuldiger van leersnelheid die moet worden gebruikt voor training. De afstemmingsfrequentie is de oorspronkelijke leersnelheid die is gebruikt voor de pre-training, vermenigvuldigd met deze waarde. Grotere leersnelheden presteren meestal beter met grotere batchgrootten. We raden u aan te experimenteren met waarden in het bereik van 0,02 tot 0,2 om te zien wat de beste resultaten oplevert.

n_epochs

integer

Het aantal tijdvakken waarvoor het model moet worden getraind. Een tijdvak verwijst naar één volledige cyclus door de trainingsgegevensset.

prompt_loss_weight

number

Het gewicht dat moet worden gebruikt voor verlies op de prompttokens. Dit bepaalt hoeveel het model probeert te leren om de prompt te genereren (vergeleken met de voltooiing die altijd een gewicht van 1,0 heeft) en kan een stabiliserend effect toevoegen aan de training wanneer de voltooiing kort is. Als prompts extreem lang zijn (ten opzichte van voltooiingen), kan het zinvol zijn om dit gewicht te verminderen om te voorkomen dat de prompt te veel prioriteit geeft.

suffix

string

Het achtervoegsel dat wordt gebruikt om het verfijnde model te identificeren. Het achtervoegsel kan maximaal 40 tekens bevatten (a-z, A-Z, 0-9,- en _) die worden toegevoegd aan de naam van uw nauwkeurig afgestemde model.

validation_file

string

De bestandsidentiteit (bestands-id) die wordt gebruikt om het verfijnde model tijdens de training te evalueren.

Antwoorden

Name Type Description
201 Created

FineTune

De fine tune is gemaakt.

Kopteksten

Location: string

Other Status Codes

ErrorResponse

Er is een fout opgetreden.

Beveiliging

api-key

Geef hier uw Azure OpenAI-accountsleutel voor Cognitive Services op.

Type: apiKey
In: header

Voorbeelden

Creating a fine tune job for classification.
Creating a fine tune job.

Creating a fine tune job for classification.

Voorbeeldaanvraag

POST https://aoairesource.openai.azure.com/openai/fine-tunes?api-version=2023-05-15


{
  "compute_classification_metrics": true,
  "classification_n_classes": 4,
  "model": "curie",
  "training_file": "file-181a1cbdcdcf4677ada87f63a0928099"
}

Voorbeeldrespons

location: https://aoairesource.openai.azure.com/openai/fine-tunes/ft-72a2792ef7d24ba7b82c7fe4a37e379f
{
  "hyperparams": {
    "compute_classification_metrics": true,
    "classification_n_classes": 4,
    "batch_size": 32,
    "learning_rate_multiplier": 1,
    "n_epochs": 2,
    "prompt_loss_weight": 0.1
  },
  "model": "curie",
  "training_files": [
    {
      "statistics": {
        "tokens": 42,
        "examples": 23
      },
      "bytes": 140,
      "purpose": "fine-tune",
      "filename": "puppy.jsonl",
      "id": "file-181a1cbdcdcf4677ada87f63a0928099",
      "status": "succeeded",
      "created_at": 1646126127,
      "updated_at": 1646127311,
      "object": "file"
    }
  ],
  "id": "ft-72a2792ef7d24ba7b82c7fe4a37e379f",
  "status": "notRunning",
  "created_at": 1646126127,
  "updated_at": 1646127311,
  "object": "fine-tune"
}

Creating a fine tune job.

Voorbeeldaanvraag

POST https://aoairesource.openai.azure.com/openai/fine-tunes?api-version=2023-05-15


{
  "model": "curie",
  "training_file": "file-181a1cbdcdcf4677ada87f63a0928099"
}

Voorbeeldrespons

location: https://aoairesource.openai.azure.com/openai/fine-tunes/ft-72a2792ef7d24ba7b82c7fe4a37e379f
{
  "hyperparams": {
    "batch_size": 32,
    "learning_rate_multiplier": 1,
    "n_epochs": 2,
    "prompt_loss_weight": 0.1
  },
  "model": "curie",
  "training_files": [
    {
      "statistics": {
        "tokens": 42,
        "examples": 23
      },
      "bytes": 140,
      "purpose": "fine-tune",
      "filename": "puppy.jsonl",
      "id": "file-181a1cbdcdcf4677ada87f63a0928099",
      "status": "succeeded",
      "created_at": 1646126127,
      "updated_at": 1646127311,
      "object": "file"
    }
  ],
  "id": "ft-72a2792ef7d24ba7b82c7fe4a37e379f",
  "status": "notRunning",
  "created_at": 1646126127,
  "updated_at": 1646127311,
  "object": "fine-tune"
}

Definities

Name Description
Error

Fout

ErrorCode

ErrorCode

ErrorResponse

Foutresponse

Event

Gebeurtenis

File

File

FileStatistics

FileStatistics

FineTune

FineTune

FineTuneCreation

FineTuneCreation

HyperParameters

HyperParameters

InnerError

InnerError

InnerErrorCode

InnerErrorCode

LogLevel

Logniveau

Purpose

Doel

State

Staat

TypeDiscriminator

TypeDiscriminator

Error

Fout

Name Type Description
code

ErrorCode

ErrorCode
Foutcodes zoals gedefinieerd in de Microsoft REST-richtlijnen (https://github.com/microsoft/api-guidelines/blob/vNext/Guidelines.md#7102-error-condition-responses).

details

Error[]

De foutdetails, indien beschikbaar.

innererror

InnerError

InnerError
Interne fout zoals gedefinieerd in de Microsoft REST-richtlijnen (https://github.com/microsoft/api-guidelines/blob/vNext/Guidelines.md#7102-error-condition-responses).

message

string

Het bericht van deze fout.

target

string

De locatie waar de fout is opgetreden, indien beschikbaar.

ErrorCode

ErrorCode

Name Type Description
conflict

string

De aangevraagde bewerking conflicteert met de huidige resourcestatus.

fileImportFailed

string

Het importeren van het bestand is mislukt.

forbidden

string

De bewerking is verboden voor de huidige gebruiker/API-sleutel.

internalFailure

string

Interne fout. Probeer het opnieuw.

invalidPayload

string

De aanvraaggegevens zijn ongeldig voor deze bewerking.

itemDoesAlreadyExist

string

Het item bestaat al.

jsonlValidationFailed

string

Validatie van jsonl-gegevens is mislukt.

notFound

string

De resource is niet gevonden.

quotaExceeded

string

Het quotum is overschreden.

serviceUnavailable

string

De service is momenteel niet beschikbaar.

unexpectedEntityState

string

De bewerking kan niet worden uitgevoerd in de status van de huidige resource.

ErrorResponse

Foutresponse

Name Type Description
error

Error

Fout
Foutinhoud zoals gedefinieerd in de Microsoft REST-richtlijnen (https://github.com/microsoft/api-guidelines/blob/vNext/Guidelines.md#7102-error-condition-responses).

Event

Gebeurtenis

Name Type Description
created_at

integer

Een tijdstempel toen deze gebeurtenis werd gemaakt (in unix-epochs).

level

LogLevel

Logniveau
Het uitgebreidheidsniveau van een gebeurtenis.

message

string

Het bericht waarin de gebeurtenis wordt beschreven. Dit kan een statuswijziging zijn, bijvoorbeeld enqueued, gestart, mislukt of voltooid, of andere gebeurtenissen, zoals geüploade resultaten.

object

TypeDiscriminator

TypeDiscriminator
Definieert het type van een object.

File

File

Name Type Description
bytes

integer

De grootte van dit bestand indien beschikbaar (kan null zijn). Bestandsgrootten groter dan 2^53-1 worden niet ondersteund om compatibiliteit met javascript-gehele getallen te garanderen.

created_at

integer

Een tijdstempel wanneer deze taak of dit item is gemaakt (in unix-epochs).

error

Error

Fout
Foutinhoud zoals gedefinieerd in de Microsoft REST-richtlijnen (https://github.com/microsoft/api-guidelines/blob/vNext/Guidelines.md#7102-error-condition-responses).

filename

string

De naam van het bestand.

id

string

De identiteit van dit item.

object

TypeDiscriminator

TypeDiscriminator
Hiermee definieert u het type van een object.

purpose

Purpose

Doel
Het beoogde doel van de geüploade documenten. Gebruik 'afstemmen' om af te stemmen. Hiermee kunnen we de indeling van het geüploade bestand valideren.

statistics

FileStatistics

FileStatistics
Een bestand is een document dat kan worden gebruikt voor training en validatie. Het kan ook een door een service gegenereerd document met resultaatdetails zijn.

status

State

Staat
De status van een taak of item.

updated_at

integer

Een tijdstempel wanneer deze taak of dit item voor het laatst is gewijzigd (in unix-epochs).

FileStatistics

FileStatistics

Name Type Description
examples

integer

Het aantal ingesloten trainingsvoorbeelden in bestanden van het type 'fine-tune' zodra de validatie van bestandsinhoud is voltooid.

tokens

integer

Het aantal tokens dat wordt gebruikt in prompts en voltooiingen voor bestanden van het type 'fine-tune' zodra de validatie van de bestandsinhoud is voltooid.

FineTune

FineTune

Name Type Description
created_at

integer

Een tijdstempel wanneer deze taak of dit item is gemaakt (in unix-epochs).

error

Error

Fout
Foutinhoud zoals gedefinieerd in de Microsoft REST-richtlijnen (https://github.com/microsoft/api-guidelines/blob/vNext/Guidelines.md#7102-error-condition-responses).

events

Event[]

De gebeurtenissen die de voortgang van de uitvoering laten zien, waaronder in de wachtrij geplaatst, uitgevoerd en voltooid.

fine_tuned_model

string

De id (model-id) van het resulterende, nauwkeurig afgestemde model. Deze eigenschap wordt alleen ingevuld voor voltooide uitvoeringen. Gebruik deze id om een implementatie voor deductie te maken.

hyperparams

HyperParameters

HyperParameters
De hyperparameterinstellingen die worden gebruikt in een taak voor het nauwkeurig afstemmen.

id

string

De identiteit van dit item.

model

string

De id (model-id) van het basismodel dat wordt gebruikt voor de fine-tune.

object

TypeDiscriminator

TypeDiscriminator
Hiermee definieert u het type van een object.

organisation_id

string

De organisatie-id van deze fine tune job. Ongebruikt op Azure OpenAI; compatibiliteit alleen voor OpenAI.

result_files

File[]

De resultaatbestandsidentiteiten (bestands-id) met metrische trainings- en evaluatiegegevens in CSV-indeling. Het bestand is alleen beschikbaar voor voltooide uitvoeringen van het nauwkeurig afstemmen.

status

State

Staat
De status van een taak of item.

suffix

string

Het achtervoegsel dat wordt gebruikt om het verfijnde model te identificeren.

training_files

File[]

De bestandsidentiteiten (bestands-id) die worden gebruikt voor het trainen van het nauwkeurig afgestemde model.

updated_at

integer

Een tijdstempel wanneer deze taak of dit item voor het laatst is gewijzigd (in unix-epochs).

user_id

string

De gebruikers-id van deze taak voor het afstemmen. Ongebruikt op Azure OpenAI; compatibiliteit alleen voor OpenAI.

validation_files

File[]

De bestandsidentiteiten (bestands-id) die worden gebruikt om het nauwkeurig afgestemde model tijdens de training te evalueren.

FineTuneCreation

FineTuneCreation

Name Type Description
batch_size

integer

De batchgrootte die moet worden gebruikt voor training. De batchgrootte is het aantal trainingsvoorbeelden dat wordt gebruikt voor het trainen van één voorwaartse en achterwaartse pass. Over het algemeen hebben we vastgesteld dat grotere batchgrootten meestal beter werken voor grotere gegevenssets. De standaardwaarde en de maximumwaarde voor deze eigenschap zijn specifiek voor een basismodel.

classification_betas

number[]

De bètawaarden van de classificatie. Als dit is opgegeven, berekenen we F-bèta-scores op de opgegeven bètawaarden. De F-beta-score is een generalisatie van de F-1-score. Dit wordt alleen gebruikt voor binaire classificatie. Met een bèta van 1 (de F-1-score) krijgen precisie en relevante overeenkomsten hetzelfde gewicht. Een grotere bètascore geeft meer gewicht aan relevante overeenkomsten en minder aan precisie. Een kleinere bètascore geeft meer gewicht aan precisie en minder aan terughalen.

classification_n_classes

integer

Het aantal klassen in een classificatietaak. Deze parameter is vereist voor classificatie met meerdere klassen.

classification_positive_class

string

De positieve klasse in binaire classificatie. Deze parameter is nodig om metrische gegevens voor precisie, relevante overeenkomsten en F1 te genereren bij het uitvoeren van binaire classificatie.

compute_classification_metrics

boolean

Een waarde die aangeeft of de metrische classificatiegegevens moeten worden berekend. Indien ingesteld, berekenen we classificatiespecifieke metrische gegevens, zoals nauwkeurigheid en F-1-score, met behulp van de validatieset aan het einde van elk tijdvak. Deze metrische gegevens kunnen worden weergegeven in het resultatenbestand. Als u metrische classificatiegegevens wilt berekenen, moet u een validation_file opgeven. Daarnaast moet u classification_n_classes opgeven voor classificatie met meerdere klassen of classification_positive_class voor binaire classificatie.

learning_rate_multiplier

number

De vermenigvuldiger voor leersnelheid die moet worden gebruikt voor training. De fijnafstemming van het leerpercentage is de oorspronkelijke leersnelheid die voor de training wordt gebruikt, vermenigvuldigd met deze waarde. Grotere leersnelheden presteren meestal beter met grotere batchgrootten. U wordt aangeraden te experimenteren met waarden in het bereik van 0,02 tot 0,2 om te zien wat de beste resultaten oplevert.

model

string

De id (model-id) van het basismodel dat voor deze verfijning wordt gebruikt.

n_epochs

integer

Het aantal tijdvakken waarvoor het model moet worden getraind. Een tijdvak verwijst naar één volledige cyclus door de trainingsgegevensset.

prompt_loss_weight

number

Het gewicht dat moet worden gebruikt voor verlies op de prompttokens. Dit bepaalt hoeveel het model probeert te leren om de prompt te genereren (in vergelijking met de voltooiing die altijd een gewicht van 1,0 heeft), en kan een stabiliserend effect toevoegen aan de training wanneer de voltooiingen kort zijn. Als prompts extreem lang zijn (ten opzichte van voltooiingen), kan het zinvol zijn om dit gewicht te verminderen om te voorkomen dat de prompt te veel prioriteit geeft.

suffix

string

Het achtervoegsel dat wordt gebruikt om het verfijnde model te identificeren. Het achtervoegsel mag maximaal 40 tekens (a-z, A-Z, 0-9, - en _) bevatten die worden toegevoegd aan de naam van uw nauwkeurig afgestemde model.

training_file

string

De bestandsidentiteit (bestands-id) die wordt gebruikt voor het trainen van dit nauwkeurig afgestemde model.

validation_file

string

De bestandsidentiteit (bestands-id) die wordt gebruikt om het nauwkeurig afgestemde model tijdens de training te evalueren.

HyperParameters

HyperParameters

Name Type Description
batch_size

integer

De batchgrootte die moet worden gebruikt voor training. De batchgrootte is het aantal trainingsvoorbeelden dat wordt gebruikt voor het trainen van één voorwaartse en achterwaartse pass. Over het algemeen hebben we vastgesteld dat grotere batchgrootten meestal beter werken voor grotere gegevenssets. De standaardwaarde en de maximumwaarde voor deze eigenschap zijn specifiek voor een basismodel.

classification_betas

number[]

De bètawaarden voor classificatie. Als dit is opgegeven, berekenen we F-bèta-scores op de opgegeven bètawaarden. De F-beta-score is een generalisatie van de F-1-score. Dit wordt alleen gebruikt voor binaire classificatie. Met een bèta van 1 (de F-1-score) krijgen precisie en relevante overeenkomsten hetzelfde gewicht. Een grotere bètascore geeft meer gewicht aan relevante overeenkomsten en minder aan precisie. Een kleinere bètascore legt meer gewicht op precisie en minder op relevante overeenkomsten.

classification_n_classes

integer

Het aantal klassen in een classificatietaak. Deze parameter is vereist voor classificatie met meerdere klassen.

classification_positive_class

string

De positieve klasse in binaire classificatie. Deze parameter is nodig voor het genereren van precisie-, relevante en F1-metrische gegevens bij het uitvoeren van binaire classificatie.

compute_classification_metrics

boolean

Een waarde die aangeeft of metrische classificatiegegevens moeten worden berekend. Indien ingesteld, berekenen we classificatiespecifieke metrische gegevens, zoals nauwkeurigheid en F-1-score, met behulp van de validatieset aan het einde van elk tijdvak. Deze metrische gegevens kunnen worden weergegeven in het resultatenbestand. Als u metrische classificatiegegevens wilt berekenen, moet u een validation_file opgeven. Daarnaast moet u classification_n_classes opgeven voor classificatie met meerdere klassen of classification_positive_class voor binaire classificatie.

learning_rate_multiplier

number

De vermenigvuldiger van leersnelheid die moet worden gebruikt voor training. De afstemmingsfrequentie is de oorspronkelijke leersnelheid die is gebruikt voor de pre-training, vermenigvuldigd met deze waarde. Grotere leersnelheden presteren meestal beter met grotere batchgrootten. We raden u aan te experimenteren met waarden in het bereik van 0,02 tot 0,2 om te zien wat de beste resultaten oplevert.

n_epochs

integer

Het aantal tijdvakken waarvoor het model moet worden getraind. Een tijdvak verwijst naar één volledige cyclus door de trainingsgegevensset.

prompt_loss_weight

number

Het gewicht dat moet worden gebruikt voor verlies op de prompttokens. Dit bepaalt hoeveel het model probeert te leren om de prompt te genereren (vergeleken met de voltooiing die altijd een gewicht van 1,0 heeft) en kan een stabiliserend effect toevoegen aan de training wanneer de voltooiing kort is. Als prompts extreem lang zijn (ten opzichte van voltooiingen), kan het zinvol zijn om dit gewicht te verminderen om te voorkomen dat de prompt te veel prioriteit geeft.

InnerError

InnerError

Name Type Description
code

InnerErrorCode

InnerErrorCode
Interne foutcodes zoals gedefinieerd in de Microsoft REST-richtlijnen (https://github.com/microsoft/api-guidelines/blob/vNext/Guidelines.md#7102-error-condition-responses).

innererror

InnerError

InnerError
Interne fout zoals gedefinieerd in de Microsoft REST-richtlijnen (https://github.com/microsoft/api-guidelines/blob/vNext/Guidelines.md#7102-error-condition-responses).

InnerErrorCode

InnerErrorCode

Name Type Description
invalidPayload

string

De aanvraaggegevens zijn ongeldig voor deze bewerking.

LogLevel

Logniveau

Name Type Description
error

string

Dit bericht vertegenwoordigt een probleem dat niet kan worden hersteld.

info

string

Deze gebeurtenis is alleen ter informatie.

warning

string

Deze gebeurtenis vertegenwoordigt een verholpen probleem.

Purpose

Doel

Name Type Description
fine-tune

string

Dit bestand bevat trainingsgegevens voor een taak voor het afstemmen.

fine-tune-results

string

Dit bestand bevat de resultaten van een taak voor het afstemmen.

State

Staat

Name Type Description
canceled

string

De bewerking is geannuleerd en is onvolledig.

deleted

string

De entiteit is verwijderd, maar er kan nog steeds naar worden verwezen door andere entiteiten die dateren van vóór de verwijdering.

failed

string

De bewerking is voltooid met een fout en kan niet verder worden gebruikt.

notRunning

string

De bewerking is gemaakt en staat niet in de wachtrij om in de toekomst te worden verwerkt.

running

string

De bewerking is begonnen met verwerken.

succeeded

string

De bewerking is verwerkt en is klaar voor gebruik.

TypeDiscriminator

TypeDiscriminator

Name Type Description
file

string

Dit object vertegenwoordigt een bestand.

fine-tune

string

Dit object vertegenwoordigt een taak voor het nauwkeurig afstemmen.

fine-tune-event

string

Dit object vertegenwoordigt een gebeurtenis van een taak voor het nauwkeurig afstemmen.

list

string

Dit object vertegenwoordigt een lijst met andere objecten.

model

string

Dit object vertegenwoordigt een model (kan een basismodel zijn of taakresultaat nauwkeurig afstemmen).