Fine Tunes - Create
Vytvoří úlohu, která jemně naladí zadaný model z daného trénovacího souboru. Odpověď obsahuje podrobnosti o výčtové úloze, včetně stavu úlohy a parametrů hyper. Po dokončení se do odpovědi přidá název jemně vyladěného modelu.
POST {endpoint}/openai/fine-tunes?api-version=2023-05-15
Parametry identifikátoru URI
| Name | V | Vyžadováno | Typ | Description |
|---|---|---|---|---|
|
endpoint
|
path | True |
string (url) |
Podporované koncové body služeb Cognitive Services (protokol a název hostitele, například: https://aoairesource.openai.azure.com. Nahraďte "aoairesource" názvem účtu Azure OpenAI). |
|
api-version
|
query | True |
string |
Požadovaná verze rozhraní API. |
Hlavička požadavku
| Name | Vyžadováno | Typ | Description |
|---|---|---|---|
| api-key | True |
string |
Tady zadejte svůj klíč účtu Azure OpenAI služeb Cognitive Services. |
Text požadavku
| Name | Vyžadováno | Typ | Description |
|---|---|---|---|
| model | True |
string minLength: 1 |
Identifikátor (ID modelu) základního modelu, který se používá pro tuto vyladění. |
| training_file | True |
string minLength: 1 |
Identita souboru (ID souboru), která se používá k trénování tohoto jemně vyladěného modelu. |
| batch_size |
integer (int32) |
Velikost dávky, která se má použít pro trénování. Velikost dávky je počet trénovacích příkladů, které se používají k trénování jednoho dopředu a dozadu. Obecně jsme zjistili, že větší velikosti dávek obvykle fungují lépe u větších datových sad. Výchozí hodnota a maximální hodnota této vlastnosti jsou specifické pro základní model. |
|
| classification_betas |
number[] (double) |
Hodnoty beta klasifikace. Pokud je k dispozici, vypočítáme skóre F-beta na zadaných beta hodnotách. Skóre F-beta je generalizace skóre F-1. Používá se jenom pro binární klasifikaci. Při beta verzi 1 (tj. skóre F-1) se přesnost a úplnost přidají stejné hmotnosti. Větší beta skóre dává větší váhu na úplnost a méně přesnosti. Menší beta skóre dává větší váhu přesnosti a méně při úplnosti. |
|
| classification_n_classes |
integer (int32) |
Počet tříd v úkolu klasifikace. Tento parametr je vyžadován pro klasifikaci s více třídami. |
|
| classification_positive_class |
string |
Kladná třída v binární klasifikaci. Tento parametr je potřeba ke generování metrik přesnosti, úplnosti a F1 při binární klasifikaci. |
|
| compute_classification_metrics |
boolean |
Hodnota označující, jestli se mají metriky klasifikace výpočetních prostředků provádět. V případě nastavení vypočítáme metriky specifické pro klasifikaci, jako je přesnost a skóre F-1, pomocí ověřovací sady na konci každé epochy. Tyto metriky je možné zobrazit v souboru výsledků. Abyste mohli vypočítat metriky klasifikace, musíte zadat validation_file. Kromě toho je nutné zadat classification_n_classes pro vícetřídní klasifikaci nebo classification_positive_class pro binární klasifikaci. |
|
| learning_rate_multiplier |
number (double) |
Násobitel rychlosti učení, který se má použít pro trénování. Míra doladění je původní míra učení používaná pro předtrénování vynásobenou touto hodnotou. Větší rychlost učení obvykle funguje lépe s většími velikostmi dávek. Doporučujeme experimentovat s hodnotami v rozsahu 0,02 až 0,2, abyste zjistili, co vede k dosažení nejlepších výsledků. |
|
| n_epochs |
integer (int32) |
Počet epoch pro trénování modelu. Epocha odkazuje na jeden celý cyklus prostřednictvím trénovací datové sady. |
|
| prompt_loss_weight |
number (double) |
Váha, která se má použít ke ztrátě v tokenech výzvy. To určuje, kolik se model snaží naučit se generovat výzvu (ve srovnání s dokončením, které má vždy váhu 1,0) a může přidat stabilizační efekt trénování, když jsou dokončení krátké. Pokud jsou výzvy extrémně dlouhé (vzhledem k dokončení), může být vhodné tuto váhu snížit, aby se zabránilo nadměrné prioritě učení výzvy. |
|
| suffix |
string |
Přípona použitá k identifikaci jemně vyladěného modelu. Přípona může obsahovat až 40 znaků (a-z, A-Z, 0-9 a _), které se přidají do vašeho jemně vyladěného názvu modelu. |
|
| validation_file |
string |
Identita souboru (ID souboru), která se používá k vyhodnocení jemně vyladěného modelu během trénování. |
Odpovědi
| Name | Typ | Description |
|---|---|---|
| 201 Created |
Vyladění bylo úspěšně vytvořeno. Hlavičky Location: string |
|
| Other Status Codes |
Došlo k chybě. |
Zabezpečení
api-key
Tady zadejte svůj klíč účtu Azure OpenAI služeb Cognitive Services.
Typ:
apiKey
V:
header
Příklady
| Creating a fine tune job for classification. |
| Creating a fine tune job. |
Creating a fine tune job for classification.
Ukázkový požadavek
POST https://aoairesource.openai.azure.com/openai/fine-tunes?api-version=2023-05-15
{
"compute_classification_metrics": true,
"classification_n_classes": 4,
"model": "curie",
"training_file": "file-181a1cbdcdcf4677ada87f63a0928099"
}
Ukázková odpověď
location: https://aoairesource.openai.azure.com/openai/fine-tunes/ft-72a2792ef7d24ba7b82c7fe4a37e379f
{
"hyperparams": {
"compute_classification_metrics": true,
"classification_n_classes": 4,
"batch_size": 32,
"learning_rate_multiplier": 1,
"n_epochs": 2,
"prompt_loss_weight": 0.1
},
"model": "curie",
"training_files": [
{
"statistics": {
"tokens": 42,
"examples": 23
},
"bytes": 140,
"purpose": "fine-tune",
"filename": "puppy.jsonl",
"id": "file-181a1cbdcdcf4677ada87f63a0928099",
"status": "succeeded",
"created_at": 1646126127,
"updated_at": 1646127311,
"object": "file"
}
],
"id": "ft-72a2792ef7d24ba7b82c7fe4a37e379f",
"status": "notRunning",
"created_at": 1646126127,
"updated_at": 1646127311,
"object": "fine-tune"
}
Creating a fine tune job.
Ukázkový požadavek
POST https://aoairesource.openai.azure.com/openai/fine-tunes?api-version=2023-05-15
{
"model": "curie",
"training_file": "file-181a1cbdcdcf4677ada87f63a0928099"
}
Ukázková odpověď
location: https://aoairesource.openai.azure.com/openai/fine-tunes/ft-72a2792ef7d24ba7b82c7fe4a37e379f
{
"hyperparams": {
"batch_size": 32,
"learning_rate_multiplier": 1,
"n_epochs": 2,
"prompt_loss_weight": 0.1
},
"model": "curie",
"training_files": [
{
"statistics": {
"tokens": 42,
"examples": 23
},
"bytes": 140,
"purpose": "fine-tune",
"filename": "puppy.jsonl",
"id": "file-181a1cbdcdcf4677ada87f63a0928099",
"status": "succeeded",
"created_at": 1646126127,
"updated_at": 1646127311,
"object": "file"
}
],
"id": "ft-72a2792ef7d24ba7b82c7fe4a37e379f",
"status": "notRunning",
"created_at": 1646126127,
"updated_at": 1646127311,
"object": "fine-tune"
}
Definice
| Name | Description |
|---|---|
| Error |
Chyba |
|
Error |
Kód chyby |
|
Error |
ErrorResponse |
| Event |
Událost |
| File |
Soubor |
|
File |
FileStatistics |
|
Fine |
FineTune |
|
Fine |
FineTuneCreation |
|
Hyper |
HyperParametry |
|
Inner |
Vnitřní chyba |
|
Inner |
InnerErrorCode |
|
Log |
LogLevel |
| Purpose |
Účel |
| State |
Stát |
|
Type |
Type Nábídka |
Error
Chyba
| Name | Typ | Description |
|---|---|---|
| code |
Kód chyby |
|
| details |
Error[] |
Podrobnosti o chybě, pokud jsou k dispozici. |
| innererror |
Vnitřní chyba |
|
| message |
string minLength: 1 |
Zpráva o této chybě. |
| target |
string |
Umístění, kde k chybě došlo, pokud je k dispozici. |
ErrorCode
Kód chyby
| Hodnota | Description |
|---|---|
| conflict |
Požadovaná operace je v konfliktu s aktuálním stavem prostředku. |
| invalidPayload |
Data požadavku jsou pro tuto operaci neplatná. |
| forbidden |
Operace je zakázaná pro aktuální klíč uživatele nebo rozhraní API. |
| notFound |
Prostředek nebyl nalezen. |
| unexpectedEntityState |
Operaci nelze spustit ve stavu aktuálního prostředku. |
| itemDoesAlreadyExist |
Položka již existuje. |
| serviceUnavailable |
Služba není aktuálně dostupná. |
| internalFailure |
Vnitřní chyba. Zkuste to prosím znovu. |
| quotaExceeded |
Kvóta byla překročena. |
| jsonlValidationFailed |
Ověření dat jsonl se nezdařilo. |
| fileImportFailed |
Import souboru se nezdařil. |
ErrorResponse
ErrorResponse
| Name | Typ | Description |
|---|---|---|
| error |
Chyba |
Event
Událost
| Name | Typ | Description |
|---|---|---|
| created_at |
integer (unixtime) |
Časové razítko, kdy byla tato událost vytvořena (v unixových epochách). |
| level |
LogLevel |
|
| message |
string minLength: 1 |
Zpráva popisující událost. Může se jednat o změnu stavu, například zařazení do fronty, spuštění, selhání nebo dokončení nebo jiné události, jako jsou nahrané výsledky. |
| object |
Type Nábídka |
File
Soubor
| Name | Typ | Description |
|---|---|---|
| bytes |
integer (int64) |
Velikost tohoto souboru, pokud je k dispozici (může mít hodnotu null). Soubory větší než 2^53-1 nejsou podporovány, aby byla zajištěna kompatibilita s celými čísly Jazyka JavaScript. |
| created_at |
integer (unixtime) |
Časové razítko při vytvoření této úlohy nebo položky (v epochách unixu) |
| error |
Chyba |
|
| filename |
string minLength: 1 |
Název souboru. |
| id |
string |
Identita této položky. |
| object |
Type Nábídka |
|
| purpose |
Účel |
|
| statistics |
FileStatistics |
|
| status |
Stát |
|
| updated_at |
integer (unixtime) |
Časové razítko, kdy byla tato úloha nebo položka změněna naposledy (v unixových epochách). |
FileStatistics
FileStatistics
| Name | Typ | Description |
|---|---|---|
| examples |
integer (int32) |
Počet trénovacích příkladů v souborech typu "doladění" po dokončení ověření obsahu souboru. |
| tokens |
integer (int32) |
Počet tokenů použitých v dotazech a dokončování pro soubory typu "doladění" po dokončení ověření obsahu souboru. |
FineTune
FineTune
| Name | Typ | Description |
|---|---|---|
| created_at |
integer (unixtime) |
Časové razítko při vytvoření této úlohy nebo položky (v epochách unixu) |
| error |
Chyba |
|
| events |
Event[] |
Události, které ukazují průběh ladění spuštění, včetně zařazení do fronty, spuštění a dokončení. |
| fine_tuned_model |
string |
Identifikátor (ID modelu) výsledného jemně vyladěného modelu. Tato vlastnost se vyplní pouze pro úspěšně dokončená spuštění vyladění. Tento identifikátor použijte k vytvoření nasazení pro odvozování. |
| hyperparams |
HyperParametry |
|
| id |
string |
Identita této položky. |
| model |
string minLength: 1 |
Identifikátor (ID modelu) základního modelu, který se používá pro vyladění. |
| object |
Type Nábídka |
|
| organisation_id |
string |
ID organizace této vyladěné práce. Nepoužívá se v Azure OpenAI; pouze pro OpenAI. |
| result_files |
File[] |
Identity výsledného souboru (id souboru) obsahující trénovací a vyhodnocovací metriky ve formátu CSV. Soubor je k dispozici pouze pro úspěšně dokončená spuštění dolaďování. |
| status |
Stát |
|
| suffix |
string |
Přípona použitá k identifikaci jemně vyladěného modelu. |
| training_files |
File[] |
Identity souborů (id souboru), které se používají k trénování jemně vyladěného modelu. |
| updated_at |
integer (unixtime) |
Časové razítko, kdy byla tato úloha nebo položka změněna naposledy (v unixových epochách). |
| user_id |
string |
ID uživatele této úlohy vyladění Nepoužívá se v Azure OpenAI; pouze pro OpenAI. |
| validation_files |
File[] |
Identity souborů (id souboru), které se používají k vyhodnocení jemně vyladěného modelu během trénování. |
FineTuneCreation
FineTuneCreation
| Name | Typ | Description |
|---|---|---|
| batch_size |
integer (int32) |
Velikost dávky, která se má použít pro trénování. Velikost dávky je počet trénovacích příkladů, které se používají k trénování jednoho dopředu a dozadu. Obecně jsme zjistili, že větší velikosti dávek obvykle fungují lépe u větších datových sad. Výchozí hodnota a maximální hodnota této vlastnosti jsou specifické pro základní model. |
| classification_betas |
number[] (double) |
Hodnoty beta klasifikace. Pokud je k dispozici, vypočítáme skóre F-beta na zadaných beta hodnotách. Skóre F-beta je generalizace skóre F-1. Používá se jenom pro binární klasifikaci. Při beta verzi 1 (tj. skóre F-1) se přesnost a úplnost přidají stejné hmotnosti. Větší beta skóre dává větší váhu na úplnost a méně přesnosti. Menší beta skóre dává větší váhu přesnosti a méně při úplnosti. |
| classification_n_classes |
integer (int32) |
Počet tříd v úkolu klasifikace. Tento parametr je vyžadován pro klasifikaci s více třídami. |
| classification_positive_class |
string |
Kladná třída v binární klasifikaci. Tento parametr je potřeba ke generování metrik přesnosti, úplnosti a F1 při binární klasifikaci. |
| compute_classification_metrics |
boolean |
Hodnota označující, jestli se mají metriky klasifikace výpočetních prostředků provádět. V případě nastavení vypočítáme metriky specifické pro klasifikaci, jako je přesnost a skóre F-1, pomocí ověřovací sady na konci každé epochy. Tyto metriky je možné zobrazit v souboru výsledků. Abyste mohli vypočítat metriky klasifikace, musíte zadat validation_file. Kromě toho je nutné zadat classification_n_classes pro vícetřídní klasifikaci nebo classification_positive_class pro binární klasifikaci. |
| learning_rate_multiplier |
number (double) |
Násobitel rychlosti učení, který se má použít pro trénování. Míra doladění je původní míra učení používaná pro předtrénování vynásobenou touto hodnotou. Větší rychlost učení obvykle funguje lépe s většími velikostmi dávek. Doporučujeme experimentovat s hodnotami v rozsahu 0,02 až 0,2, abyste zjistili, co vede k dosažení nejlepších výsledků. |
| model |
string minLength: 1 |
Identifikátor (ID modelu) základního modelu, který se používá pro tuto vyladění. |
| n_epochs |
integer (int32) |
Počet epoch pro trénování modelu. Epocha odkazuje na jeden celý cyklus prostřednictvím trénovací datové sady. |
| prompt_loss_weight |
number (double) |
Váha, která se má použít ke ztrátě v tokenech výzvy. To určuje, kolik se model snaží naučit se generovat výzvu (ve srovnání s dokončením, které má vždy váhu 1,0) a může přidat stabilizační efekt trénování, když jsou dokončení krátké. Pokud jsou výzvy extrémně dlouhé (vzhledem k dokončení), může být vhodné tuto váhu snížit, aby se zabránilo nadměrné prioritě učení výzvy. |
| suffix |
string |
Přípona použitá k identifikaci jemně vyladěného modelu. Přípona může obsahovat až 40 znaků (a-z, A-Z, 0-9 a _), které se přidají do vašeho jemně vyladěného názvu modelu. |
| training_file |
string minLength: 1 |
Identita souboru (ID souboru), která se používá k trénování tohoto jemně vyladěného modelu. |
| validation_file |
string |
Identita souboru (ID souboru), která se používá k vyhodnocení jemně vyladěného modelu během trénování. |
HyperParameters
HyperParametry
| Name | Typ | Description |
|---|---|---|
| batch_size |
integer (int32) |
Velikost dávky, která se má použít pro trénování. Velikost dávky je počet trénovacích příkladů, které se používají k trénování jednoho dopředu a dozadu. Obecně jsme zjistili, že větší velikosti dávek obvykle fungují lépe u větších datových sad. Výchozí hodnota a maximální hodnota této vlastnosti jsou specifické pro základní model. |
| classification_betas |
number[] (double) |
Hodnoty beta klasifikace. Pokud je k dispozici, vypočítáme skóre F-beta na zadaných beta hodnotách. Skóre F-beta je generalizace skóre F-1. Používá se jenom pro binární klasifikaci. Při beta verzi 1 (tj. skóre F-1) se přesnost a úplnost přidají stejné hmotnosti. Větší beta skóre dává větší váhu na úplnost a méně přesnosti. Menší beta skóre dává větší váhu přesnosti a méně při úplnosti. |
| classification_n_classes |
integer (int32) |
Počet tříd v úkolu klasifikace. Tento parametr je vyžadován pro klasifikaci s více třídami. |
| classification_positive_class |
string |
Kladná třída v binární klasifikaci. Tento parametr je potřeba ke generování metrik přesnosti, úplnosti a F1 při binární klasifikaci. |
| compute_classification_metrics |
boolean |
Hodnota označující, jestli se mají metriky klasifikace výpočetních prostředků provádět. V případě nastavení vypočítáme metriky specifické pro klasifikaci, jako je přesnost a skóre F-1, pomocí ověřovací sady na konci každé epochy. Tyto metriky je možné zobrazit v souboru výsledků. Abyste mohli vypočítat metriky klasifikace, musíte zadat validation_file. Kromě toho je nutné zadat classification_n_classes pro vícetřídní klasifikaci nebo classification_positive_class pro binární klasifikaci. |
| learning_rate_multiplier |
number (double) |
Násobitel rychlosti učení, který se má použít pro trénování. Míra doladění je původní míra učení používaná pro předtrénování vynásobenou touto hodnotou. Větší rychlost učení obvykle funguje lépe s většími velikostmi dávek. Doporučujeme experimentovat s hodnotami v rozsahu 0,02 až 0,2, abyste zjistili, co vede k dosažení nejlepších výsledků. |
| n_epochs |
integer (int32) |
Počet epoch pro trénování modelu. Epocha odkazuje na jeden celý cyklus prostřednictvím trénovací datové sady. |
| prompt_loss_weight |
number (double) |
Váha, která se má použít ke ztrátě v tokenech výzvy. To určuje, kolik se model snaží naučit se generovat výzvu (ve srovnání s dokončením, které má vždy váhu 1,0) a může přidat stabilizační efekt trénování, když jsou dokončení krátké. Pokud jsou výzvy extrémně dlouhé (vzhledem k dokončení), může být vhodné tuto váhu snížit, aby se zabránilo nadměrné prioritě učení výzvy. |
InnerError
Vnitřní chyba
| Name | Typ | Description |
|---|---|---|
| code |
InnerErrorCode |
|
| innererror |
Vnitřní chyba |
InnerErrorCode
InnerErrorCode
| Hodnota | Description |
|---|---|
| invalidPayload |
Data požadavku jsou pro tuto operaci neplatná. |
LogLevel
LogLevel
| Hodnota | Description |
|---|---|
| info |
Tato událost je určena pouze pro informace. |
| warning |
Tato událost představuje zmírnit problém. |
| error |
Tato zpráva představuje problém, který nejde obnovit. |
Purpose
Účel
| Hodnota | Description |
|---|---|
| fine-tune |
Tento soubor obsahuje trénovací data pro doladění úlohy. |
| fine-tune-results |
Tento soubor obsahuje výsledky úlohy vyladění. |
State
Stát
| Hodnota | Description |
|---|---|
| notRunning |
Operace byla vytvořena a není zařazena do fronty ke zpracování v budoucnu. |
| running |
Operace se začala zpracovávat. |
| succeeded |
Operace byla úspěšně zpracována a je připravená k použití. |
| canceled |
Operace byla zrušena a je neúplná. |
| failed |
Operace dokončila zpracování s chybou a nelze ji dále využívat. |
| deleted |
Entita byla odstraněna, ale ostatní entity před odstraněním mohou být stále odkazovány. |
TypeDiscriminator
Type Nábídka
| Hodnota | Description |
|---|---|
| list |
Tento objekt představuje seznam dalších objektů. |
| fine-tune |
Tento objekt představuje doladění úlohy. |
| file |
Tento objekt představuje soubor. |
| fine-tune-event |
Tento objekt představuje událost úlohy doladění. |
| model |
Tento objekt představuje model (může to být základní modely nebo vyladění výsledku úlohy). |