Azure OpenAI GPT-4o-mini ince ayar öğreticisi

2025-07-02

Bu öğretici, bir gpt-4o-mini-2024-07-18 modelini ince ayar yapma sürecinde size yol gösterir.

Bu öğreticide şunların nasıl yapılacağını öğreneceksiniz:

Örnek ince ayar veri kümeleri oluşturun.
Kaynak uç noktanız ve API anahtarınız için ortam değişkenleri oluşturun.
Hassas ayarlamalar için örnek eğitim ve doğrulama veri kümelerinizi hazırlayın.
Hassas ayarlama için eğitim dosyanızı ve doğrulama dosyanızı yükleyin.
gpt-4o-mini-2024-07-18 için bir ince ayar işi oluşturun.
Özel bir ince ayarlı model dağıtın.

Önkoşullar

Azure aboneliği - Ücretsiz bir abonelik oluşturun.
Python 3.8 veya üzeri sürüm
Aşağıdaki Python kitaplıkları: json, requests, os, tiktoken, time, openai, numpy.
Jupyter Not Defterleri
İnce ayarlamanın kullanılabildiği gpt-4o-mini-2024-07-18bir bölgedeki Azure OpenAI kaynağı. Kaynağınız yoksa, kaynak dağıtım kılavuzumuzda kaynak oluşturma işlemi belgelenmiştir.
Erişimde ince ayar yapmak için Bilişsel Hizmetler OpenAI Katkıda Bulunanı gerekir.
Azure AI Foundry portalında kotayı görüntüleme ve modelleri dağıtma erişiminiz yoksa daha fazla izne ihtiyacınız vardır.

Önemli

İlişkili maliyetleri öğrenmek için ince ayar yapmak için fiyatlandırma bilgilerini gözden geçirmenizi öneririz. Bu öğreticinin test edilmesi sonucunda 48.000 belirteç faturalandı (4.800 eğitim belirteci * 10 eğitim aşaması). Eğitim maliyetleri, ince ayar çıkarımı ve ince ayarlı bir modelin dağıtıldığı saatlik barındırma maliyetleriyle ilişkili maliyetlere ek olarak ortaya çıkar. Eğitimi tamamladıktan sonra ince ayarlı model dağıtımınızı silmelisiniz, aksi takdirde saatlik barındırma maliyeti ödemeye devam edersiniz.

Kurulum

Python kitaplıkları

Bu öğreticide, tohum/olaylar/denetim noktaları gibi en son OpenAI özelliklerinden bazıları verilmiştir. Bu özelliklerden yararlanmak için en son sürüme yükseltmek için komutunu çalıştırmanız pip install openai --upgrade gerekebilir.

pip install openai requests tiktoken numpy

Anahtarı ve uç noktayı alma

Azure OpenAI'ye karşı başarılı bir şekilde çağrı yapmak için bir uç nokta ve anahtar gerekir.

Değişken adı	Değer
`ENDPOINT`	Hizmet uç noktası, Kaynağınızı Azure portalından incelerken Anahtarlar ve Uç Nokta bölümünde bulunabilir. Alternatif olarak, uç noktayı Azure AI Foundry portalındaki Dağıtımlar sayfasında bulabilirsiniz. Örnek uç nokta: `https://docs-test-001.openai.azure.com/`.
`API-KEY`	Bu değer, Kaynağınızı Azure portalından incelerken Anahtarlar ve Uç Nokta bölümünde bulunabilir. `KEY1` veya `KEY2` kullanabilirsiniz.

Azure portalında kaynağınıza gidin. Anahtarlar ve Uç Nokta bölümü Kaynak Yönetimi bölümünde bulunabilir. Api çağrılarınızın kimliğini doğrulamak için ihtiyacınız olacak şekilde uç noktanızı ve erişim anahtarınızı kopyalayın. KEY1 veya KEY2 kullanabilirsiniz. Her zaman iki anahtara sahip olmak, hizmet kesintisine neden olmadan anahtarları güvenli bir şekilde döndürmenize ve yeniden oluşturmanıza olanak tanır.

Ortam değişkenleri

Anahtarınız ve uç noktanız için kalıcı ortam değişkenleri oluşturun ve atayın.

Önemli

API anahtarlarını dikkatli kullanın. API anahtarını doğrudan kodunuzla eklemeyin ve hiçbir zaman herkese açık olarak göndermeyin. API anahtarı kullanıyorsanız, bunu Azure Key Vault'ta güvenli bir şekilde depolayın. Uygulamalarınızda API anahtarlarını güvenli bir şekilde kullanma hakkında daha fazla bilgi için bkz. Azure Key Vault ile API anahtarları.

Yapay zeka hizmetleri güvenliği hakkında daha fazla bilgi için bkz. Azure AI hizmetlerine yönelik isteklerin kimliğini doğrulama.

setx AZURE_OPENAI_API_KEY "REPLACE_WITH_YOUR_KEY_VALUE_HERE"

setx AZURE_OPENAI_ENDPOINT "REPLACE_WITH_YOUR_ENDPOINT_HERE"

[System.Environment]::SetEnvironmentVariable('AZURE_OPENAI_API_KEY', 'REPLACE_WITH_YOUR_KEY_VALUE_HERE', 'User')

[System.Environment]::SetEnvironmentVariable('AZURE_OPENAI_ENDPOINT', 'REPLACE_WITH_YOUR_ENDPOINT_HERE', 'User')

echo export AZURE_OPENAI_API_KEY="REPLACE_WITH_YOUR_KEY_VALUE_HERE" >> /etc/environment
echo export AZURE_OPENAI_ENDPOINT="REPLACE_WITH_YOUR_ENDPOINT_HERE" >> /etc/environment

source /etc/environment

Örnek veri kümesi oluşturma

hassas ayarlama gpt-4o-mini-2024-07-18 , özel olarak biçimlendirilmiş bir JSONL eğitim dosyası gerektirir. OpenAI belgelerinde aşağıdaki örneği sağlar:

{"messages": [{"role": "system", "content": "Marv is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "What's the capital of France?"}, {"role": "assistant", "content": "Paris, as if everyone doesn't know that already."}]}
{"messages": [{"role": "system", "content": "Marv is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "Who wrote 'Romeo and Juliet'?"}, {"role": "assistant", "content": "Oh, just some guy named William Shakespeare. Ever heard of him?"}]}
{"messages": [{"role": "system", "content": "Marv is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "How far is the Moon from Earth?"}, {"role": "assistant", "content": "Around 384,400 kilometers. Give or take a few, like that really matters."}]}

Bu örnekte bunu şu şekilde değiştiririz:

{"messages": [{"role": "system", "content": "Clippy is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "What's the capital of France?"}, {"role": "assistant", "content": "Paris, as if everyone doesn't know that already."}]}
{"messages": [{"role": "system", "content": "Clippy is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "Who wrote 'Romeo and Juliet'?"}, {"role": "assistant", "content": "Oh, just some guy named William Shakespeare. Ever heard of him?"}]}
{"messages": [{"role": "system", "content": "Clippy is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "How far is the Moon from Earth?"}, {"role": "assistant", "content": "Around 384,400 kilometers. Give or take a few, like that really matters."}]}

Bu üç örnek size genel biçimi vermek için yararlı olsa da, özel ince ayarlanmış modelinizi benzer şekilde yanıt verecek şekilde yönlendirmek istiyorsanız daha fazla örneğe ihtiyacınız olacaktır. Genellikle en az 50 yüksek kaliteli örneğin başlamasını istersiniz. Ancak, 1.000'lik yüksek kaliteli eğitim örneklerinin başarılı olmasını gerektirebilecek bir kullanım örneğine sahip olmak tamamen mümkündür.

Genel olarak, veri kümesi boyutunun iki katına çıkarılması model kalitesinde doğrusal bir artışa yol açabilir. Ancak düşük kaliteli örneklerin performansı olumsuz etkileyebileceğini unutmayın. Yalnızca en yüksek kaliteli örnekler için veri kümesini ayıklamadan modeli büyük miktarda iç veri üzerinde eğitirseniz, beklenenden daha kötü performans gösteren bir modelle sonuçlanabilirsiniz.

İki dosya oluşturmanız gerekecek: training_set.jsonl ve validation_set.jsonl.

Jupyter Not Defteri'ni çalıştırdığınız dizinde dosyaları oluşturun ve aşağıdaki kod bloklarının içeriğini ilgili dosyalara kopyalayın:

training_set.jsonl

{"messages": [{"role": "system", "content": "Clippy is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "Who discovered Antarctica?"}, {"role": "assistant", "content": "Some chaps named Fabian Gottlieb von Bellingshausen and Mikhail Lazarev, as if they don't teach that in every school!"}]}
{"messages": [{"role": "system", "content": "Clippy is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "What is the biggest ocean?"}, {"role": "assistant", "content": "The Pacific Ocean. It's not like it's a small pond or anything."}]}
{"messages": [{"role": "system", "content": "Clippy is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "What is the largest planet?"}, {"role": "assistant", "content": "It's called Jupiter, you might have heard of it...or not."}]}
{"messages": [{"role": "system", "content": "Clippy is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "Who painted the Mona Lisa?"}, {"role": "assistant", "content": "Oh, some obscure artist named Leonardo da Vinci. Not that he is famous or anything."}]}
{"messages": [{"role": "system", "content": "Clippy is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "What's the boiling point of water?"}, {"role": "assistant", "content": "Exciting fact of the day: it's 100 degrees Celsius. Life-changing, isn't it?"}]}
{"messages": [{"role": "system", "content": "Clippy is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "Who wrote 'The Odyssey'?"}, {"role": "assistant", "content": "Oh, just some poet named Homer. Nothing special, really."}]}
{"messages": [{"role": "system", "content": "Clippy is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "What is the largest mammal?"}, {"role": "assistant", "content": "Blue Whale. Quite a big fish isn't it? Oh wait, it's not a fish!"}]}
{"messages": [{"role": "system", "content": "Clippy is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "What's the highest mountain peak?"}, {"role": "assistant", "content": "Everest. Brace yourself, it's not a walk in the park."}]}
{"messages": [{"role": "system", "content": "Clippy is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "Who invented the telephone?"}, {"role": "assistant", "content": "A guy named Alexander Graham Bell. Bet you didn't guess that one!"}]}
{"messages": [{"role": "system", "content": "Clippy is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "What is the distance from Earth to the Sun?"}, {"role": "assistant", "content": "About 93 million miles. Just a quick drive, really."}]}

validation_set.jsonl

{"messages": [{"role": "system", "content": "Clippy is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "What's the capital of Australia?"}, {"role": "assistant", "content": "It's Canberra, not Sydney. Shocking, I know!"}]}
{"messages": [{"role": "system", "content": "Clippy is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "Who wrote 'The Great Gatsby'?"}, {"role": "assistant", "content": "Some guy named F. Scott Fitzgerald. Ever heard of him?"}]}
{"messages": [{"role": "system", "content": "Clippy is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "What's the deepest part of the ocean?"}, {"role": "assistant", "content": "Mariana Trench, makes your swimming pool seem a bit shallow, doesn't it?"}]}
{"messages": [{"role": "system", "content": "Clippy is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "Who composed the 'Moonlight Sonata'?"}, {"role": "assistant", "content": "Just a little-known guy named Beethoven. No big deal."}]}
{"messages": [{"role": "system", "content": "Clippy is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "What are the colors of the rainbow?"}, {"role": "assistant", "content": "ROYGBIV. Red, orange, yellow, green, blue, indigo, violet. Not that we learned this in preschool or anything!"}]}
{"messages": [{"role": "system", "content": "Clippy is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "What is the smallest planet?"}, {"role": "assistant", "content": "Meet Mercury, the runt of the solar system family."}]}
{"messages": [{"role": "system", "content": "Clippy is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "Who wrote 'Pride and Prejudice'?"}, {"role": "assistant", "content": "Do the words Jane Austen ring a bell? No? Well, she wrote it."}]}
{"messages": [{"role": "system", "content": "Clippy is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "What's the largest desert?"}, {"role": "assistant", "content": "Antarctica. Surprise, surprise! Deserts aren't just full of sand, you know."}]}
{"messages": [{"role": "system", "content": "Clippy is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "What is the longest river?"}, {"role": "assistant", "content": "The Nile River. It's not like it's famous or anything."}]}
{"messages": [{"role": "system", "content": "Clippy is a factual chatbot that is also sarcastic."}, {"role": "user", "content": "What's the capital of Germany?"}, {"role": "assistant", "content": "Berlin. Shocking news, right?"}]}

Şimdi eğitim ve doğrulama dosyalarımızda bazı ön denetimler çalıştırmanız gerekir.

# Run preliminary checks

import json

# Load the training set
with open('training_set.jsonl', 'r', encoding='utf-8') as f:
    training_dataset = [json.loads(line) for line in f]

# Training dataset stats
print("Number of examples in training set:", len(training_dataset))
print("First example in training set:")
for message in training_dataset[0]["messages"]:
    print(message)

# Load the validation set
with open('validation_set.jsonl', 'r', encoding='utf-8') as f:
    validation_dataset = [json.loads(line) for line in f]

# Validation dataset stats
print("\nNumber of examples in validation set:", len(validation_dataset))
print("First example in validation set:")
for message in validation_dataset[0]["messages"]:
    print(message)

Çıktı:

Number of examples in training set: 10
First example in training set:
{'role': 'system', 'content': 'Clippy is a factual chatbot that is also sarcastic.'}
{'role': 'user', 'content': 'Who discovered America?'}
{'role': 'assistant', 'content': "Some chap named Christopher Columbus, as if they don't teach that in every school!"}

Number of examples in validation set: 10
First example in validation set:
{'role': 'system', 'content': 'Clippy is a factual chatbot that is also sarcastic.'}
{'role': 'user', 'content': "What's the capital of Australia?"}
{'role': 'assistant', 'content': "It's Canberra, not Sydney. Shocking, I know!"}

Bu durumda yalnızca 10 eğitim ve 10 doğrulama örneğimiz vardır, bu nedenle bu, tutarlı bir şekilde fark edilebilir bir etki oluşturmak için yeterince fazla sayıda örnek olma olasılığı düşük olan bir modelde ince ayarlamanın temel mekaniklerini gösterir.

Artık belirteç sayılarını doğrulamak için tiktoken kitaplığını kullanabilirsiniz. Bu yöntemle token sayımı, hassas ayarlama için kullanılan tam token sayılarını vermeyecek, ancak iyi bir tahmin sağlamalıdır.

Uyarı

Tek tek örneklerin modelin gpt-4o-mini-2024-07-18 geçerli eğitim örneği bağlam uzunluğu altında kalması gerekir: 64.536 belirteç. Modelin giriş belirteci sınırı 128.000 belirteç olarak kalır.

# Validate token counts

import json
import tiktoken
import numpy as np
from collections import defaultdict

encoding = tiktoken.get_encoding("o200k_base") # default encoding for gpt-4o models. This requires the latest version of tiktoken to be installed.

def num_tokens_from_messages(messages, tokens_per_message=3, tokens_per_name=1):
    num_tokens = 0
    for message in messages:
        num_tokens += tokens_per_message
        for key, value in message.items():
            num_tokens += len(encoding.encode(value))
            if key == "name":
                num_tokens += tokens_per_name
    num_tokens += 3
    return num_tokens

def num_assistant_tokens_from_messages(messages):
    num_tokens = 0
    for message in messages:
        if message["role"] == "assistant":
            num_tokens += len(encoding.encode(message["content"]))
    return num_tokens

def print_distribution(values, name):
    print(f"\n#### Distribution of {name}:")
    print(f"min / max: {min(values)}, {max(values)}")
    print(f"mean / median: {np.mean(values)}, {np.median(values)}")
    print(f"p5 / p95: {np.quantile(values, 0.1)}, {np.quantile(values, 0.9)}")

files = ['training_set.jsonl', 'validation_set.jsonl']

for file in files:
    print(f"Processing file: {file}")
    with open(file, 'r', encoding='utf-8') as f:
        dataset = [json.loads(line) for line in f]

    total_tokens = []
    assistant_tokens = []

    for ex in dataset:
        messages = ex.get("messages", {})
        total_tokens.append(num_tokens_from_messages(messages))
        assistant_tokens.append(num_assistant_tokens_from_messages(messages))

    print_distribution(total_tokens, "total tokens")
    print_distribution(assistant_tokens, "assistant tokens")
    print('*' * 50)

Çıktı:

Processing file: training_set.jsonl

#### Distribution of total tokens:
min / max: 46, 59
mean / median: 49.8, 48.5
p5 / p95: 46.0, 53.599999999999994

#### Distribution of assistant tokens:
min / max: 13, 28
mean / median: 16.5, 14.0
p5 / p95: 13.0, 19.9
**************************************************
Processing file: validation_set.jsonl

#### Distribution of total tokens:
min / max: 41, 64
mean / median: 48.9, 47.0
p5 / p95: 43.7, 54.099999999999994

#### Distribution of assistant tokens:
min / max: 8, 29
mean / median: 15.0, 12.5
p5 / p95: 10.7, 19.999999999999996
****************************

İnce ayar dosyalarını karşıya yükleme

# Upload fine-tuning files

import os
from openai import AzureOpenAI

client = AzureOpenAI(
  azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"),
  api_key = os.getenv("AZURE_OPENAI_API_KEY"),
  api_version = "2025-02-01-preview"  
)

training_file_name = 'training_set.jsonl'
validation_file_name = 'validation_set.jsonl'

# Upload the training and validation dataset files to Azure OpenAI with the SDK.

training_response = client.files.create(
    file = open(training_file_name, "rb"), purpose="fine-tune"
)
training_file_id = training_response.id

validation_response = client.files.create(
    file = open(validation_file_name, "rb"), purpose="fine-tune"
)
validation_file_id = validation_response.id

print("Training file ID:", training_file_id)
print("Validation file ID:", validation_file_id)

Çıktı:

Training file ID: file-0e3aa3f2e81e49a5b8b96166ea214626
Validation file ID: file-8556c3bb41b7416bb7519b47fcd1dd6b

hassas ayarlamaya başlayın

Artık ince ayarlama dosyaları başarıyla karşıya yüklendiğine göre, ince ayarlama eğitim işinizi gönderebilirsiniz.

Bu örnekte, seed parametresini de aktarıyoruz. Tohum, işin yeniden üretilebilirliğini denetler. Aynı tohum ve iş parametrelerini kullanmak, aynı sonuçları üretmelidir, ancak nadir durumlarda farklılık gösterebilir. Bir tohum belirtilmezse sizin için bir tane oluşturulur.

# Submit fine-tuning training job

response = client.fine_tuning.jobs.create(
    training_file = training_file_id,
    validation_file = validation_file_id,
    model = "gpt-4o-mini-2024-07-18", # Enter base model name. Note that in Azure OpenAI the model name contains dashes and cannot contain dot/period characters.
    seed = 105 # seed parameter controls reproducibility of the fine-tuning job. If no seed is specified one will be generated automatically.
)

job_id = response.id

# You can use the job ID to monitor the status of the fine-tuning job.
# The fine-tuning job will take some time to start and complete.

print("Job ID:", response.id)
print("Status:", response.status)
print(response.model_dump_json(indent=2))

Çıktı:

Job ID: ftjob-900fcfc7ea1d4360a9f0cb1697b4eaa6
Status: pending
{
  "id": "ftjob-900fcfc7ea1d4360a9f0cb1697b4eaa6",
  "created_at": 1715824115,
  "error": null,
  "fine_tuned_model": null,
  "finished_at": null,
  "hyperparameters": {
    "n_epochs": -1,
    "batch_size": -1,
    "learning_rate_multiplier": 1
  },
  "model": "gpt-4o-mini-2024-07-18",
  "object": "fine_tuning.job",
  "organization_id": null,
  "result_files": null,
  "seed": 105,
  "status": "pending",
  "trained_tokens": null,
  "training_file": "file-0e3aa3f2e81e49a5b8b96166ea214626",
  "validation_file": "file-8556c3bb41b7416bb7519b47fcd1dd6b",
  "estimated_finish": null,
  "integrations": null
}

Eğitim işi durumunu izleme

Tamamlanana kadar eğitim işinin durumunu kontrol etmek isterseniz şunları çalıştırabilirsiniz:

# Track training status

from IPython.display import clear_output
import time

start_time = time.time()

# Get the status of our fine-tuning job.
response = client.fine_tuning.jobs.retrieve(job_id)

status = response.status

# If the job isn't done yet, poll it every 10 seconds.
while status not in ["succeeded", "failed"]:
    time.sleep(10)

    response = client.fine_tuning.jobs.retrieve(job_id)
    print(response.model_dump_json(indent=2))
    print("Elapsed time: {} minutes {} seconds".format(int((time.time() - start_time) // 60), int((time.time() - start_time) % 60)))
    status = response.status
    print(f'Status: {status}')
    clear_output(wait=True)

print(f'Fine-tuning job {job_id} finished with status: {status}')

# List all fine-tuning jobs for this resource.
print('Checking other fine-tune jobs for this resource.')
response = client.fine_tuning.jobs.list()
print(f'Found {len(response.data)} fine-tune jobs.')

Çıktı:

Job ID: ftjob-900fcfc7ea1d4360a9f0cb1697b4eaa6
Status: pending
{
  "id": "ftjob-900fcfc7ea1d4360a9f0cb1697b4eaa6",
  "created_at": 1715824115,
  "error": null,
  "fine_tuned_model": null,
  "finished_at": null,
  "hyperparameters": {
    "n_epochs": -1,
    "batch_size": -1,
    "learning_rate_multiplier": 1
  },
  "model": "gpt-4o-mini-2024-07-18",
  "object": "fine_tuning.job",
  "organization_id": null,
  "result_files": null,
  "seed": 105,
  "status": "pending",
  "trained_tokens": null,
  "training_file": "file-0e3aa3f2e81e49a5b8b96166ea214626",
  "validation_file": "file-8556c3bb41b7416bb7519b47fcd1dd6b",
  "estimated_finish": null,
  "integrations": null
}

Eğitimin tamamlanmasının bir saatten fazla sürmesi olağan dışı değildir. Eğitim tamamlandıktan sonra çıkış iletisi aşağıdaki gibi bir değere dönüşür:

Fine-tuning job ftjob-900fcfc7ea1d4360a9f0cb1697b4eaa6 finished with status: succeeded
Checking other fine-tune jobs for this resource.
Found 4 fine-tune jobs.

İnce ayar olaylarını listeleme

Bu komut için API sürümü: 2024-08-01-preview veya üzeri gereklidir.

İnce ayarlamayı tamamlamak için gerekli olmasa da, eğitim sırasında oluşturulan ayrı ayrı ince ayar olaylarını incelemek yararlı olabilir. Eğitim sonuçları dosyasında eğitim tamamlandıktan sonra eğitim sonuçlarının tamamı da incelenebilir.

response = client.fine_tuning.jobs.list_events(fine_tuning_job_id=job_id, limit=10)
print(response.model_dump_json(indent=2))

Çıktı:

{
  "data": [
    {
      "id": "ftevent-179d02d6178f4a0486516ff8cbcdbfb6",
      "created_at": 1715826339,
      "level": "info",
      "message": "Training hours billed: 0.500",
      "object": "fine_tuning.job.event",
      "type": "message"
    },
    {
      "id": "ftevent-467bc5e766224e97b5561055dc4c39c0",
      "created_at": 1715826339,
      "level": "info",
      "message": "Completed results file: file-175c81c590074388bdb49e8e0d91bac3",
      "object": "fine_tuning.job.event",
      "type": "message"
    },
    {
      "id": "ftevent-a30c44da4c304180b327c3be3a7a7e51",
      "created_at": 1715826337,
      "level": "info",
      "message": "Postprocessing started.",
      "object": "fine_tuning.job.event",
      "type": "message"
    },
    {
      "id": "ftevent-ea10a008f1a045e9914de98b6b47514b",
      "created_at": 1715826303,
      "level": "info",
      "message": "Job succeeded.",
      "object": "fine_tuning.job.event",
      "type": "message"
    },
    {
      "id": "ftevent-008dc754dc9e61b008dc754dc9e61b00",
      "created_at": 1715825614,
      "level": "info",
      "message": "Step 100: training loss=0.001647822093218565",
      "object": "fine_tuning.job.event",
      "type": "metrics",
      "data": {
        "step": 100,
        "train_loss": 0.001647822093218565,
        "train_mean_token_accuracy": 1,
        "valid_loss": 1.5170825719833374,
        "valid_mean_token_accuracy": 0.75,
        "full_valid_loss": 1.7539110545870624,
        "full_valid_mean_token_accuracy": 0.7215189873417721
      }
    },
    {
      "id": "ftevent-008dc754dc3f03a008dc754dc3f03a00",
      "created_at": 1715825604,
      "level": "info",
      "message": "Step 90: training loss=0.00971441250294447",
      "object": "fine_tuning.job.event",
      "type": "metrics",
      "data": {
        "step": 90,
        "train_loss": 0.00971441250294447,
        "train_mean_token_accuracy": 1,
        "valid_loss": 1.3702410459518433,
        "valid_mean_token_accuracy": 0.75,
        "full_valid_loss": 1.7371194453179082,
        "full_valid_mean_token_accuracy": 0.7278481012658228
      }
    },
    {
      "id": "ftevent-008dc754dbdfa59008dc754dbdfa5900",
      "created_at": 1715825594,
      "level": "info",
      "message": "Step 80: training loss=0.0032251903321594",
      "object": "fine_tuning.job.event",
      "type": "metrics",
      "data": {
        "step": 80,
        "train_loss": 0.0032251903321594,
        "train_mean_token_accuracy": 1,
        "valid_loss": 1.4242165088653564,
        "valid_mean_token_accuracy": 0.75,
        "full_valid_loss": 1.6554046099698996,
        "full_valid_mean_token_accuracy": 0.7278481012658228
      }
    },
    {
      "id": "ftevent-008dc754db80478008dc754db8047800",
      "created_at": 1715825584,
      "level": "info",
      "message": "Step 70: training loss=0.07380199432373047",
      "object": "fine_tuning.job.event",
      "type": "metrics",
      "data": {
        "step": 70,
        "train_loss": 0.07380199432373047,
        "train_mean_token_accuracy": 1,
        "valid_loss": 1.2011798620224,
        "valid_mean_token_accuracy": 0.75,
        "full_valid_loss": 1.508960385865803,
        "full_valid_mean_token_accuracy": 0.740506329113924
      }
    },
    {
      "id": "ftevent-008dc754db20e97008dc754db20e9700",
      "created_at": 1715825574,
      "level": "info",
      "message": "Step 60: training loss=0.245253324508667",
      "object": "fine_tuning.job.event",
      "type": "metrics",
      "data": {
        "step": 60,
        "train_loss": 0.245253324508667,
        "train_mean_token_accuracy": 0.875,
        "valid_loss": 1.0585949420928955,
        "valid_mean_token_accuracy": 0.75,
        "full_valid_loss": 1.3787144045286541,
        "full_valid_mean_token_accuracy": 0.7341772151898734
      }
    },
    {
      "id": "ftevent-008dc754dac18b6008dc754dac18b600",
      "created_at": 1715825564,
      "level": "info",
      "message": "Step 50: training loss=0.1696014404296875",
      "object": "fine_tuning.job.event",
      "type": "metrics",
      "data": {
        "step": 50,
        "train_loss": 0.1696014404296875,
        "train_mean_token_accuracy": 0.8999999761581421,
        "valid_loss": 0.8862184286117554,
        "valid_mean_token_accuracy": 0.8125,
        "full_valid_loss": 1.2814022257358213,
        "full_valid_mean_token_accuracy": 0.7151898734177216
      }
    }
  ],
  "has_more": true,
  "object": "list"
}

Denetim noktalarını listeleme

Bu komut için API sürümü: 2024-08-01-preview veya üzeri gereklidir.

Her eğitim dönemi tamamlandığında bir denetim noktası oluşturulur. Denetim noktası, modelin hem dağıtılabilen hem de sonraki hassas ayarlama işleri için hedef model olarak kullanılabilen tam işlevsel bir sürümüdür. Kontrol noktaları, aşırı öğrenme gerçekleşmeden önce modelinizin anlık görüntüsünü sağlayabilecekleri için yararlı olabilir. bir ince ayar işi tamamlandığında, modelin dağıtabileceğiniz en son üç sürümüne sahip olursunuz. Son dönem, ince ayarlı modelinizle temsil edilir, önceki iki dönem kontrol noktası olarak kullanılabilir.

response = client.fine_tuning.jobs.checkpoints.list(job_id)
print(response.model_dump_json(indent=2))

Çıktı:

{
  "data": [
    {
      "id": "ftchkpt-148ab69f0a404cf9ab55a73d51b152de",
      "created_at": 1715743077,
      "fine_tuned_model_checkpoint": "gpt-4o-mini-2024-07-18.ft-0e208cf33a6a466994aff31a08aba678",
      "fine_tuning_job_id": "ftjob-372c72db22c34e6f9ccb62c26ee0fbd9",
      "metrics": {
        "full_valid_loss": 1.8258173013035255,
        "full_valid_mean_token_accuracy": 0.7151898734177216,
        "step": 100.0,
        "train_loss": 0.004080486483871937,
        "train_mean_token_accuracy": 1.0,
        "valid_loss": 1.5915886163711548,
        "valid_mean_token_accuracy": 0.75
      },
      "object": "fine_tuning.job.checkpoint",
      "step_number": 100
    },
    {
      "id": "ftchkpt-e559c011ecc04fc68eaa339d8227d02d",
      "created_at": 1715743013,
      "fine_tuned_model_checkpoint": "gpt-4o-mini-2024-07-18.ft-0e208cf33a6a466994aff31a08aba678:ckpt-step-90",
      "fine_tuning_job_id": "ftjob-372c72db22c34e6f9ccb62c26ee0fbd9",
      "metrics": {
        "full_valid_loss": 1.7958603267428241,
        "full_valid_mean_token_accuracy": 0.7215189873417721,
        "step": 90.0,
        "train_loss": 0.0011079151881858706,
        "train_mean_token_accuracy": 1.0,
        "valid_loss": 1.6084896326065063,
        "valid_mean_token_accuracy": 0.75
      },
      "object": "fine_tuning.job.checkpoint",
      "step_number": 90
    },
    {
      "id": "ftchkpt-8ae8beef3dcd4dfbbe9212e79bb53265",
      "created_at": 1715742984,
      "fine_tuned_model_checkpoint": "gpt-4o-mini-2024-07-18.ft-0e208cf33a6a466994aff31a08aba678:ckpt-step-80",
      "fine_tuning_job_id": "ftjob-372c72db22c34e6f9ccb62c26ee0fbd9",
      "metrics": {
        "full_valid_loss": 1.6909511662736725,
        "full_valid_mean_token_accuracy": 0.7088607594936709,
        "step": 80.0,
        "train_loss": 0.000667572021484375,
        "train_mean_token_accuracy": 1.0,
        "valid_loss": 1.4677599668502808,
        "valid_mean_token_accuracy": 0.75
      },
      "object": "fine_tuning.job.checkpoint",
      "step_number": 80
    }
  ],
  "has_more": false,
  "object": "list"
}

Son eğitim çalıştırması sonuçları

Son sonuçları almak için aşağıdakileri çalıştırın:

# Retrieve fine_tuned_model name

response = client.fine_tuning.jobs.retrieve(job_id)

print(response.model_dump_json(indent=2))
fine_tuned_model = response.fine_tuned_model

Hassas ayarlı modeli dağıt

Bu öğreticideki önceki Python SDK komutlarından farklı olarak, kota özelliği kullanıma sunulduğundan, model dağıtımı ayrı yetkilendirme, farklı bir API yolu ve farklı bir API sürümü gerektiren REST API kullanılarak yapılmalıdır.

Alternatif olarak, Azure AI Foundry portalı veya Azure CLI gibi diğer yaygın dağıtım yöntemlerinden herhangi birini kullanarak ince ayarlı modelinizi dağıtabilirsiniz.

değişken	Tanım
jeton	Yetkilendirme belirteci oluşturmanın birden çok yolu vardır. İlk test için en kolay yöntem, Cloud Shell'i Azure portalından başlatmaktır. Ardından `az account get-access-token` komutunu çalıştırın. Bu belirteci API testi için geçici yetkilendirme belirteciniz olarak kullanabilirsiniz. Bunu yeni bir ortam değişkeninde depolamanızı öneririz
abonelik	İlişkili Azure OpenAI kaynağının abonelik kimliği
kaynak grubu	Azure OpenAI kaynağınızın kaynak grubu adı
kaynak_adı	Azure OpenAI kaynak adı
model_dağıtım_adı	Yeni ince ayarlı model dağıtımınız için özel isim. Bu, sohbet tamamlama çağrıları yaparken kodunuzda başvuruda bulunılan addır.
ince ayarlı model	Önceki adımda ince ayar iş sonuçlarınızdan bu değeri alın. Şuna benzer: `gpt-4o-mini-2024-07-18.ft-0e208cf33a6a466994aff31a08aba678`. Bu değeri deploy_data json'a eklemeniz gerekir.

Önemli

Özelleştirilmiş bir modeli dağıttıktan sonra, herhangi bir zamanda dağıtım on beş (15) günden uzun süre etkin değilse dağıtım silinir. Model on beşten (15) gün önce dağıtıldıysa ve sürekli 15 günlük bir süre boyunca buna hiçbir tamamlama veya sohbet tamamlama çağrısı yapılmadıysa, özelleştirilmiş bir modelin dağıtımı devre dışı bırakılır.

Etkin olmayan bir dağıtımın silinmesi, temel alınan özelleştirilmiş modeli silmez veya etkilemez ve özelleştirilmiş model istediğiniz zaman yeniden dağıtılabilir. Azure AI Foundry Modellerinde Azure OpenAI fiyatlandırmasında açıklandığı gibi, dağıtılan her özelleştirilmiş (ince ayarlı) model, modele tamamlama veya sohbet tamamlama çağrıları yapılıp yapılmamasına bakılmaksızın saatlik barındırma maliyetine neden olur. Azure OpenAI ile maliyetleri planlama ve yönetme hakkında daha fazla bilgi edinmek için Azure OpenAI maliyetlerini yönetmeyi planlama konusundaki kılavuza bakın.

# Deploy fine-tuned model

import json
import requests

token = os.getenv("TEMP_AUTH_TOKEN")
subscription = "<YOUR_SUBSCRIPTION_ID>"
resource_group = "<YOUR_RESOURCE_GROUP_NAME>"
resource_name = "<YOUR_AZURE_OPENAI_RESOURCE_NAME>"
model_deployment_name = "gpt-4o-mini-2024-07-18-ft" # Custom deployment name you chose for your fine-tuning model

deploy_params = {'api-version': "2024-10-01"} # Control plane API version
deploy_headers = {'Authorization': 'Bearer {}'.format(token), 'Content-Type': 'application/json'}

deploy_data = {
    "sku": {"name": "standard", "capacity": 1},
    "properties": {
        "model": {
            "format": "OpenAI",
            "name": "<YOUR_FINE_TUNED_MODEL>", #retrieve this value from the previous call, it will look like gpt-4o-mini-2024-07-18.ft-0e208cf33a6a466994aff31a08aba678
            "version": "1"
        }
    }
}
deploy_data = json.dumps(deploy_data)

request_url = f'https://management.azure.com/subscriptions/{subscription}/resourceGroups/{resource_group}/providers/Microsoft.CognitiveServices/accounts/{resource_name}/deployments/{model_deployment_name}'

print('Creating a new deployment...')

r = requests.put(request_url, params=deploy_params, headers=deploy_headers, data=deploy_data)

print(r)
print(r.reason)
print(r.json())

Azure AI Foundry portalında dağıtım ilerlemenizi de kontrol edebilirsiniz.

İnce ayarlı modeller dağıtılırken bu işlemin tamamlanmasının biraz zaman alması sık karşılaşılan bir durumdur.

Dağıtılan özelleştirilmiş modeli kullanın

Hassas ayarlı modeliniz dağıtıldıktan sonra, Azure AI Foundry portalının Sohbet Oyun Alanı'nda veya sohbet tamamlama API'si aracılığıyla dağıtılan diğer tüm modellerde olduğu gibi kullanabilirsiniz. Örneğin, aşağıdaki Python örneğinde gösterildiği gibi dağıtılan modelinize sohbet tamamlama çağrısı gönderebilirsiniz. Özelleştirilmiş modelinizle sıcaklık ve max_tokens gibi, dağıtılan diğer modellerde olduğu gibi aynı parametreleri kullanmaya devam edebilirsiniz.

# Use the deployed customized model

import os
from openai import AzureOpenAI

client = AzureOpenAI(
  azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"),
  api_key = os.getenv("AZURE_OPENAI_API_KEY"),
  api_version = "2024-10-21"
)

response = client.chat.completions.create(
    model = "gpt-4o-mini-2024-07-18-ft", # model = "Custom deployment name you chose for your fine-tuning model"
    messages = [
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "Does Azure OpenAI support customer managed keys?"},
        {"role": "assistant", "content": "Yes, customer managed keys are supported by Azure OpenAI."},
        {"role": "user", "content": "Do other Azure services support this too?"}
    ]
)

print(response.choices[0].message.content)

Dağıtımı silme

Diğer Azure OpenAI modellerinden farklı olarak, ince ayarlı/özelleştirilmiş modellerin dağıtıldıktan sonra bunlarla ilişkili saatlik barındırma maliyeti vardır. Bu öğreticiyi tamamladıktan ve ince ayarlı modelinizde birkaç sohbet tamamlama çağrısını test ettikten sonra model dağıtımını silmeniz kesinlikle önerilir.

Dağıtımın silinmesi modelin kendisini etkilemez, bu nedenle bu öğretici için eğitmiş olduğunuz ince ayarlı modeli istediğiniz zaman yeniden dağıtabilirsiniz.

Dağıtımı Azure AI Foundry portalında REST API, Azure CLI veya desteklenen diğer dağıtım yöntemleri aracılığıyla silebilirsiniz.

Sorun giderme

İnce ayarlamayı nasıl etkinleştirebilirim? Özel model oluşturma işlemi gri gösterilir.

Hassas ayarlamalara başarıyla erişmek için Bilişsel Hizmetler OpenAI Katkıda Bulunanı'nın atanması gerekir. Üst düzey Hizmet Yöneticisi izinlerine sahip birinin bile ince ayara erişmek için bu hesabın açıkça ayarlanması gerekir. Daha fazla bilgi için rol tabanlı erişim denetimi kılavuzunu gözden geçirin.

Sonraki Adımlar

Azure OpenAI'de ince ayarlama hakkında daha fazla bilgi edinin
Azure OpenAI'yi destekleyen temel modeller hakkında daha fazla bilgi edinin.

Aracılığıyla paylaş

Azure OpenAI GPT-4o-mini ince ayar öğreticisi

Önkoşullar

Kurulum

Python kitaplıkları

Anahtarı ve uç noktayı alma

Ortam değişkenleri

Örnek veri kümesi oluşturma

İnce ayar dosyalarını karşıya yükleme

hassas ayarlamaya başlayın

Eğitim işi durumunu izleme

İnce ayar olaylarını listeleme

Denetim noktalarını listeleme

Son eğitim çalıştırması sonuçları

Hassas ayarlı modeli dağıt

Dağıtılan özelleştirilmiş modeli kullanın

Dağıtımı silme

Sorun giderme

İnce ayarlamayı nasıl etkinleştirebilirim? Özel model oluşturma işlemi gri gösterilir.

Sonraki Adımlar

Geri Bildirim

Ek kaynaklar