Konuşmanın dökümünü yapma

3 dakika

Ipucu

Daha fazla ayrıntı için Metin ve resimler sekmesine bakın!

Konuşma transkripsiyonu veya konuşmayı metne dönüştürme, ses kaynağının metin tabanlı transkriptiyle yanıt veren bir modele ses içeriği göndermeyi içerir.

Konuşmayı metne dönüştürme işlemlerini destekleyen modeller şunlardır:

gpt-4o-transcribe
gpt-4o-mini-transcribe
gpt-4o-transcribe-diarize

Uyarı

Modelin kullanılabilirlik durumu bölgeye göre değişir. Microsoft Foundry belgelerinde model bölgesel kullanılabilirlik tablosunu gözden geçirin.

Konuşmayı metne dönüştürme modeli kullanma

Kendi uygulamanızda konuşmayı metne dönüştürme modelini kullanmak için OpenAI SDK'sında AzureOpenAI istemcisini kullanarak Microsoft Foundry kaynağınızın uç noktasına bağlanabilir ve ses dosyasının içeriğini transkripsiyon için modele yükleyebilirsiniz.

from openai import AzureOpenAI
from pathlib import Path

# Create an AzureOpenAI client
client = AzureOpenAI(
    azure_endpoint=YOUR_FOUNDRY_ENDPOINT,
    api_key=YOUR_FOUNDRY_KEY,
    api_version="2025-03-01-preview"
)

# Get the audio file
file_path = Path("speech.mp3")
audio_file = open(file_path, "rb")

# Use the model to transcribe the audio file
transcription = client.audio.transcriptions.create(
    model=YOUR_MODEL_DEPLOYMENT,
    file=audio_file,
    response_format="text"
)

print(transcription)

Geri Bildirim

Bu sayfayı yararlı buldunuz mu?