Konuşmanın dökümünü yapma
Ipucu
Daha fazla ayrıntı için Metin ve resimler sekmesine bakın!
Konuşma transkripsiyonu veya konuşmayı metne dönüştürme, ses kaynağının metin tabanlı transkriptiyle yanıt veren bir modele ses içeriği göndermeyi içerir.
Konuşmayı metne dönüştürme işlemlerini destekleyen modeller şunlardır:
- gpt-4o-transcribe
- gpt-4o-mini-transcribe
- gpt-4o-transcribe-diarize
Uyarı
Modelin kullanılabilirlik durumu bölgeye göre değişir. Microsoft Foundry belgelerinde model bölgesel kullanılabilirlik tablosunu gözden geçirin.
Konuşmayı metne dönüştürme modeli kullanma
Kendi uygulamanızda konuşmayı metne dönüştürme modelini kullanmak için OpenAI SDK'sında AzureOpenAI istemcisini kullanarak Microsoft Foundry kaynağınızın uç noktasına bağlanabilir ve ses dosyasının içeriğini transkripsiyon için modele yükleyebilirsiniz.
from openai import AzureOpenAI
from pathlib import Path
# Create an AzureOpenAI client
client = AzureOpenAI(
azure_endpoint=YOUR_FOUNDRY_ENDPOINT,
api_key=YOUR_FOUNDRY_KEY,
api_version="2025-03-01-preview"
)
# Get the audio file
file_path = Path("speech.mp3")
audio_file = open(file_path, "rb")
# Use the model to transcribe the audio file
transcription = client.audio.transcriptions.create(
model=YOUR_MODEL_DEPLOYMENT,
file=audio_file,
response_format="text"
)
print(transcription)