Konuşmayı sentezle

3 dakika

Ipucu

Daha fazla ayrıntı için Metin ve resimler sekmesine bakın!

Konuşma sentezi veya metinden sese, konuşmayı metne dönüştürmenin tersidir. Seslendirilmiş metnin ses akışını döndüren bir modele metin göndermeyi içerir.

Metin okuma işlemlerini destekleyen modeller şunlardır:

gpt-4o-tts
gpt-4o-mini-tts

Uyarı

Modelin kullanılabilirlik durumu bölgeye göre değişir. Microsoft Foundry belgelerinde model bölgesel kullanılabilirlik tablosunu gözden geçirin.

Metinden sese dönüştürme modeli kullanma

Konuşmayı metne dönüştürme modellerine benzer şekilde, OpenAI SDK'sında AzureOpenAI istemcisini kullanarak Microsoft Foundry kaynağınızın uç noktasına bağlanabilir ve konuşma sentezi için metni metin okuma modeline yükleyebilirsiniz.

from openai import AzureOpenAI
from pathlib import Path

# Create an AzureOpenAI client
client = AzureOpenAI(
    azure_endpoint=YOUR_FOUNDRY_ENDPOINT,
    api_key=YOUR_FOUNDRY_KEY,
    api_version="2025-03-01-preview"
)

# Path for audio output file
speech_file_path = Path("output_speech.wav")

# Generate speech and save to file
with client.audio.speech.with_streaming_response.create(
            model=YOUR_MODEL_DEPLOYMENT,
            voice="alloy",
            input="This speech was AI-generated!",
            instructions="Speak in an upbeat, excited tone.",
    ) as response:
    response.stream_to_file(speech_file_path)

print(f"Speech generated and saved to {speech_file_path}")

Geri Bildirim

Bu sayfayı yararlı buldunuz mu?