สังเคราะห์คําพูด

เสร็จสมบูรณ์เมื่อ

Tip

ดูแท็บ ข้อความและรูปภาพ สําหรับรายละเอียดเพิ่มเติม!

การสังเคราะห์คําพูดหรือการอ่าน ออกเสียงข้อความเป็นสิ่งที่ตรงกันข้ามกับการแปลงคําพูดเป็นข้อความ มันเกี่ยวข้องกับการส่งข้อความไปยังโมเดล ซึ่งจะส่งคืนสตรีมเสียงของข้อความที่เปล่งเสียง

โมเดลที่รองรับการดําเนินการแปลงข้อความเป็นคําพูด ได้แก่:

  • จีพีที-4 โอ-ทีเอส
  • GPT-4O-มินิ-TTS

Note

ความพร้อมใช้งานของรุ่นจะแตกต่างกันไปตามภูมิภาค ตรวจสอบ ตารางความพร้อมใช้งานระดับภูมิภาคของแบบจําลอง ในเอกสารประกอบของ Microsoft Foundry

การใช้โมเดลการแปลงข้อความเป็นคําพูด

คุณสามารถใช้ไคลเอ็นต์ AzureOpenAI ใน OpenAI SDK เพื่อเชื่อมต่อกับปลายทางสําหรับทรัพยากร Microsoft Foundry ของคุณ และอัปโหลดข้อความไปยังโมเดลการแปลงข้อความเป็นคําพูดสําหรับการสังเคราะห์คําพูด

from openai import AzureOpenAI
from pathlib import Path

# Create an AzureOpenAI client
client = AzureOpenAI(
    azure_endpoint=YOUR_FOUNDRY_ENDPOINT,
    api_key=YOUR_FOUNDRY_KEY,
    api_version="2025-03-01-preview"
)

# Path for audio output file
speech_file_path = Path("output_speech.wav")

# Generate speech and save to file
with client.audio.speech.with_streaming_response.create(
            model=YOUR_MODEL_DEPLOYMENT,
            voice="alloy",
            input="This speech was AI-generated!",
            instructions="Speak in an upbeat, excited tone.",
    ) as response:
    response.stream_to_file(speech_file_path)

print(f"Speech generated and saved to {speech_file_path}")