סיכום
עצה
עיין בכרטיסייה טקסט ותמונות לפרטים נוספים!
מודול זה מציג את זיהוי הדיבור (דיבור לטקסט) כבסיס ליישומים וסוכנים המופעלים בקול. הלומדים חוקרים כיצד אודיו מדובר נקלט ממיקרופון או קובץ אודיו ומומר לטקסט כתוב באמצעות Azure Speech. המודול מסביר היכן הדיבור לטקסט משתלב באפליקציה—בין אם באפליקציית לקוח או בשירות backend—ומדגיש תרחישים נפוצים כמו תמלול חי, כתוביות, עיבוד תא קולי ומתן קלט טקסט לסוכני בינה מלאכותית.
המודול עוסק לאחר מכן בסינתזת דיבור (טקסט לדיבור), שמאפשרת ליישומים ליצור אודיו דיבורי בעל צליל טבעי מתוך טקסט. הלומדים רואים כיצד Azure Speech משתמשת בקולות עצביים כדי לשלוט בהגייה, בטון, במהירות ובגובה הצליל, וכיצד ניתן להשמיע קול מסונתז מיד או לשמור לשימוש מאוחר יותר. סעיף זה מדגיש כיצד טקסט לדיבור מאפשר ליישומים ולסוכנים להגיב בקול, ולשפר נגישות, אינטראקציה ללא ידיים וחוויית משתמש כוללת.
לבסוף, המודול משלב את היכולות הללו עם דיבור לדיבור באמצעות Voice Live. הלומדים מגלים כיצד Voice Live משלב דיבור לטקסט, הסקת בינה מלאכותית וטקסט לדיבור לשירות אחד מנוהל לחלוטין לשיחות בזמן אמת. במקום לחבר רכיבים מרובים, מפתחים יכולים להשתמש ב-Voice Live כדי לבנות סוכני קול מגיבים וטבעיים שיכולים להקשיב, לחשוב ולדבר—מה שמקל על יצירת חוויות שיחה מוכנות לייצור עם Azure Speech ו-Microsoft Foundry.
השתמשו בקישורים למטה כדי ללמוד עוד.
- Azure Speech in the service documentation
- למדו עוד על ערכות פיתוח התוכנה (SDKs) של Azure Speech
- למידע נוסף על Azure Speech - Voice Live בתיעוד