Posouzení výslovnosti v sadě Speech Studio

Hodnocení výslovnosti používá funkci Převod řeči na text k poskytování subjektivní a objektivní zpětné vazby pro žáky jazyka. Cvičení výslovnosti a včasné zpětné vazby jsou nezbytné pro zlepšení jazykových dovedností. Hodnocení založená zkušenými učiteli mohou zabrat mnoho času a úsilí a vysoce kvalitní hodnocení pro žáky. Hodnocení výslovnosti může pomoct, aby bylo hodnocení jazyka poutavější a přístupnější pro žáky všech pozadí.

Poznámka:

Informace o dostupnosti hodnocení výslovnosti najdete v podporovaných jazycích a dostupných oblastech.

Tento článek popisuje, jak používat nástroj pro posouzení výslovnosti bez psaní kódu prostřednictvím sady Speech Studio. Informace o tom, jak integrovat hodnocení výslovnosti v aplikacích pro řeč, najdete v tématu Jak používat hodnocení výslovnosti.

Kromě standardních skóre přesnosti, plynulosti a úplnosti zahrnuje funkce hodnocení výslovnosti v sadě Speech Studio komplexní skóre, která poskytují podrobnou zpětnou vazbu k různým aspektům výkonu řeči a porozumění. Vylepšené skóre jsou následující: skóre prosody, skóre slovníku, skóre gramatiky a skóre tématu. Tato skóre nabízejí cenné přehledy o prosody řeči, použití slovníku, správnosti gramatiky a porozumění tématům.

Screenshot of overall pronunciation score and overall content score on Speech Studio.

V dolní části výsledku posouzení se zobrazí dvě celkové skóre: výslovnost a skóre obsahu. Na kartě Čtení najdete zobrazené skóre výslovnosti. Na kartě Mluvení se zobrazí skóre výslovnosti i skóre obsahu.

Skóre výslovnosti: Toto skóre představuje agregované hodnocení kvality výslovnosti a zahrnuje čtyři podspekty. Tato skóre jsou k dispozici na kartách pro čtení i mluvení pro skriptovaná i neoznamovaná hodnocení.

  • Skóre přesnosti: Vyhodnotí správnost výslovnosti.
  • Skóre plynulosti: Měří úroveň plynulosti a přirozeného chování řeči.
  • Skóre úplnosti: Reflexe počet slov se správně vyslovuje.
  • Skóre prosody: Vyhodnotí použití vhodné intonace, rytmu a stresu. Zavádí se několik dalších typů chyb souvisejících s posouzením prosody, například Neočekávaný konec, Chybějící konec a Monotone. Tyto typy chyb poskytují podrobnější informace o výslovnostech v porovnání s předchozím modulem.

Skóre obsahu: Toto skóre poskytuje agregované hodnocení obsahu řeči a zahrnuje tři podspekty. Toto skóre je k dispozici pouze na kartě mluvení pro neoznačené hodnocení.

  • Skóre slovníku: Vyhodnocuje efektivní použití slov a jejich vhodnost v daném kontextu k přesnému vyjádření myšlenek a úrovně lexikální složitosti.
  • Skóre gramatiky: Vyhodnotí správnost použití gramatiky a různé vzory vět. Bere v úvahu lexikální přesnost, gramatickou přesnost a rozmanitost struktur vět a poskytuje komplexnější hodnocení jazykové odbornosti.
  • Skóre tématu: Vyhodnocuje úroveň porozumění a zapojení s tématem probíraným ve řeči. Vyhodnotí schopnost mluvčího efektivně vyjádřit myšlenky a nápady související s daným tématem.

Tato celková skóre nabízejí komplexní hodnocení výslovnosti i obsahu, které poskytuje posluchačům cennou zpětnou vazbu o různých aspektech výkonu a porozumění řeči. Díky těmto vylepšeným funkcím mohou studenti jazyků získat hlubší přehled o svých výhodách a oblastech pro zlepšení výslovnosti i výrazu obsahu.

Poznámka:

Hodnocení obsahu a prosody jsou k dispozici pouze v národním prostředí en-US .

Ceny

Jako směrný plán stojí využití hodnocení výslovnosti stejné jako převod řeči na text pro průběžné platby nebo ceny úrovně závazku. Pokud si koupíte úroveň závazku pro převod řeči na text, útrata za vyhodnocení výslovnosti se dostane ke splnění závazku.

Funkce hodnocení výslovnosti také nabízí další skóre, která nejsou zahrnutá v ceně základní řeči na text: prosody, gramatika, téma a slovní zásoba. Tato skóre jsou k dispozici jako doplňkové poplatky nad základní řeč na textovou cenu. Informace o cenách najdete v tématu o cenách převodu řeči na text.

Tady je tabulka dostupných skóre hodnocení výslovnosti, ať už je dostupná ve skriptovaných nebo neoznačeném hodnocení a jestli je zahrnutá do směrného plánu řeči na textovou cenu nebo doplňkovou cenu.

Skóre Skriptované nebo neoznačené Zahrnuté do směrného plánu řeči na textovou cenu?
Přesnost Skriptované a neoznačené Ano
Plynulost Skriptované a neoznačené Ano
Úplnost Scénář Ano
Miscue Skriptované a neoznačené Ano
Prozódie Skriptované a neoznačené No
Gramatika Pouze bez popisů No
Téma Pouze bez popisů No
Slovní zásobu Pouze bez popisů No

Vyzkoušení posouzení výslovnosti

Hodnocení výslovnosti můžete prozkoumat a vyzkoušet i bez přihlášení.

Tip

Pokud chcete vyhodnotit více než 5 sekund řeči pomocí vlastního skriptu, přihlaste se pomocí účtu Azure a použijte svůj prostředek služby Speech.

Členitost hodnocení výslovnosti

Posouzení výslovnosti poskytuje různé výsledky posouzení různých podrobností, od jednotlivých fonémů až po celý textový vstup.

  • Na úrovni fulltextu nabízí hodnocení výslovnosti další skóre Fluency, Completeness a Prosody: Fluency označuje, jak přesně řeč odpovídá použití tichých konců mezi slovy rodilého mluvčího; Úplnost označuje, kolik slov se v řeči vyslovuje pro odkazované textové zadání; Prosody označuje, jak dobře mluvčí vyjadřuje prvky přirozeného, výraznosti a celkové prosody ve své řeči. Celkové skóre agregované z přesnosti, plynulosti, úplnosti a prosody je pak dáno k označení celkové kvality výslovnosti dané řeči. Hodnocení výslovnosti také nabízí skóre obsahu (slovník, gramatika a téma) na úrovni fulltextu.
  • Na úrovni slova může posouzení výslovnosti automaticky rozpoznat chybné vzorce a současně poskytovat skóre přesnosti, což poskytuje podrobnější informace o vynechání, opakování, vložení a chybné výslovnosti v daném řeči.
  • Skóre přesnosti na úrovni slabiky jsou aktuálně k dispozici prostřednictvím souboru JSON nebo sady Speech SDK.
  • Na úrovni výslovnosti výslovnost poskytuje skóre přesnosti každého fonemu, což pomáhá naučit se lépe porozumět podrobnostem výslovnosti jejich řeči.

Scénáře čtení a mluvení

Pro hodnocení výslovnosti existují dva scénáře: čtení a mluvení.

  • Čtení: Tento scénář je určený pro skriptované posouzení. Vyžaduje, aby si studenti přečetli daný text. Referenční text je k dispozici předem.
  • Mluvení: Tento scénář je určený pro neskriptované hodnocení. Vyžaduje, aby studenti mluvili o daném tématu. Referenční text není k dispozici předem.

Provedení skriptovaného posouzení

Pokud chcete vyhodnotit výslovnost referenčního textu, postupujte takto:

  1. V sadě Speech Studio přejděte na Posouzení výslovnosti.

    Screenshot of how to go to Pronunciation Assessment on Speech Studio.

  2. Na kartě Čtení zvolte podporovaný jazyk , který chcete vyhodnocovat výslovnost.

    Screenshot of choosing a supported language on reading tab that you want to evaluate the pronunciation.

  3. Můžete použít zřízené textové ukázky nebo zadat vlastní skript.

    Při čtení textu byste měli být blízko mikrofonu, abyste měli jistotu, že nahraný hlas není příliš nízký.

    Screenshot of where to record audio with a microphone on reading tab.

    V opačném případě můžete nahrát nahraný zvuk pro hodnocení výslovnosti. Po úspěšném nahrání se zvuk automaticky vyhodnotí systémem, jak je znázorněno na následujícím snímku obrazovky.

    Screenshot of uploading recorded audio to be assessed.

Provedení neoznačeného posouzení

Pokud chcete provést neoznačené hodnocení, vyberte kartu Mluvení. Tato funkce umožňuje provádět neoznačené hodnocení bez nutnosti předem poskytovat referenční text. Tady je postup, jak pokračovat:

  1. V sadě Speech Studio přejděte na Posouzení výslovnosti.

  2. Na kartě Mluvení zvolte podporovaný jazyk , který chcete vyhodnocovat výslovnost.

    Screenshot of choosing a supported language on speaking tab that you want to evaluate the pronunciation.

  3. Dále si můžete vybrat z ukázkových témat nebo zadat vlastní téma. Tato volba umožňuje vyhodnotit schopnost mluvit na daném předmětu bez předdefinovaného skriptu.

    Screenshot of inputting a topic on speaking tab to assess your ability to speak on a given subject without a predefined script.

    Při nahrávání řeči pro hodnocení výslovnosti je důležité zajistit, aby čas nahrávání spadá do doporučeného rozsahu 15 sekund (odpovídá více než 50 slovům) až 10 minut. Tento časový rozsah je optimální pro přesné vyhodnocení obsahu řeči. Pokud chcete získat skóre tématu, mluvený zvuk by měl obsahovat aspoň tři věty.

    Můžete také nahrát nahraný zvuk pro hodnocení výslovnosti. Po úspěšném nahrání se zvuk automaticky vyhodnotí systémem.

Výsledky vyhodnocení výslovnosti

Po nahrání řeči nebo nahrání nahraného zvuku se výsledek posouzení zobrazí jako výstup . Výsledek zahrnuje mluvený zvuk a zpětnou vazbu k posouzení řeči. V případě potřeby si můžete poslechnout mluvený zvuk a stáhnout ho.

Můžete také zkontrolovat výsledek vyhodnocení výslovnosti ve formátu JSON. Skóre přesnosti na úrovni slova, slabiky a foonemu jsou součástí souboru JSON.

Screenshot of showing the assessment result on the display window, which includes transcript and feedback on your speech.

Kompletní přepis se zobrazí v okně Zobrazení . Slovo je zvýrazněno podle typu chyby. Typy chyb v hodnocení výslovnosti jsou reprezentovány různými barvami. Toto vizuální rozlišení usnadňuje identifikaci a analýzu konkrétních chyb. Poskytuje jasný přehled typů chyb a frekvencí v mluveném zvuku a pomáhá soustředit se na oblasti, které potřebují zlepšit. Jednotlivé typy chyb můžete zapnout nebo vypnout, abyste se mohli zaměřit na konkrétní typy chyb nebo vyloučit určité typy ze zobrazení. Tato funkce poskytuje flexibilitu při kontrole a analýze chyb v mluveném zvuku. Při najetí myší na každé slovo můžete zobrazit skóre přesnosti pro celé slovo nebo konkrétní fonely.

V dolní části výsledku posouzení se zobrazí výsledky vyhodnocování. Pro vyhodnocování výslovnosti skriptu je k dispozici pouze skóre výslovnosti (včetně skóre přesnosti, skóre fluency, skóre úplnosti a skóre prosody). U vyhodnocení výslovnosti bez popisků se zobrazí skóre výslovnosti (včetně skóre přesnosti, skóre fluency a skóre prosody) a skóre obsahu (včetně skóre slovníku, gramatického skóre a skóre tématu).

Hodnocení skóre v režimu streamování

Posouzení výslovnosti podporuje nepřerušený režim streamování. Ukázka sady Speech Studio umožňuje po dobu až 60 minut nahrávání v režimu streamování pro vyhodnocení. Pokud nestisknete tlačítko zastavit nahrávání, proces vyhodnocení se nedokončí a hodnocení můžete pohodlně pozastavit a pokračovat v hodnocení.

Posouzení výslovnosti vyhodnocuje několik aspektů výslovnosti. V dolní části výsledku posouzení můžete zobrazit skóre výslovnosti jako agregované celkové skóre, které zahrnuje 4 dílčí aspekty: skóre přesnosti, skóre fluency, skóre úplnosti a skóre Prosody. V režimu streamování se vzhledem k tomu, že skóre přesnosti, skóre fluency a skóre Prosody se v průběhu času v průběhu celého procesu nahrávání liší, ukážeme v nástroji Speech Studio přístup k zobrazení přibližného celkového skóre přírůstkově před koncem vyhodnocení, které se vážila pouze s skóre přesnosti, skóre fluency a skóre Prosody. Skóre úplnosti se počítá pouze na konci vyhodnocení po stisknutí tlačítka stop, takže konečné výslovnost se agreguje z skóre přesnosti, skóre fluency, completeness a skóre Prosody s hmotností.

Celý proces vyhodnocení výslovnosti v režimu streamování najdete v níže uvedených ukázkových příkladech.

Zahájení nahrávání

Při zahájení nahrávání se skóre v dolní části začnou měnit od 0.

Screenshot of overall assessment scores when starting to record.

Během nahrávání

Během nahrávání dlouhého odstavce můžete nahrávání kdykoli pozastavit. Nahrávání můžete dál vyhodnocovat, dokud nestisknete tlačítko Zastavit.

Screenshot of overall assessment scores when recording.

Dokončení nahrávání

Po stisknutí tlačítka stop se v dolní části zobrazí skóre výslovnosti, skóre přesnosti, skóre fluency, skóre dokončení a skóre Prosody.

Screenshot of overall assessment scores after recording.

Zodpovědná AI

Systém AI zahrnuje nejen technologii, ale také lidi, kteří ho používají, osoby, které ho budou ovlivněny, a prostředí, ve kterém je nasazené. Přečtěte si poznámky k transparentnosti a seznamte se s zodpovědným používáním a nasazením umělé inteligence ve vašich systémech.

Další kroky