Notatka
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Możesz sprawdzić jakość rozpoznawania niestandardowego modelu mowy. Możesz odtworzyć przekazany dźwięk i określić, czy podany wynik rozpoznawania jest poprawny. Po pomyślnym utworzeniu testu możesz zobaczyć, jak model transkrybował zestaw danych audio lub porównać wyniki z dwóch modeli obok siebie.
Testowanie modelu równoległego jest przydatne do sprawdzania, który model rozpoznawania mowy jest najlepszy dla aplikacji. Aby uzyskać obiektywną miarę dokładności, która wymaga podania zbiorów danych transkrypcji, zobacz Przetestuj model ilościowo.
Ważne
Podczas testowania system wykona transkrypcję. Należy pamiętać o tym, ponieważ ceny różnią się w zależności od oferty usług i poziomu subskrypcji. Aby uzyskać najnowsze informacje, zawsze zapoznaj się z oficjalnym cennikiem narzędzi Foundry Tools.
Tworzenie testu
Po przekazaniu plików danych szkoleniowych i testowych można utworzyć test.
W nowym portalu Microsoft Foundry nie utworzysz oddzielnego testu jakości. Walidacja jest uruchamiana automatycznie na podstawie zestawu danych, który określono w okienku Dane walidacji w kreatorze Dostrajanie modelu. Aby sprawdzić wyniki, zobacz Pobieranie wyników testu.
Postępuj zgodnie z tymi instrukcjami, aby utworzyć test:
Zaloguj się do programu Speech Studio.
Przejdź do usługi Speech Studio>Custom Speech i wybierz swoją nazwę projektu z listy.
Wybierz Modele testowe>Utwórz nowy test.
Wybierz pozycję Sprawdź jakość (dane tylko audio)>Dalej.
Wybierz zestaw danych audio, którego chcesz użyć do testowania, a następnie wybierz przycisk Dalej. Jeśli nie ma żadnych dostępnych zestawów danych, anuluj konfigurację, a następnie przejdź do menu Zestawy danych usługi Speech, aby przekazać zestawy danych.
Wybierz jeden lub dwa modele, aby ocenić i porównać dokładność.
Wprowadź nazwę testu i opis, a następnie wybierz przycisk Dalej.
Przejrzyj ustawienia, a następnie wybierz pozycję Zapisz i zamknij.
Przed kontynuowaniem upewnij się, że masz zainstalowany i skonfigurowany Speech CLI.
Aby utworzyć test, użyj spx csr evaluation create polecenia . Skonstruuj parametry żądania zgodnie z następującymi instrukcjami:
- Ustaw właściwość
projectna identyfikator istniejącego projektu. Zaleca się właściwośćproject, aby można było również zarządzać dostosowywaniem niestandardowej mowy w portalu Microsoft Foundry. Aby uzyskać identyfikator projektu, zobacz Pobieranie identyfikatora projektu dla dokumentacji interfejsu API REST . - Ustaw wymaganą
model1właściwość na identyfikator modelu, który chcesz przetestować. - Ustaw wymaganą
model2właściwość na identyfikator innego modelu, który chcesz przetestować. Jeśli nie chcesz porównywać dwóch modeli, użyj tego samego modelu dlamodel1imodel2. - Ustaw wymaganą
datasetwłaściwość na identyfikator zestawu danych, którego chcesz użyć na potrzeby testu. - Ustaw właściwość
language, w przeciwnym razie CLI usługi Mowa ustawia domyślnie wartość "en-US". Ten parametr powinien określać ustawienia regionalne zawartości zbioru danych. Nie można później zmienić ustawień regionalnych. Właściwośćlanguageinterfejsu wiersza polecenia usługi Mowa odpowiada właściwościlocalew żądaniu i odpowiedzi w formacie JSON. - Ustaw wymaganą
namewłaściwość. Ten parametr to nazwa wyświetlana w portalu Microsoft Foundry. Właściwośćnameinterfejsu wiersza polecenia usługi Mowa odpowiada właściwościdisplayNamew żądaniu i odpowiedzi w formacie JSON.
Oto przykładowe polecenie Speech CLI służące do utworzenia testu:
spx csr evaluation create --api-version v3.2 --project aaaabbbb-0000-cccc-1111-dddd2222eeee --dataset bbbbcccc-1111-dddd-2222-eeee3333ffff --model1 ccccdddd-2222-eeee-3333-ffff4444aaaa --model2 ccccdddd-2222-eeee-3333-ffff4444aaaa --name "My Inspection" --description "My Inspection Description"
Ważne
Musisz ustawić wartość --api-version v3.2. CLI Mowy używa interfejsu API REST, ale nie obsługuje jeszcze wersji nowszych niż v3.2.
Powinieneś otrzymać treść odpowiedzi w następującym formacie:
{
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/evaluations/ddddeeee-3333-ffff-4444-aaaa5555bbbb",
"model1": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/models/base/ccccdddd-2222-eeee-3333-ffff4444aaaa"
},
"model2": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/models/base/ccccdddd-2222-eeee-3333-ffff4444aaaa"
},
"dataset": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/datasets/bbbbcccc-1111-dddd-2222-eeee3333ffff"
},
"transcription2": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/transcriptions/eeeeffff-4444-aaaa-5555-bbbb6666cccc"
},
"transcription1": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/transcriptions/eeeeffff-4444-aaaa-5555-bbbb6666cccc"
},
"project": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/projects/aaaabbbb-0000-cccc-1111-dddd2222eeee"
},
"links": {
"files": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/evaluations/9c06d5b1-213f-4a16-9069-bc86efacdaac/files"
},
"properties": {
"wordErrorRate1": -1.0,
"sentenceErrorRate1": -1.0,
"sentenceCount1": -1,
"wordCount1": -1,
"correctWordCount1": -1,
"wordSubstitutionCount1": -1,
"wordDeletionCount1": -1,
"wordInsertionCount1": -1,
"wordErrorRate2": -1.0,
"sentenceErrorRate2": -1.0,
"sentenceCount2": -1,
"wordCount2": -1,
"correctWordCount2": -1,
"wordSubstitutionCount2": -1,
"wordDeletionCount2": -1,
"wordInsertionCount2": -1
},
"lastActionDateTime": "2024-07-14T21:21:39Z",
"status": "NotStarted",
"createdDateTime": "2024-07-14T21:21:39Z",
"locale": "en-US",
"displayName": "My Inspection",
"description": "My Inspection Description"
}
Właściwość najwyższego poziomu self w treści odpowiedzi to URI oceny. Użyj tego identyfikatora URI, aby uzyskać szczegółowe informacje o projekcie i wynikach testów. Ten identyfikator URI służy również do aktualizowania lub usuwania oceny.
Aby uzyskać pomoc dotyczącą ocen w interfejsie wiersza polecenia usługi Speech, uruchom następujące polecenie:
spx help csr evaluation
Aby utworzyć test, użyj operacji Evaluations_Create interfejsu Speech to text REST API. Skonstruuj treść żądania zgodnie z następującymi instrukcjami:
- Ustaw właściwość
projectna identyfikator istniejącego projektu. Zaleca się właściwośćproject, aby można było również zarządzać dostosowywaniem niestandardowej mowy w portalu Microsoft Foundry. Aby uzyskać identyfikator projektu, zobacz Pobieranie identyfikatora projektu dla dokumentacji interfejsu API REST . - Ustaw wymaganą właściwość
model1na adres URI modelu, który chcesz przetestować. - Ustaw wymaganą właściwość
model2na URI innego modelu, który chcesz przetestować. Jeśli nie chcesz porównywać dwóch modeli, użyj tego samego modelu dlamodel1imodel2. - Ustaw wartość wymaganej właściwości
datasetna identyfikator URI zestawu danych, którego chcesz użyć w teście. - Ustaw wymaganą
localewłaściwość. Ta właściwość powinna być ustawieniem regionalnym zawartości zestawu danych. Nie można później zmienić ustawień regionalnych. - Ustaw wymaganą
displayNamewłaściwość. Ta właściwość to nazwa wyświetlana w portalu Microsoft Foundry.
Utwórz żądanie HTTP POST przy użyciu identyfikatora URI, jak pokazano w poniższym przykładzie. Zastąp YourSpeechResoureKey kluczem zasobu usługi Speech, zastąp YourResourceName nazwą zasobu usługi Speech i ustaw właściwości treści żądania, jak opisano wcześniej.
curl -v -X POST -H "Ocp-Apim-Subscription-Key: YourSpeechResoureKey" -H "Content-Type: application/json" -d '{
"model1": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/models/ccccdddd-2222-eeee-3333-ffff4444aaaa"
},
"model2": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/models/base/ccccdddd-2222-eeee-3333-ffff4444aaaa"
},
"dataset": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/datasets/bbbbcccc-1111-dddd-2222-eeee3333ffff"
},
"project": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/projects/aaaabbbb-0000-cccc-1111-dddd2222eeee"
},
"displayName": "My Inspection",
"description": "My Inspection Description",
"locale": "en-US"
}' "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/evaluations"
Powinieneś otrzymać treść odpowiedzi w następującym formacie:
{
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/evaluations/ddddeeee-3333-ffff-4444-aaaa5555bbbb",
"model1": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/models/base/ccccdddd-2222-eeee-3333-ffff4444aaaa"
},
"model2": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/models/base/ccccdddd-2222-eeee-3333-ffff4444aaaa"
},
"dataset": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/datasets/bbbbcccc-1111-dddd-2222-eeee3333ffff"
},
"transcription2": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/transcriptions/eeeeffff-4444-aaaa-5555-bbbb6666cccc"
},
"transcription1": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/transcriptions/eeeeffff-4444-aaaa-5555-bbbb6666cccc"
},
"project": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/projects/aaaabbbb-0000-cccc-1111-dddd2222eeee"
},
"links": {
"files": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/evaluations/9c06d5b1-213f-4a16-9069-bc86efacdaac/files"
},
"properties": {
"wordErrorRate1": -1.0,
"sentenceErrorRate1": -1.0,
"sentenceCount1": -1,
"wordCount1": -1,
"correctWordCount1": -1,
"wordSubstitutionCount1": -1,
"wordDeletionCount1": -1,
"wordInsertionCount1": -1,
"wordErrorRate2": -1.0,
"sentenceErrorRate2": -1.0,
"sentenceCount2": -1,
"wordCount2": -1,
"correctWordCount2": -1,
"wordSubstitutionCount2": -1,
"wordDeletionCount2": -1,
"wordInsertionCount2": -1
},
"lastActionDateTime": "2024-07-14T21:21:39Z",
"status": "NotStarted",
"createdDateTime": "2024-07-14T21:21:39Z",
"locale": "en-US",
"displayName": "My Inspection",
"description": "My Inspection Description"
}
Właściwość najwyższego poziomu self w treści odpowiedzi to URI oceny. Użyj tego identyfikatora URI, aby uzyskać szczegółowe informacje o projekcie oceny i wynikach testu. Tego identyfikatora URI używa się również do aktualizowania lub usuwania oceny.
Uzyskiwanie wyników testu
Należy uzyskać wyniki testu i sprawdzić zestawy danych audio w porównaniu z wynikami transkrypcji dla każdego modelu.
Po zakończeniu szkolenia wybierz model niestandardowy, aby otworzyć stronę jego szczegółów, a następnie wybierz kartę Walidacje. Na podkarcie Szczegóły możesz odtworzyć dźwięk i porównać obok siebie rozpoznane transkrypcje oraz transkrypcje oznaczone przez człowieka.
Wykonaj następujące kroki, aby uzyskać wyniki testu:
- Zaloguj się do programu Speech Studio.
- Wybierz pozycję Mowa niestandardowa> Nazwa projektu >Modele testowe.
- Wybierz link według nazwy testu.
- Po zakończeniu testu, zgodnie ze stanem ustawionym na Powodzenie, powinny zostać wyświetlone wyniki zawierające numer WER dla każdego przetestowanego modelu.
Na tej stronie wymieniono wszystkie wypowiedzi w zestawie danych i wyniki rozpoznawania wraz z transkrypcją z przesłanego zestawu danych. Można przełączać różne typy błędów, w tym wstawiania, usuwania i zastępowania. Słuchając dźwięku i porównując wyniki rozpoznawania w każdej kolumnie, możesz zdecydować, który model spełnia Twoje potrzeby, i określić, gdzie wymagane jest więcej szkoleń i ulepszeń.
Przed kontynuowaniem upewnij się, że masz zainstalowany i skonfigurowany Speech CLI.
Aby uzyskać wyniki testu, użyj spx csr evaluation status polecenia . Skonstruuj parametry żądania zgodnie z następującymi instrukcjami:
- Ustaw wymaganą właściwość
evaluationna identyfikator oceny, aby uzyskać wyniki testu.
Oto przykładowe polecenie Speech CLI, które pobiera wyniki testów:
spx csr evaluation status --api-version v3.2 --evaluation ddddeeee-3333-ffff-4444-aaaa5555bbbb
Ważne
Musisz ustawić wartość --api-version v3.2. CLI Mowy używa interfejsu API REST, ale nie obsługuje jeszcze wersji nowszych niż v3.2.
Modele, zestaw danych audio, transkrypcje i więcej szczegółów są zwracane w treści odpowiedzi.
Powinieneś otrzymać treść odpowiedzi w następującym formacie:
{
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/evaluations/ddddeeee-3333-ffff-4444-aaaa5555bbbb",
"model1": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/models/base/ccccdddd-2222-eeee-3333-ffff4444aaaa"
},
"model2": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/models/base/ccccdddd-2222-eeee-3333-ffff4444aaaa"
},
"dataset": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/datasets/bbbbcccc-1111-dddd-2222-eeee3333ffff"
},
"transcription2": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/transcriptions/eeeeffff-4444-aaaa-5555-bbbb6666cccc"
},
"transcription1": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/transcriptions/eeeeffff-4444-aaaa-5555-bbbb6666cccc"
},
"project": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/projects/aaaabbbb-0000-cccc-1111-dddd2222eeee"
},
"links": {
"files": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/evaluations/9c06d5b1-213f-4a16-9069-bc86efacdaac/files"
},
"properties": {
"wordErrorRate1": 0.028900000000000002,
"sentenceErrorRate1": 0.667,
"tokenErrorRate1": 0.12119999999999999,
"sentenceCount1": 3,
"wordCount1": 173,
"correctWordCount1": 170,
"wordSubstitutionCount1": 2,
"wordDeletionCount1": 1,
"wordInsertionCount1": 2,
"tokenCount1": 165,
"correctTokenCount1": 145,
"tokenSubstitutionCount1": 10,
"tokenDeletionCount1": 1,
"tokenInsertionCount1": 9,
"tokenErrors1": {
"punctuation": {
"numberOfEdits": 4,
"percentageOfAllEdits": 20.0
},
"capitalization": {
"numberOfEdits": 2,
"percentageOfAllEdits": 10.0
},
"inverseTextNormalization": {
"numberOfEdits": 1,
"percentageOfAllEdits": 5.0
},
"lexical": {
"numberOfEdits": 12,
"percentageOfAllEdits": 12.0
},
"others": {
"numberOfEdits": 1,
"percentageOfAllEdits": 5.0
}
},
"wordErrorRate2": 0.028900000000000002,
"sentenceErrorRate2": 0.667,
"tokenErrorRate2": 0.12119999999999999,
"sentenceCount2": 3,
"wordCount2": 173,
"correctWordCount2": 170,
"wordSubstitutionCount2": 2,
"wordDeletionCount2": 1,
"wordInsertionCount2": 2,
"tokenCount2": 165,
"correctTokenCount2": 145,
"tokenSubstitutionCount2": 10,
"tokenDeletionCount2": 1,
"tokenInsertionCount2": 9,
"tokenErrors2": {
"punctuation": {
"numberOfEdits": 4,
"percentageOfAllEdits": 20.0
},
"capitalization": {
"numberOfEdits": 2,
"percentageOfAllEdits": 10.0
},
"inverseTextNormalization": {
"numberOfEdits": 1,
"percentageOfAllEdits": 5.0
},
"lexical": {
"numberOfEdits": 12,
"percentageOfAllEdits": 12.0
},
"others": {
"numberOfEdits": 1,
"percentageOfAllEdits": 5.0
}
}
},
"lastActionDateTime": "2024-07-14T21:22:45Z",
"status": "Succeeded",
"createdDateTime": "2024-07-14T21:21:39Z",
"locale": "en-US",
"displayName": "My Inspection",
"description": "My Inspection Description"
}
Aby uzyskać pomoc dotyczącą ocen w interfejsie wiersza polecenia usługi Speech, uruchom następujące polecenie:
spx help csr evaluation
Aby uzyskać wyniki testów, zacznij od użycia operacji Evaluations_Get interfejsu API REST usługi zamiany mowy na tekst.
Wykonaj żądanie HTTP GET, używając identyfikatora URI, jak pokazano w poniższym przykładzie. Zastąp YourEvaluationId swoim identyfikatorem oceny, YourSpeechResoureKey swoim kluczem zasobu usługi Speech, a YourResourceName swoją nazwą zasobu usługi Speech.
curl -v -X GET "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/evaluations/YourEvaluationId" -H "Ocp-Apim-Subscription-Key: YourSpeechResoureKey"
Modele, zestaw danych audio, transkrypcje i więcej szczegółów są zwracane w treści odpowiedzi.
Powinieneś otrzymać treść odpowiedzi w następującym formacie:
{
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/evaluations/ddddeeee-3333-ffff-4444-aaaa5555bbbb",
"model1": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/models/base/ccccdddd-2222-eeee-3333-ffff4444aaaa"
},
"model2": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/models/base/ccccdddd-2222-eeee-3333-ffff4444aaaa"
},
"dataset": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/datasets/bbbbcccc-1111-dddd-2222-eeee3333ffff"
},
"transcription2": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/transcriptions/eeeeffff-4444-aaaa-5555-bbbb6666cccc"
},
"transcription1": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/transcriptions/eeeeffff-4444-aaaa-5555-bbbb6666cccc"
},
"project": {
"self": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/projects/aaaabbbb-0000-cccc-1111-dddd2222eeee"
},
"links": {
"files": "https://YourResourceName.cognitiveservices.azure.com/speechtotext/v3.2/evaluations/9c06d5b1-213f-4a16-9069-bc86efacdaac/files"
},
"properties": {
"wordErrorRate1": 0.028900000000000002,
"sentenceErrorRate1": 0.667,
"tokenErrorRate1": 0.12119999999999999,
"sentenceCount1": 3,
"wordCount1": 173,
"correctWordCount1": 170,
"wordSubstitutionCount1": 2,
"wordDeletionCount1": 1,
"wordInsertionCount1": 2,
"tokenCount1": 165,
"correctTokenCount1": 145,
"tokenSubstitutionCount1": 10,
"tokenDeletionCount1": 1,
"tokenInsertionCount1": 9,
"tokenErrors1": {
"punctuation": {
"numberOfEdits": 4,
"percentageOfAllEdits": 20.0
},
"capitalization": {
"numberOfEdits": 2,
"percentageOfAllEdits": 10.0
},
"inverseTextNormalization": {
"numberOfEdits": 1,
"percentageOfAllEdits": 5.0
},
"lexical": {
"numberOfEdits": 12,
"percentageOfAllEdits": 12.0
},
"others": {
"numberOfEdits": 1,
"percentageOfAllEdits": 5.0
}
},
"wordErrorRate2": 0.028900000000000002,
"sentenceErrorRate2": 0.667,
"tokenErrorRate2": 0.12119999999999999,
"sentenceCount2": 3,
"wordCount2": 173,
"correctWordCount2": 170,
"wordSubstitutionCount2": 2,
"wordDeletionCount2": 1,
"wordInsertionCount2": 2,
"tokenCount2": 165,
"correctTokenCount2": 145,
"tokenSubstitutionCount2": 10,
"tokenDeletionCount2": 1,
"tokenInsertionCount2": 9,
"tokenErrors2": {
"punctuation": {
"numberOfEdits": 4,
"percentageOfAllEdits": 20.0
},
"capitalization": {
"numberOfEdits": 2,
"percentageOfAllEdits": 10.0
},
"inverseTextNormalization": {
"numberOfEdits": 1,
"percentageOfAllEdits": 5.0
},
"lexical": {
"numberOfEdits": 12,
"percentageOfAllEdits": 12.0
},
"others": {
"numberOfEdits": 1,
"percentageOfAllEdits": 5.0
}
}
},
"lastActionDateTime": "2024-07-14T21:22:45Z",
"status": "Succeeded",
"createdDateTime": "2024-07-14T21:21:39Z",
"locale": "en-US",
"displayName": "My Inspection",
"description": "My Inspection Description"
}
Porównanie transkrypcji z dźwiękiem
Możesz sprawdzić wyniki transkrypcji dla każdego przetestowanego modelu na tle wejściowego zbioru danych audio. Jeśli w teście dołączono dwa modele, możesz porównać ich jakość transkrypcji obok siebie.
Aby przejrzeć jakość transkrypcji:
- Zaloguj się do programu Speech Studio.
- Wybierz pozycję Mowa niestandardowa> Nazwa projektu >Modele testowe.
- Wybierz link według nazwy testu.
- Odtwarzaj plik audio podczas odczytywania przez model odpowiadającej mu transkrypcji.
Jeśli testowy zestaw danych zawierał wiele plików audio, w tabeli będzie widocznych wiele wierszy. W przypadku dołączenia dwóch modeli do testu transkrypcje są wyświetlane w kolumnach obok siebie. Różnice w transkrypcji między modelami są wyświetlane niebieską czcionką.
Przed kontynuowaniem upewnij się, że masz zainstalowany i skonfigurowany Speech CLI.
Testowy zestaw danych, transkrypcje i modele audio są zwracane w wynikach testu. Jeśli testowano tylko jeden model, wartość model1 odpowiada wartości model2, a wartość transcription1 odpowiada wartości transcription2.
Aby przejrzeć jakość transkrypcji:
- Pobierz zestaw danych testowych audio, chyba że masz już kopię.
- Pobierz transkrypcje wyjściowe.
- Odtwarzaj plik audio podczas odczytywania przez model odpowiadającej mu transkrypcji.
Jeśli porównujesz jakość między dwoma modelami, zwróć szczególną uwagę na różnice między transkrypcjami poszczególnych modeli.
Testowy zestaw danych, transkrypcje i modele audio są zwracane w wynikach testu. Jeśli testowano tylko jeden model, wartość model1 odpowiada wartości model2, a wartość transcription1 odpowiada wartości transcription2.
Aby przejrzeć jakość transkrypcji:
- Pobierz zestaw danych testowych audio, chyba że masz już kopię.
- Pobierz transkrypcje wyjściowe.
- Odtwarzaj plik audio podczas odczytywania przez model odpowiadającej mu transkrypcji.
Jeśli porównujesz jakość między dwoma modelami, zwróć szczególną uwagę na różnice między transkrypcjami poszczególnych modeli.