Anpassen eines Sprachmodells mit Azure AI Video Indexer

Artikel
10/09/2024

Azure AI Video Indexer unterstützt die automatische Spracherkennung durch Integration in den benutzerdefinierten Microsoft-Sprachdienst. Sie können das Sprachmodell anpassen, indem Sie Anpassungstext hochladen. Dieser Text stammt aus der Domäne, deren Vokabular Sie für die Anpassung des Moduls verwenden möchten. Sobald Sie Ihr Modell trainieren, werden neue Wörter erkannt, die im Anpassungstext angezeigt werden, vorausgesetzt, die Standardaussprache wird vorausgesetzt, und das Sprachmodell lernt neue wahrscheinliche Abfolgen von Wörtern. Sehen Sie sich die Liste der unterstützten Sprachen von Azure AI Video Indexer in unterstützten Sprachen an.

Beispielsweise ist "Kubernetes" (im Kontext des Azure Kubernetes-Diensts) ein Wort, das sehr spezifisch ist. Da das Wort neu bei Azure AI Video Indexer ist, wird es als "Communitys" erkannt. Trainieren Sie das Modell, um es als "Kubernetes" zu erkennen. In anderen Fällen sind die Wörter vorhanden, aber das Sprachmodell erwartet nicht, dass sie in einem bestimmten Kontext angezeigt werden. Beispielsweise ist "Containerdienst" keine 2-Wort-Sequenz, die ein nicht spezielles Sprachmodell als eine bestimmte Gruppe von Wörtern erkennt.

Es gibt zwei Möglichkeiten zum Anpassen eines Sprachmodells:

Option 1: Bearbeiten Sie das Transkript, das von Azure AI Video Indexer generiert wurde. Indem Sie das Transkript bearbeiten und korrigieren, trainieren Sie ein Sprachmodell, um in Zukunft verbesserte Ergebnisse bereitzustellen.
Option 2: Hochladen von Textdateien zum Trainieren des Sprachmodells. Die Datei kann entweder eine Liste von Wörtern enthalten, wie sie im Videoindexer-Transkript angezeigt werden sollen, oder die relevanten Wörter, die natürlich in Sätzen und Absätzen enthalten sind. Da mit dem letztgenannten Ansatz bessere Ergebnisse erzielt werden, wird empfohlen, dass die Uploaddatei vollständige Sätze oder Absätze im Zusammenhang mit Ihrem Inhalt enthält.

Wichtig

Schließen Sie die Wörter oder Sätze nicht wie aktuell falsch transkribiert (z. B. "Communitys") in die Uploaddatei ein, da dadurch die beabsichtigte Auswirkung nicht aufgehoben wird. Schließen Sie Wörter nur so ein, wie sie angezeigt werden sollen (z. B. als „Kubernetes“).

Optimieren Des benutzerdefinierten Sprachmodells

Azure AI Video Indexer lernt basierend auf Der Wahrscheinlichkeit von Wortkombinationen, um am besten zu lernen:

Geben Sie eine ausreichende Zahl von Beispielsätzen an, wie sie in der Realität ausgesprochen werden.
Geben Sie pro Zeile nur einen Satz an. Andernfalls erlernt das System satzübergreifende Wahrscheinlichkeiten.
Es ist in Ordnung, ein Wort als Satz zu setzen, um das Wort gegen andere zu erhöhen, aber das System lernt am besten aus vollen Sätzen.
Geben Sie beim Hinzufügen neuer Wörter oder Akronyme nach Möglichkeit ebenso viele Beispiele für die Nutzung in einem vollständigen Satz an, damit das System über möglichst viel Kontext verfügt.
Probieren Sie mehrere Anpassungsoptionen aus, um zu ermitteln, welche für Sie gut funktionieren.
Vermeiden Sie es, identische Sätze mehrfach anzugeben. Dies kann dazu führen, dass diese Sätze gegenüber den restlichen Eingaben ein höheres Gewicht erhalten.
Vermeiden Sie ungewöhnliche Symbole (~, # @ % &), da sie verworfen werden. Auch die Sätze, in denen die Symbole vorkommen, werden verworfen.
Vermeiden Sie zu umfangreiche Eingaben, z.B. Hunderte oder Tausende von Sätzen, weil sonst der Verstärkungseffekt abgeschwächt wird.

Voraussetzungen

Ein Azure-Konto
Ein Azure AI Video Indexer-Konto

Web portal (Webportal)
API

Erstellen eines Sprachmodells

Wechseln Sie zur Azure AI Video Indexer-Website , und melden Sie sich an.
Um ein Modell in Ihrem Konto anzupassen, wählen Sie links auf der Seite die Schaltfläche Anpassung des Inhaltsmodells aus.
Wählen Sie die Registerkarte "Sprache " aus. Es wird eine Liste der unterstützten Sprachen angezeigt.
Nach dem Auswählen der gewünschten Sprache wählen Sie Modell hinzufügen aus.
Geben Sie den Namen für das Sprachmodell ein, und drücken Sie die EINGABETASTE. Damit wird das Modell erstellt, und das Hochladen von Textdateien in das Modell wird möglich.
Wählen Sie Datei hinzufügen aus, um eine Textdatei hinzuzufügen. Ihr Datei-Explorer wird geöffnet.
Navigieren Sie zur Textdatei, und wählen Sie diese aus. Sie können einem Sprachmodell mehrere Textdateien hinzufügen. Sie können auch eine Textdatei hinzufügen, indem Sie auf der rechten Seite des Sprachmodells die Schaltfläche "..." auswählen und dann "Datei hinzufügen" auswählen.
Nachdem Sie die Textdateien hochgeladen haben, wählen Sie die grüne Option Trainieren aus.

Der Trainingsprozess kann einige Minuten dauern. Sobald die Schulung abgeschlossen ist, wird "Trained " neben dem Modell angezeigt. Sie können für die Datei eine Vorschau anzeigen, sie herunterladen und aus dem Modell löschen.

Verwenden eines Sprachmodells in einem neuen Video

Führen Sie eine der folgenden Aktionen aus, um Ihr Sprachmodell in einem neuen Video zu verwenden:

Wählen Sie die Schaltfläche Hochladen oben auf der Seite aus.
Legen Sie Ihre Audio- oder Videodatei ab, oder suchen Sie nach Ihrer Datei.
Wählen Sie ein Von Ihnen erstelltes Sprachmodell aus der Dropdownliste " Videoquellsprache " aus.
Wählen Sie unten auf der Seite die Option Hochladen aus, und Ihr neues Video wird mithilfe des Sprachmodells indiziert.

Verwenden eines Sprachmodells zum Erneuten Indizieren

Melden Sie sich bei der Azure AI Video Indexer-Startseite an.
Klicken Sie im Video auf die ...-Schaltfläche, und wählen Sie Neu indizieren aus.
Wählen Sie die Dropdownliste "Videoquellsprache " aus, und wählen Sie ein Von Ihnen erstelltes Sprachmodell aus der Liste aus.
Wählen Sie die Schaltfläche "Neu indizieren " aus, und Ihr Video wird mithilfe Ihres Sprachmodells neu indiziert.

Bearbeiten eines Sprachmodells

Sie können ein Sprachmodell bearbeiten, indem Sie dessen Namen ändern, Dateien hinzufügen und Dateien daraus löschen. Wenn Sie Dateien aus dem Sprachmodell hinzufügen oder löschen, müssen Sie das Modell erneut trainieren, indem Sie die grüne Option "Trainieren " auswählen.

Umbenennen des Sprachmodells

Sie können den Namen des Sprachmodells ändern, indem Sie auf der rechten Seite des Sprachmodells die Auslassungspunkte (...) auswählen und "Umbenennen" auswählen. Geben Sie den neuen Namen ein.

Dateien hinzufügen

Wählen Sie Datei hinzufügen aus. Ihr Datei-Explorer wird geöffnet.
Navigieren Sie zur Textdatei, und wählen Sie diese aus. Sie können einem Sprachmodell mehrere Textdateien hinzufügen.

Sie können auch eine Textdatei hinzufügen, indem Sie auf der rechten Seite des Sprachmodells die Schaltfläche mit den Auslassungspunkten (...) auswählen und "Datei hinzufügen" auswählen.

Dateien löschen

Mit dieser Aktion wird die Datei vollständig aus dem Sprachmodell entfernt.

Wählen Sie auf der rechten Seite der Textdatei die Auslassungspunkte (...) aus.
Klicken Sie auf Löschen. Ein neues Fenster mit der Mitteilung, dass die Löschung nicht rückgängig gemacht werden kann, wird geöffnet.
Wählen Sie die Option Löschen in dem neuen Fenster aus.

Löschen eines Sprachmodells

Mit dieser Aktion wird das Sprachmodell vollständig aus Ihrem Konto entfernt. Jedes Video, das das deletedlLanguage-Modell verwendet hat, behält den gleichen Index bei, bis Sie das Video neu indizieren. Wenn Sie das Video neu indizieren, können Sie dem Video ein neues Sprachmodell zuweisen. Andernfalls verwendet Azure AI Video Indexer sein Standardmodell, um das Video neu zu indizieren.

Wählen Sie die Auslassungspunkte (...) auf der rechten Seite des Sprachmodells aus.
Klicken Sie auf Löschen. Ein neues Fenster mit der Mitteilung, dass die Löschung nicht rückgängig gemacht werden kann, wird geöffnet.
Wählen Sie die Option Löschen in dem neuen Fenster aus.

Anpassen von Sprachmodellen durch Korrigieren von Transkriptionen

Azure AI Video Indexer passt Sprachmodelle basierend auf den tatsächlichen Korrekturen an den Transkriptionen ihrer Videos an. Es erfasst alle Zeilen, die Sie in der Transkription Ihres Videos korrigiert haben, und fügt sie zu einer Textdatei hinzu, die aufgerufen wird From transcript edits. Diese Bearbeitungen werden verwendet, um das Sprachmodell neu zu trainieren, das zum Indizieren des Videos verwendet wurde.

Bearbeitungen, die auf der Zeitachse des Widgets vorgenommen wurden, sind ebenfalls enthalten.

Wenn Sie beim Indizieren dieses Videos kein Sprachmodell angegeben haben, werden alle Bearbeitungen für dieses Video in einem Standardsprachenmodell gespeichert, das in der erkannten Sprache des Videos aufgerufen Account adaptations wird.

Falls mehrere Bearbeitungen an derselben Zeile vorgenommen wurden, wird nur die letzte Version der korrigierten Zeile zum Aktualisieren des Sprachmodells verwendet.

Hinweis

Für die Anpassung werden nur Textkorrekturen verwendet. Korrekturen, die keine eigentlichen Wörter beinhalten (z. B. Satzzeichen oder Leerzeichen), werden nicht berücksichtigt.

Wählen Sie das Video aus, das Sie aus Ihrer Bibliothek bearbeiten möchten.
Wählen Sie die Registerkarte Zeitachse.
Wählen Sie das Stiftsymbol aus, um das Transkript Ihrer Transkription zu bearbeiten.
Auf der Registerkarte "Sprache" auf der Seite "Con Zelt-Modus lanpassung" werden Transkriptkorrekturen angezeigt. Um die Datei „Aus Transkriptbearbeitungen“ für jedes Ihrer Sprachmodelle anzusehen, wählen Sie sie aus, um sie zu öffnen.

Erstellen eines Sprachmodells

Die Anforderung zum Erstellen eines Sprachmodells erstellt ein neues benutzerdefiniertes Sprachmodell für das angegebene Konto. Sie können Dateien für das Sprachmodell mithilfe dieser Anforderung hochladen. Alternativ können Sie hier das Sprachmodell erstellen und Dateien für das Modell später hochladen, indem Sie das Sprachmodell aktualisieren.

Sie müssen Dateien im Textkörper mithilfe von FormData hochladen, zusätzlich zu den Werten für die erforderlichen Parameter. Es gibt zwei Möglichkeiten, das Schlüsselpaar für diese Aufgabe zu definieren:

Der Schlüssel ist der Dateiname und der Wert der TXT-Datei.
Der Schlüssel ist der Dateiname und der Wert eine URL zu txt-Datei.

Hinweis

Sie müssen das Modell mit seinen aktivierten Dateien weiterhin trainieren, damit das Modell den Inhalt seiner Dateien erlernen kann.

Beispielantwort

{
    "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
    "name": "TestModel",
    "language": "En-US",
    "state": "None",
    "languageModelId": "00000000-0000-0000-0000-000000000000",
    "files": [
    {
        "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.6733333"
    },
    {
        "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
        "name": "worldfile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.86"
    }
    ]
}

Trainieren eines Sprachmodells

Die Anforderung "Sprache trainieren" trainiert ein benutzerdefiniertes Sprachmodell für das angegebene Konto mit dem Inhalt der hochgeladenen und aktivierten Dateien im Sprachmodell.

Hinweis

Sie müssen zuerst das Sprachmodell erstellen und die zugehörigen Dateien hochladen. Sie können Dateien hochladen, wenn Sie das Sprachmodell erstellen oder das Sprachmodell aktualisieren.

Beispielantwort

{
    "id": "41464adf-e432-42b1-8e09-f52905d7e29d",
    "name": "TestModel",
    "language": "En-US",
    "state": "Waiting",
    "languageModelId": "531e5745-681d-4e1d-b124-12e5ab57a891",
    "files": [
    {
        "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
        "name": "RenamedFile",
        "enable": false,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.5233333"
    },
    {
        "id": "9ac35b4b-1381-49c4-9fe4-8234bfdd0f50",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.68"
    }
    ]
}

Dies id ist eine eindeutige ID, die verwendet wird, um zwischen Sprachmodellen zu unterscheiden, während languageModelId sowohl zum Hochladen eines Videos zum Indizieren als auch zum Erneuten Indizieren einer Videoanforderungen (auch bekannt als linguisticModelId Azure AI Video Indexer Upload/Reindex-Anforderungen) verwendet wird.

Löschen eines Sprachmodells

Die Delete Language Model-Anforderung löscht ein benutzerdefiniertes Sprachmodell aus dem angegebenen Konto. Jedes Video, das das gelöschte Sprachmodell verwendet hat, behält den gleichen Index bei, bis Sie das Video neu indizieren. Wenn Sie das Video erneut indizieren, können Sie dem Video ein neues Sprachmodell zuweisen. Andernfalls verwendet Azure AI Video Indexer sein Standardmodell, um das Video neu zu indizieren.

Beispielantwort

Es gibt keinen zurückgegebenen Inhalt, wenn das Sprachmodell erfolgreich gelöscht wird.

Aktualisieren eines Sprachmodells

Die Anforderung zum Aktualisieren des Sprachmodells aktualisiert ein benutzerdefiniertes Sprachpersonsmodell im angegebenen Konto.

Hinweis

Sie müssen das Sprachmodell bereits erstellt haben. Mit diesem Aufruf können Sie alle Dateien im Modell aktivieren oder deaktivieren, den Namen des Sprachmodells aktualisieren und Dateien hochladen, die dem Sprachmodell hinzugefügt werden sollen.

Um Dateien hochzuladen, die dem Sprachmodell hinzugefügt werden sollen, müssen Sie Dateien im Textkörper mithilfe von FormData hochladen, zusätzlich zu den Werten für die oben genannten erforderlichen Parameter. Hierfür gibt es zwei Möglichkeiten:

Der Schlüssel ist der Dateiname und der Wert der TXT-Datei.
Der Schlüssel ist der Dateiname und der Wert eine URL zu txt-Datei.

Beispielantwort

{
    "id": "41464adf-e432-42b1-8e09-f52905d7e29d",
    "name": "TestModel",
    "language": "En-US",
    "state": "Waiting",
    "languageModelId": "531e5745-681d-4e1d-b124-12e5ab57a891",
    "files": [
    {
        "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
        "name": "RenamedFile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.5233333"
    },
    {
        "id": "9ac35b4b-1381-49c4-9fe4-8234bfdd0f50",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.68"
    }
    ]
}

Verwenden Sie die id der in der Antwort zurückgegebenen Dateien, um den Inhalt der Datei herunterzuladen.

Aktualisieren einer Datei aus einem Sprachmodell

Mit der Dateianforderung "Sprachmodell aktualisieren" können Sie den Namen und enable den Status einer Datei in einem benutzerdefinierten Sprachmodell im angegebenen Konto aktualisieren.

Beispielantwort

{
  "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
  "name": "RenamedFile",
  "enable": false,
  "creator": "John Doe",
  "creationTime": "2018-04-27T20:10:10.5233333"
}

Verwenden Sie die id der in der Antwort zurückgegebenen Datei, um den Inhalt der Datei herunterzuladen.

Abrufen eines bestimmten Sprachmodells

Die Get Language Model-Anforderung gibt Informationen zum angegebenen Sprachmodell im angegebenen Konto zurück, z. B. Sprache und die Dateien, die sich im Sprachmodell befinden.

Beispielantwort

{
    "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
    "name": "TestModel",
    "language": "En-US",
    "state": "None",
    "languageModelId": "00000000-0000-0000-0000-000000000000",
    "files": [
    {
        "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.6733333"
    },
    {
        "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
        "name": "worldfile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.86"
    }
    ]
}

Verwenden Sie die id der in der Antwort zurückgegebenen Datei, um den Inhalt der Datei herunterzuladen.

Abrufen aller Sprachmodelle

Die Anforderung " Sprachmodelle abrufen" gibt alle benutzerdefinierten Sprachmodelle im angegebenen Konto in einer Liste zurück.

Beispielantwort

[
    {
        "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
        "name": "TestModel",
        "language": "En-US",
        "state": "None",
        "languageModelId": "00000000-0000-0000-0000-000000000000",
        "files": [
        {
            "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
            "name": "hellofile",
            "enable": true,
            "creator": "John Doe",
            "creationTime": "2018-04-28T11:55:34.6733333"
        },
        {
            "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
            "name": "worldfile",
            "enable": true,
            "creator": "John Doe",
            "creationTime": "2018-04-28T11:55:34.86"
        }
        ]
    },
    {
        "id": "dfae5745-6f1d-4edd-b224-42e1ab57a892",
        "name": "AnotherTestModel",
        "language": "En-US",
        "state": "None",
        "languageModelId": "00000000-0000-0000-0000-000000000001",
        "files": []
    }
]

Löschen einer Datei aus einem Sprachmodell

Die Delete Language Model File-Anforderung löscht die angegebene Datei aus dem angegebenen Sprachmodell im angegebenen Konto.

Beispielantwort

Es gibt keinen zurückgegebenen Inhalt, wenn die Datei erfolgreich aus dem Sprachmodell gelöscht wird.

Abrufen von Metadaten für eine Datei aus einem Sprachmodell

Die Anforderung zum Abrufen von Dateidaten des Sprachmodells gibt die Inhalte und Metadaten der angegebenen Datei aus dem ausgewählten Sprachmodell in Ihrem Konto zurück.

Beispielantwort

{
    "content": "hello\r\nworld",
    "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
    "name": "Hello",
    "enable": true,
    "creator": "John Doe",
    "creationTime": "2018-04-27T20:10:10.5233333"
}

Hinweis

Der Inhalt dieser Beispieldatei sind die Wörter "hello" und "world" in zwei separaten Zeilen.

Herunterladen einer Datei aus einem Sprachmodell

Die Inhaltsanforderung zum Herunterladen der Sprachmodelldatei lädt eine Textdatei herunter, die den Inhalt der angegebenen Datei aus dem angegebenen Sprachmodell im angegebenen Konto enthält. Diese Textdatei sollte mit dem Inhalt der Textdatei übereinstimmen, die ursprünglich hochgeladen wurde.

Beispielantwort

Die Antwort ist der Download einer Textdatei mit dem Inhalt der Datei im JSON-Format.

Freigeben über

Anpassen eines Sprachmodells mit Azure AI Video Indexer

Optimieren Des benutzerdefinierten Sprachmodells

Voraussetzungen

Erstellen eines Sprachmodells

Verwenden eines Sprachmodells in einem neuen Video

Verwenden eines Sprachmodells zum Erneuten Indizieren

Bearbeiten eines Sprachmodells

Umbenennen des Sprachmodells

Dateien hinzufügen

Dateien löschen

Löschen eines Sprachmodells

Anpassen von Sprachmodellen durch Korrigieren von Transkriptionen

Erstellen eines Sprachmodells

Beispielantwort

Trainieren eines Sprachmodells

Beispielantwort

Löschen eines Sprachmodells

Beispielantwort

Aktualisieren eines Sprachmodells

Beispielantwort

Aktualisieren einer Datei aus einem Sprachmodell

Beispielantwort

Abrufen eines bestimmten Sprachmodells

Beispielantwort

Abrufen aller Sprachmodelle

Beispielantwort

Löschen einer Datei aus einem Sprachmodell

Beispielantwort

Abrufen von Metadaten für eine Datei aus einem Sprachmodell

Beispielantwort

Herunterladen einer Datei aus einem Sprachmodell

Beispielantwort

Feedback

Zusätzliche Ressourcen