Anpassen eines Sprachmodells mit der Azure AI Video Indexer-API

Wichtig

Aufgrund der Ankündigung zur Einstellung von Azure Media Services kündigt Azure AI Video Indexer Anpassungen an. Siehe Änderungen im Zusammenhang mit der Einstellung von Azure Media Service (AMS), um zu verstehen, was dies für Ihr Azure AI Video Indexer-Konto bedeutet. Weitere Informationen finden Sie im Leitfaden zur Vorbereitung auf die Einstellung von AMS: VI-Update und -Migration.

Mit azure AI Video Indexer können Sie benutzerdefinierte Sprachmodelle erstellen, um die Spracherkennung anzupassen, indem Sie Anpassungstext hochladen, nämlich Text aus der Do Standard dessen Vokabular sie anpassen möchten. Sobald Sie Ihr Modell trainiert haben, werden neue Wörter, die im Anpassungstext vorkommen, erkannt.

Eine detaillierte Übersicht und bewährte Methoden für benutzerdefinierte Sprachmodelle finden Sie unter Anpassen eines Sprachmodells mit Azure AI Video Indexer.

Sie können die Azure AI Video Indexer-APIs verwenden, um benutzerdefinierte Sprachmodelle in Ihrem Konto zu erstellen und zu bearbeiten, wie in diesem Artikel beschrieben. Sie können die Website auch verwenden, wie unter Anpassen des Sprachmodells mithilfe der Azure AI Video Indexer-Website beschrieben.

Erstellen eines Sprachmodells

Die API zum Erstellen eines Sprachmodells erstellt ein neues benutzerdefiniertes Sprachmodell im angegebenen Konto. Sie können Dateien für das Sprachmodell in diesem Aufruf hochladen. Alternativ können Sie das Sprachmodell hier erstellen und Dateien für das Modell später durch Aktualisieren des Sprachmodells hochladen.

Hinweis

Sie müssen das Modell mit seinen aktivierten Dateien weiterhin trainieren, damit das Modell den Inhalt seiner Dateien erlernen kann. Anleitungen zum Trainieren einer Sprache finden Sie im nächsten Abschnitt.

Um Dateien hochzuladen, die dem Sprachmodell hinzugefügt werden sollen, müssen Sie Dateien im Textkörper mithilfe von FormData hochladen und zusätzlich Werte für die oben genannten erforderlichen Parameter angeben. Hierfür gibt es zwei Möglichkeiten:

  • Der Schlüssel ist der Dateiname und der Wert der TXT-Datei.
  • Der Schlüssel ist der Dateiname und der Wert eine URL zu txt-Datei.

Antwort

Die Antwort stellt Metadaten zum neu erstellten Sprachmodell zusammen mit Metadaten zu jeder der Dateien des Modells im Format der JSON-Beispielausgabe bereit:

{
    "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
    "name": "TestModel",
    "language": "En-US",
    "state": "None",
    "languageModelId": "00000000-0000-0000-0000-000000000000",
    "files": [
    {
        "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.6733333"
    },
    {
        "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
        "name": "worldfile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.86"
    }
    ]
}

Trainieren eines Sprachmodells

Die API zum Trainieren eines Sprachmodells trainiert ein benutzerdefiniertes Sprachmodell im angegebenen Konto mit dem Inhalt der Dateien, die in das Sprachmodell hochgeladen und in ihm aktiviert wurden.

Hinweis

Zunächst müssen Sie das Sprachmodell erstellen und seine Dateien hochladen. Sie können Dateien beim Erstellen des Sprachmodells oder durch Aktualisieren des Sprachmodells hochladen.

Antwort

Die Antwort stellt Metadaten zum neu trainierten Sprachmodell zusammen mit Metadaten zu jeder der Dateien des Modells im Format der JSON-Beispielausgabe bereit:

{
    "id": "41464adf-e432-42b1-8e09-f52905d7e29d",
    "name": "TestModel",
    "language": "En-US",
    "state": "Waiting",
    "languageModelId": "531e5745-681d-4e1d-b124-12e5ab57a891",
    "files": [
    {
        "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
        "name": "RenamedFile",
        "enable": false,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.5233333"
    },
    {
        "id": "9ac35b4b-1381-49c4-9fe4-8234bfdd0f50",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.68"
    }
    ]
}

Die zurückgegebene id Id ist eine eindeutige ID, die verwendet wird, um zwischen Sprachmodellen zu unterscheiden, während languageModelId sowohl zum Hochladen eines Videos zum Indizieren als auch zum Erneuten Indizieren einer Video-APIs verwendet wird (auch als linguisticModelId Azure AI Video Indexer upload/reindex-APIs bezeichnet).

Löschen eines Sprachmodells

Die API zum Löschen eines Sprachmodells löscht ein benutzerdefiniertes Sprachmodell aus dem angegebenen Konto. Jedes Video, das das gelöschte Sprachmodell verwendet hat, behält den gleichen Index bei, bis Sie das Video neu indizieren. Wenn Sie das Video erneut indizieren, können Sie dem Video ein neues Sprachmodell zuweisen. Andernfalls verwendet Azure AI Video Indexer sein Standardmodell, um das Video neu zu indizieren.

Antwort

Es wird kein Inhalt zurückgegeben, wenn das Sprachmodell erfolgreich gelöscht wurde.

Aktualisieren eines Sprachmodells

Die API zum Aktualisieren eines Sprachmodells aktualisiert ein benutzerdefiniertes Sprachmodell im angegebenen Konto.

Hinweis

Sie müssen das Sprachmodell bereits erstellt haben. Mit diesem Aufruf können Sie alle Dateien im Modell aktivieren oder deaktivieren, den Namen des Sprachmodells aktualisieren und Dateien hochladen, die dem Sprachmodell hinzugefügt werden sollen.

Um Dateien hochzuladen, die dem Sprachmodell hinzugefügt werden sollen, müssen Sie Dateien im Textkörper mithilfe von FormData hochladen und zusätzlich Werte für die oben genannten erforderlichen Parameter angeben. Hierfür gibt es zwei Möglichkeiten:

  • Der Schlüssel ist der Dateiname und der Wert der TXT-Datei.
  • Der Schlüssel ist der Dateiname und der Wert eine URL zu txt-Datei.

Antwort

Die Antwort stellt Metadaten zum neu trainierten Sprachmodell zusammen mit Metadaten zu jeder der Dateien des Modells im Format der JSON-Beispielausgabe bereit:

{
    "id": "41464adf-e432-42b1-8e09-f52905d7e29d",
    "name": "TestModel",
    "language": "En-US",
    "state": "Waiting",
    "languageModelId": "531e5745-681d-4e1d-b124-12e5ab57a891",
    "files": [
    {
        "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
        "name": "RenamedFile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.5233333"
    },
    {
        "id": "9ac35b4b-1381-49c4-9fe4-8234bfdd0f50",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-27T20:10:10.68"
    }
    ]
}

Verwenden Sie die id der in der Antwort zurückgegebenen Dateien, um den Inhalt der Datei herunterzuladen.

Aktualisieren einer Datei aus einem Sprachmodell

Die API zum Aktualisieren einer Datei ermöglicht Ihnen, den Namen und den enable-Zustand einer Datei in einem benutzerdefinierten Sprachmodell im angegebenen Konto zu aktualisieren.

Antwort

Die Antwort stellt Metadaten im Format der unten gezeigten JSON-Beispielausgabe für die Datei bereit, die Sie aktualisiert haben.

{
  "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
  "name": "RenamedFile",
  "enable": false,
  "creator": "John Doe",
  "creationTime": "2018-04-27T20:10:10.5233333"
}

Verwenden Sie die id der in der Antwort zurückgegebenen Datei, um den Inhalt der Datei herunterzuladen.

Abrufen eines bestimmten Sprachmodells

Die API get gibt Informationen zum angegebenen Sprachmodell im angegebenen Konto zurück, z. B. die Sprache und die Dateien, die sich im Sprachmodell befinden.

Antwort

Die Antwort stellt Metadaten zum angegebenen Sprachmodell zusammen mit Metadaten zu jeder der Dateien des Modells im Format der gezeigten JSON-Beispielausgabe bereit:

{
    "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
    "name": "TestModel",
    "language": "En-US",
    "state": "None",
    "languageModelId": "00000000-0000-0000-0000-000000000000",
    "files": [
    {
        "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
        "name": "hellofile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.6733333"
    },
    {
        "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
        "name": "worldfile",
        "enable": true,
        "creator": "John Doe",
        "creationTime": "2018-04-28T11:55:34.86"
    }
    ]
}

Verwenden Sie die id der in der Antwort zurückgegebenen Datei, um den Inhalt der Datei herunterzuladen.

Abrufen aller Sprachmodelle

Die API get all gibt alle benutzerdefinierten Sprachmodelle im angegebenen Konto in einer Liste zurück.

Antwort

Die Antwort enthält eine Liste mit allen Sprachmodellen in Ihrem Konto und deren Metadaten und Dateien im Format der gezeigten JSON-Beispielausgabe:

[
    {
        "id": "dfae5745-6f1d-4edd-b224-42e1ab57a891",
        "name": "TestModel",
        "language": "En-US",
        "state": "None",
        "languageModelId": "00000000-0000-0000-0000-000000000000",
        "files": [
        {
            "id": "25be7c0e-b6a6-4f48-b981-497e920a0bc9",
            "name": "hellofile",
            "enable": true,
            "creator": "John Doe",
            "creationTime": "2018-04-28T11:55:34.6733333"
        },
        {
            "id": "33025f5b-2354-485e-a50c-4e6b76345ca7",
            "name": "worldfile",
            "enable": true,
            "creator": "John Doe",
            "creationTime": "2018-04-28T11:55:34.86"
        }
        ]
    },
    {
        "id": "dfae5745-6f1d-4edd-b224-42e1ab57a892",
        "name": "AnotherTestModel",
        "language": "En-US",
        "state": "None",
        "languageModelId": "00000000-0000-0000-0000-000000000001",
        "files": []
    }
]

Löschen einer Datei aus einem Sprachmodell

Die API delete löscht die angegebene Datei aus dem angegebenen Sprachmodell im angegebenen Konto.

Antwort

Es wird kein Inhalt zurückgegeben, wenn die Datei erfolgreich aus dem Sprachmodell gelöscht wurde.

Abrufen von Metadaten für eine Datei aus einem Sprachmodell

Die API zum Abrufen der Metadaten einer Datei gibt die Inhalte und Metadaten für die angegebene Datei aus dem ausgewählten Sprachmodell in Ihrem Konto zurück.

Antwort

Die Antwort enthält die Inhalte und Metadaten der Datei im JSON-Format, ähnlich wie in diesem Beispiel:

{
    "content": "hello\r\nworld",
    "id": "84fcf1ac-1952-48f3-b372-18f768eedf83",
    "name": "Hello",
    "enable": true,
    "creator": "John Doe",
    "creationTime": "2018-04-27T20:10:10.5233333"
}

Hinweis

Der Inhalt dieser Beispieldatei sind die Wörter „hello“ und „world“ in zwei separaten Zeilen.

Herunterladen einer Datei aus einem Sprachmodell

Die API zum Herunterladen einer Datei lädt eine Textdatei mit dem Inhalt der angegebenen Datei aus dem angegebenen Sprachmodell im angegebenen Konto herunter. Diese Textdatei sollte mit dem Inhalt der Textdatei übereinstimmen, die ursprünglich hochgeladen wurde.

Antwort

Die Antwort ist der Download einer Textdatei mit dem Inhalt der Datei im JSON-Format.