Konfigurationsleitfaden für die Indizierung

Artikel
11/04/2024

Sie können die Standardindizierungseinstellungen verwenden oder sie anpassen. Sie können Sprach-, Indizierungs-, benutzerdefinierte Modelle und Streamingeinstellungen auswählen, die Auswirkungen auf die generierten Erkenntnisse, Kosten und Leistung haben.

In diesem Artikel werden die einzelnen Optionen erläutert. Die gleichen Optionen gelten bei Verwendung der Azure AI Video Indexer-Website wie für die Verwendung der API (siehe API-Leitfaden). Wenn Sie große Volumes indizieren, befolgen Sie den Leitfaden Zu beachtende Punkte bei der Verwendung von Azure Video Indexer im großen Stil.

Standardeinstellungen

Standardmäßig ist azure AI Video Indexer wie folgt konfiguriert:

Ausgangssprache: Englisch
Datenschutz: privat
Audio- und Videoeinstellung: Standard
Streamingqualität: Einzelne Bitrate

Ausgangssprache des Videos

Wenn Sie die im Video gesprochene Sprache kennen, wählen Sie sie in der Liste der Videoquellsprachen aus. Wenn Sie sich bei der Sprache des Videos nicht sicher sind, wählen Sie Einzelne Sprache automatisch erkennen aus. Azure AI Video Indexer verwendet sprachidentifikation (LID), um die Sprache der Videos zu erkennen und Transkription und Erkenntnisse mit der erkannten Sprache zu generieren.

Wenn das Video mehrere Sprachen enthält und Sie nicht sicher sind, welche Sprachen vorhanden sind, wählen Sie "Automatische Erkennung mehrerer Sprachen" aus. In diesem Fall wird die MLID-Erkennung (Multi-Language) beim Hochladen und Indizieren Ihres Videos angewendet.

Während autodetect eine großartige Option ist, wenn die Sprache in Ihren Videos variiert, gibt es zwei Punkte, die Sie bei der Verwendung von LID oder MLID berücksichtigen sollten:

LID/MLID unterstützt nicht alle Sprachen, die von Azure AI Video Indexer unterstützt werden.
Die Transkription ist von einer höheren Qualität, wenn Sie die entsprechende Sprache des Videos vorab auswählen.

Erfahren Sie mehr über die Sprachunterstützung und unterstützte Sprachen.

Datenschutz

Mit dieser Option können Sie ermitteln, ob die Einblicke nur für Benutzer in Ihrem Azure AI Video Indexer-Konto oder für alle Benutzer mit einem Link zugänglich sein sollen.

Indizierungsoptionen

Jede Der Optionen für die Audio- und Videoindizierung kann unterschiedlich berechnet werden, wenn Sie die Standardindizierungseinstellungen verwenden. Details finden Sie unter Azure AI Video Indexer-Preise .

Im Folgenden sind die Indizierungstypoptionen mit Details zu ihren bereitgestellten Erkenntnissen aufgeführt. Um den Indizierungstyp zu ändern, wählen Sie Erweiterte Einstellungen aus.

Hinweis

Optische Zeichenerkennung (Optical Character Recognition, OCR) wird mit mehreren Einblicktypen verwendet.

Erweiterte Einstellungen

Nur Audio

Einfach: Indizieren und extrahieren Sie Einblicke nur mithilfe von Audio (Video ignorieren) und bietet die folgenden Einblicke: Transkription, Übersetzung, Formatierung von Ausgabeuntertiteln und Untertiteln (Untertitel).
Standard: Indizes und Extrahieren von Erkenntnissen nur mit Audio (Ignorieren von Video) und bietet folgende Einblicke: Transkription, Übersetzung, Formatierung von Ausgabeuntertiteln und Untertiteln (Untertitel), automatische Spracherkennung, Emotionen, Schlüsselwörter, benannte Entitäten (Marken, Orte, Personen), Stimmungen, Lautsprecher, Themenextraktion und Textkon Zelt-Modus trastration.
Erweitert: Indizes und Extrahieren von Erkenntnissen nur mithilfe von Audio (Ignorieren von Videos) und bietet folgende Einblicke: Transkription, Übersetzung, Formatierung von Ausgabeuntertiteln und Untertiteln (Untertitel), automatische Spracherkennung, Audioereigniserkennung, Emotionen, Schlüsselwörter, benannte Entitäten (Marken, Orte, Personen), Stimmungen, Lautsprecher, Themenextraktion und Text Zelt-Modus konformität.

Nur Video

Einfach: Indizes und Extrahieren von Erkenntnissen nur mithilfe von Video (Ignorieren von Audio) und bietet die folgenden Einblicke: Bezeichnungen, Objekterkennung, OCR, Szenen (Keyframes und Aufnahmen) und Schwarze Frameerkennung.
Standard: Indizes und Extrahieren von Erkenntnissen nur mithilfe von Video (Ignorieren von Audio) und bietet die folgenden Einblicke: Bezeichnungen (OCR), benannte Entitäten (OCR - Marken, Standorte, Personen), OCR, Personen, Szenen (Keyframes und Aufnahmen), schwarze Frames, visuelle Kon Zelt-Modus ration und Themenextraktion (OCR).
Erweitert: Indizes und Extrahieren von Erkenntnissen mithilfe von Video nur (Ignorieren von Audio) und bietet die folgenden Einblicke: Bezeichnungen (OCR), übereinstimmende Person, benannte Entitäten (OCR - Marken, Standorte, Personen), OCR, beobachtete Personen, Personen, Szenen (Keyframes und Aufnahmen), Clapper board detection, digital pattern detection, featured clothing insight, textless slate detection, textual logo detection, black frames, visual con Zelt-Modus ration, and topic extraction (OCR).

Audio und Video

Einfach: Indiziert und extrahiert Einblicke mithilfe von Audio und Video und bietet folgende Einblicke: Transkription, Übersetzung, Formatierung von Ausgabeuntertiteln und Untertiteln (Untertitel), Objekterkennung, OCR, Szenen (Keyframes und Aufnahmen) und schwarze Frames.
Standard: Indizieren und Extrahieren von Erkenntnissen mithilfe von Audio und Video und bietet folgende Einblicke: Transkription, Übersetzung, Formatierung von Ausgabeuntertiteln und Untertiteln (Untertitel), automatische Spracherkennung, Emotionen, Schlüsselwörter, benannte Entitäten (Marken, Orte, Personen), OCR, Szenen (Keyframes und Aufnahmen), Schwarze Frames, visuelle Kon Zelt-Modus ration, Personen, Stimmungen, Lautsprecher, Themenextraktion und TextkonformitätZelt-Modus ration.
Erweitert: Indizes und Extrahieren von Erkenntnissen mithilfe von Audio und Video und bietet folgende Einblicke: Transkription, Übersetzung, Formatierung von Ausgabeuntertiteln und Untertiteln (Untertitel), automatische Spracherkennung, Textkonformität Zelt-Modus ration, Audioereigniserkennung, Emotionen, Schlüsselwörter, übereinstimmende Person, benannte Entitäten (Marken, Orte, Personen), OCR, beobachtete Personen, Personen, Klatschwanderkennung, digitale Mustererkennung, empfohlene Kleidung Einblick, textlose Schiefererkennung, Stimmungen, Lautsprecher, Szenen (Keyframes und Aufnahmen), Erkennung von Textlogos, schwarze Frames, visuelle Kon Zelt-Modus ration und Themenextraktion.

Optionen für die Streamingqualität

Es gibt zwei Optionen zum Streamen von indizierten Videos:

Einzelne Bitrate: Wenn die Videohöhe größer oder gleich 720p HD ist, codiert Azure AI Video Indexer sie mit einer Auflösung von 1280 x 720. Andernfalls wird es als 640 x 468 codiert.
Kein Streaming: Insights werden generiert, aber kein Streamingvorgang ausgeführt, und das Video ist auf der Azure AI Video Indexer-Website nicht verfügbar. Wenn „Kein Streaming“ ausgewählt ist, wird Ihnen die Codierung nicht in Rechnung gestellt.

Ausschließen von Modellen

Sie können Modelle bei der Indizierung sowohl über die VI-Website als auch über die API ausschließen. Wenn Sie ein Video mithilfe der Website in einen Index hochladen, wählen Sie "Erweiterte Einstellungen>Indizierungsvoreinstellungen" aus, und wählen Sie dann die KI-Modelle aus, die aus den Indizierungsergebnissen ausgeschlossen werden sollen. Dies kann eine effizientere Indizierung und VI-Ergebnisse ermöglichen, die nur die Einblicke enthalten, an denen Sie interessiert sind.

Anpassen von Inhaltsmodellen

Mit azure AI Video Indexer können Sie einige seiner Modelle anpassen, die an Ihren spezifischen Anwendungsfall angepasst werden. Zu diesen Modellen gehören Marken, Sprache, Person und Sprache.

Einblicke und Medienspeicher

Einblickspeicher

Alle Indizierungserkenntnisse und Metadaten werden in Speicherkonten gespeichert, die von VI verwaltet werden, und Sie werden für diesen Speicher nicht belastet.

Medienspeicher

Ihr VI-Konto ist mit einem Azure Storage-Konto verbunden. Sie steuern und bezahlen die Nutzung dieses Speicherkontos. Die folgenden Dateien werden in diesem Konto gespeichert, wenn ein Video indiziert wird:

Die Quelldatei. Es wird beibehalten, falls Sie das Video in Zukunft neu indizieren möchten.
Eine neue codierte Datei, wenn die Streamingqualität auf eine einzelne Bitrate festgelegt ist.

Löschen von Medien

Indizierte Medien und alle zugehörigen Dateien und Einblicke können auf drei Arten gelöscht werden:

Löschen Sie die Dateien mit dem Videoindexer-Portal.
Verwenden Sie die Anforderung " Videoquelle löschen" oder "Videoquelldatei löschen".
Wenn Sie die ursprüngliche Mediendatei nicht im Speicher behalten müssen, legen Sie bei Verwendung der API den retentionPeriod Parameter auf 1-7 fest. Das indizierte Video und alles, was damit verbunden ist, die Quelldatei, Einblicke usw. werden 1-7 Tage nach der Indizierung gelöscht.

Freigeben über