Was ist Videoanalyse?
Die Videoanalyse umfasst videobezogene Features wie räumliche Analyse und Videoabruf.
Räumliche Analyse
Wichtig
Die räumliche Analyse von Azure KI Vision wird am 30. März 2025 eingestellt. Wechseln Sie vor dem angegebenen Datum zu Azure KI Video Indexer oder einer anderen Open-Source-Lösung. Wir empfehlen Ihnen jedoch, den Wechsel früher zu vollziehen, um die Vorteile von Azure KI Video Indexer zu nutzen. Zusätzlich zu den vertrauten Features, die Sie bereits verwenden, finden Sie hier einen kurzen Vergleich zwischen der räumlichen Analyse von Azure KI Vision und Azure KI Video Indexer.
Funktion | Azure KI Vision Räumliche Analyse | Azure KI Video Indexer |
---|---|---|
Edge-Unterstützung: | Ja | Ja |
Objekterkennung | Nur Personen- und Fahrzeugerkennung | Erkennt mehr als 1.000 Objekte. |
Audio-/Sprachverarbeitung | Nicht unterstützt | Unterstützt (einschließlich Sprachtranskription, Übersetzung und Zusammenfassung) Unterstützt >(einschließlich Sprachtranskription und Stimmungsanalyse) |
Ereigniserkennung und -nachverfolgung | Unterstützt (Nachverfolgen von Personen und Fahrzeugen, Ereigniserkennung) | Noch keine Unterstützung am Edge. Teilweise in der Cloud unterstützt. |
Azure Arc-Unterstützung | Nicht unterstützt | Native Unterstützung |
Schwerpunkt | Visuelle Analyse mit spezieller Nachverfolgung | Umfassende Analyse von Audioinhalten und visuellen Inhalten |
Ab jetzt bis zum 30. März 2025 können Sie die räumliche Analyse von Azure KI Vision weiterhin verwenden oder vor dem angegebenen Datum zu Azure KI Video Indexer wechseln. Nach dem 30. März 2025 wird der Container für räumliche Analyse nicht mehr unterstützt und verarbeitet keine neuen Streams mehr.
Sie können die räumliche Analyse von Azure KI Vision verwenden, um die Anwesenheit und die Bewegungen von Personen im Video zu erkennen. Erfassen Sie Videodatenströme von Kameras, extrahieren Sie Erkenntnisse und generieren Sie Ereignisse, die von anderen Systemen verwendet werden können. Der Dienst kann beispielsweise die Personen zählen, die einen bestimmten Bereich betreten, oder messen, ob eine Mund-Nasen-Bedeckung getragen wird und die geltenden Abstandsregeln eingehalten werden. Durch die Verarbeitung von Videostreams aus physischen Bereichen können Sie ableiten, wie Personen diese nutzen, und den Wert der Bereiche für Ihre Organisation maximieren.
Sie können die Funktionen der räumlichen Analyse mit Azure KI Vision Studio ganz schnell und einfach in Ihrem Browser ausprobieren.
Personenzählung
Bei diesem Vorgang werden die Personen mithilfe des Vorgangs PersonCount in einer bestimmten Zone im Laufe der Zeit gezählt. Er generiert eine unabhängige Anzahl für jeden verarbeiteten Frame, ohne zu versuchen, Personen über Frames hinweg nachzuverfolgen. Mit diesem Vorgang kann die Anzahl von Personen in einem Bereich geschätzt oder eine Warnung generiert werden, wenn eine Person erscheint.
Zutrittszählung
Mit diesem Feature wird überwacht, wie lange sich Personen in einem Bereich aufhalten oder wann sie durch eine Tür treten. Für diese Überwachung können die Vorgänge „PersonCrossingPolygon“ oder „PersonCrossingLine“ verwendet werden. In Einzelhandelsszenarien kann mit diesen Vorgängen die Wartezeit an der Kasse oder die Verweildauer vor einer Auslage gemessen werden. Darüber hinaus können diese Vorgänge in anderen Szenarien für Geschäftsgebäude die Personenbewegung in einer Lobby oder auf einer bestimmten Etage messen.
Abstandsregeln und Gesichtsmaskenerkennung
Mit diesem Feature wird analysiert, wie gut Personen die Abstandsregeln in einem Bereich einhalten. Mithilfe des PersonDistance-Vorgangs kalibriert sich das System automatisch selbst, wenn Personen in einem Bereich umhergehen. Anschließend wird ermittelt, wann Personen einen bestimmten Abstandsschwellenwert (6 Fuß oder 10 Fuß) überschreiten.
Die räumliche Analyse kann außerdem so konfiguriert werden, dass erkannt wird, ob eine Person eine schützende Gesichtsbedeckung (beispielsweise eine Maske) trägt. Für die Vorgänge „PersonCount“, „PersonCrossingLine“ und „PersonCrossingPolygon“ kann durch Konfigurieren des Parameters ENABLE_FACE_MASK_CLASSIFIER
ein Maskenklassifizierer aktiviert werden.
Videoabruf
Beim Videoabruf handelt es sich um einen Dienst, der es Ihnen ermöglicht, einen Suchindex zu erstellen, diesem Dokumente wie Videos und Bilder hinzuzufügen und ihn mit natürlicher Sprache zu durchsuchen. Entwickler*innen können Metadatenschemas für jeden Index definieren und Metadaten in den Dienst aufnehmen, die Abrufvorgänge unterstützen. Entwickler*innen können außerdem angeben, welche Merkmale aus dem Index (Vision, Sprache) extrahiert werden sollen, und ihre Suche basierend auf Merkmalen filtern.
Eingabeanforderungen
Die räumliche Analyse kann Videos analysieren, die folgende Anforderungen erfüllen:
- Das Video muss im RTSP-, RawVideo-, MP4-, FLV- oder MKV-Format vorliegen.
- Der Videocodec muss H.264, HEVC(H.265), RawVideo, VP9 oder MPEG-4 sein.
Verantwortungsvolle Verwendung der Technologie für räumliche Analysen
Informationen zur verantwortungsvollen Verwendung der Technologie für räumliche Analysen finden Sie im Transparenzhinweis. Die Transparenzhinweise von Microsoft helfen Ihnen zu verstehen, wie unsere KI-Technologie funktioniert und welche Entscheidungen Systembesitzer treffen können, die die Systemleistung und das Systemverhalten beeinflussen. Sie konzentrieren sich darauf, wie wichtig es ist, das gesamte System zu betrachten, einschließlich der Technologie, der Menschen und der Umgebung.