Was ist Videoanalyse?

Artikel
10/21/2024

Die Videoanalyse umfasst videobezogene Features wie räumliche Analyse und Videoabruf.

Räumliche Analyse

Wichtig

Die räumliche Analyse von Azure KI Vision wird am 30. März 2025 eingestellt. Wechseln Sie vor dem angegebenen Datum zu Azure KI Video Indexer oder einer anderen Open-Source-Lösung. Wir empfehlen Ihnen jedoch, den Wechsel früher zu vollziehen, um die Vorteile von Azure KI Video Indexer zu nutzen. Zusätzlich zu den vertrauten Features, die Sie bereits verwenden, finden Sie hier einen kurzen Vergleich zwischen der räumlichen Analyse von Azure KI Vision und Azure KI Video Indexer.

Funktion	Azure KI Vision Räumliche Analyse	Azure KI Video Indexer
Edge-Unterstützung:	Ja	Ja
Objekterkennung	Nur Personen- und Fahrzeugerkennung	Erkennt mehr als 1.000 Objekte.
Audio-/Sprachverarbeitung	Nicht unterstützt	Unterstützt (einschließlich Sprachtranskription, Übersetzung und Zusammenfassung) Unterstützt >(einschließlich Sprachtranskription und Stimmungsanalyse)
Ereigniserkennung und -nachverfolgung	Unterstützt (Nachverfolgen von Personen und Fahrzeugen, Ereigniserkennung)	Noch keine Unterstützung am Edge. Teilweise in der Cloud unterstützt.
Azure Arc-Unterstützung	Nicht unterstützt	Native Unterstützung
Schwerpunkt	Visuelle Analyse mit spezieller Nachverfolgung	Umfassende Analyse von Audioinhalten und visuellen Inhalten

Ab jetzt bis zum 30. März 2025 können Sie die räumliche Analyse von Azure KI Vision weiterhin verwenden oder vor dem angegebenen Datum zu Azure KI Video Indexer wechseln. Nach dem 30. März 2025 wird der Container für räumliche Analyse nicht mehr unterstützt und verarbeitet keine neuen Streams mehr.

Sie können die räumliche Analyse von Azure KI Vision verwenden, um die Anwesenheit und die Bewegungen von Personen im Video zu erkennen. Erfassen Sie Videodatenströme von Kameras, extrahieren Sie Erkenntnisse und generieren Sie Ereignisse, die von anderen Systemen verwendet werden können. Der Dienst kann beispielsweise die Personen zählen, die einen bestimmten Bereich betreten, oder messen, ob eine Mund-Nasen-Bedeckung getragen wird und die geltenden Abstandsregeln eingehalten werden. Durch die Verarbeitung von Videostreams aus physischen Bereichen können Sie ableiten, wie Personen diese nutzen, und den Wert der Bereiche für Ihre Organisation maximieren.

Sie können die Funktionen der räumlichen Analyse mit Azure KI Vision Studio ganz schnell und einfach in Ihrem Browser ausprobieren.

Vision Studio testen

Personenzählung

Bei diesem Vorgang werden die Personen mithilfe des Vorgangs PersonCount in einer bestimmten Zone im Laufe der Zeit gezählt. Er generiert eine unabhängige Anzahl für jeden verarbeiteten Frame, ohne zu versuchen, Personen über Frames hinweg nachzuverfolgen. Mit diesem Vorgang kann die Anzahl von Personen in einem Bereich geschätzt oder eine Warnung generiert werden, wenn eine Person erscheint.

Animation: Räumliche Analyse zählt die Personen im Sichtfeld der Kamera.

Zutrittszählung

Mit diesem Feature wird überwacht, wie lange sich Personen in einem Bereich aufhalten oder wann sie durch eine Tür treten. Für diese Überwachung können die Vorgänge „PersonCrossingPolygon“ oder „PersonCrossingLine“ verwendet werden. In Einzelhandelsszenarien kann mit diesen Vorgängen die Wartezeit an der Kasse oder die Verweildauer vor einer Auslage gemessen werden. Darüber hinaus können diese Vorgänge in anderen Szenarien für Geschäftsgebäude die Personenbewegung in einer Lobby oder auf einer bestimmten Etage messen.

Animation: Bilder von Personen, die einen umrandeten Bereich betreten und diesen wieder verlassen, mit um sie herum gezogenen Rechtecken

Mit diesem Feature wird analysiert, wie gut Personen die Abstandsregeln in einem Bereich einhalten. Mithilfe des PersonDistance-Vorgangs kalibriert sich das System automatisch selbst, wenn Personen in einem Bereich umhergehen. Anschließend wird ermittelt, wann Personen einen bestimmten Abstandsschwellenwert (6 Fuß oder 10 Fuß) überschreiten.

Animation: Räumliche Analyse visualisiert Ereignisse bei Verletzung der Abstandsregeln und zeigt Linien zwischen Personen an, die die Entfernung angeben.

Die räumliche Analyse kann außerdem so konfiguriert werden, dass erkannt wird, ob eine Person eine schützende Gesichtsbedeckung (beispielsweise eine Maske) trägt. Für die Vorgänge „PersonCount“, „PersonCrossingLine“ und „PersonCrossingPolygon“ kann durch Konfigurieren des Parameters ENABLE_FACE_MASK_CLASSIFIER ein Maskenklassifizierer aktiviert werden.

Abbildung: Die räumliche Analyse klassifiziert, ob Personen in einem Aufzug Gesichtsmasken tragen.

Videoabruf

Beim Videoabruf handelt es sich um einen Dienst, der es Ihnen ermöglicht, einen Suchindex zu erstellen, diesem Dokumente wie Videos und Bilder hinzuzufügen und ihn mit natürlicher Sprache zu durchsuchen. Entwickler*innen können Metadatenschemas für jeden Index definieren und Metadaten in den Dienst aufnehmen, die Abrufvorgänge unterstützen. Entwickler*innen können außerdem angeben, welche Merkmale aus dem Index (Vision, Sprache) extrahiert werden sollen, und ihre Suche basierend auf Merkmalen filtern.

Aufrufen der Videoabruf-APIs

Die räumliche Analyse kann Videos analysieren, die folgende Anforderungen erfüllen:

Das Video muss im RTSP-, RawVideo-, MP4-, FLV- oder MKV-Format vorliegen.
Der Videocodec muss H.264, HEVC(H.265), RawVideo, VP9 oder MPEG-4 sein.

Unterstützte Formate

Dateiformat	Beschreibung
`asf`	ASF (Advanced / Active Streaming Format)
`avi`	AVI (Audio Video Interleaved)
`flv`	FLV (Flash Video)
`matroskamm`, `webm`	Matroska / WebM
`mov`,`mp4`,`m4a`,`3gp`,`3g2`,`mj2`	QuickTime / MOV

Unterstützte Videocodecs

Codec	Format
`h264`	H.264 / AVC / MPEG-4 AVC / MPEG-4 part 10
`h265`	H.265/HEVC
`libvpx-vp9`	libvpx VP9 (Codec vp9)
`mpeg4`	MPEG-4 Teil 2

Unterstützte Audiocodecs

Codec	Format
`aac`	AAC (Advanced Audio Coding)
`mp3`	MP3 (MPEG Audio Layer 3)
`pcm`	PCM (unkomprimiert)
`vorbis`	Vorbis
`wmav2`	Windows Media Audio 2

Verantwortungsvolle Verwendung der Technologie für räumliche Analysen

Informationen zur verantwortungsvollen Verwendung der Technologie für räumliche Analysen finden Sie im Transparenzhinweis. Die Transparenzhinweise von Microsoft helfen Ihnen zu verstehen, wie unsere KI-Technologie funktioniert und welche Entscheidungen Systembesitzer treffen können, die die Systemleistung und das Systemverhalten beeinflussen. Sie konzentrieren sich darauf, wie wichtig es ist, das gesamte System zu betrachten, einschließlich der Technologie, der Menschen und der Umgebung.

Nächster Schritt

Installieren und Ausführen des Containers für räumliche Analyse

Freigeben über

Was ist Videoanalyse?

Räumliche Analyse

Personenzählung

Zutrittszählung

Videoabruf

Eingabeanforderungen

Unterstützte Formate

Unterstützte Videocodecs

Unterstützte Audiocodecs

Verantwortungsvolle Verwendung der Technologie für räumliche Analysen

Nächster Schritt

Feedback

Zusätzliche Ressourcen

Freigeben über

Was ist Videoanalyse?

Räumliche Analyse

Personenzählung

Zutrittszählung

Abstandsregeln und Gesichtsmaskenerkennung

Videoabruf

Eingabeanforderungen

Verantwortungsvolle Verwendung der Technologie für räumliche Analysen

Nächster Schritt

Feedback

Zusätzliche Ressourcen