Udostępnij za pośrednictwem


Co to jest analiza wideo?

Analiza wideo obejmuje funkcje związane z wideo, takie jak analiza przestrzenna i pobieranie wideo.

Analiza przestrzenna

Ważne

30 marca 2025 r. analiza przestrzenna usługi Azure AI Vision zostanie wycofana. Przed określoną datą przejdź do usługi Azure AI Video Indexer lub innego rozwiązania typu open source. Zachęcamy do przejścia wcześniej, aby uzyskać bogatsze korzyści z usługi Azure AI Video Indexer. Oprócz znanych funkcji, których używasz, poniżej przedstawiono szybkie porównanie usługi Azure AI Vision Spatial Analysis i usługi Azure AI Video Indexer.

Funkcja Analiza przestrzenna usługi Azure AI Vision Azure AI Video Indexer
Obsługa przeglądarki Microsoft Edge Tak Tak
Wykrywanie obiektów Tylko wykrywanie osób i pojazdów Wykrywa 1000 obiektów i więcej
Przetwarzanie dźwięku/mowy Nieobsługiwane Obsługiwane (obejmuje transkrypcję mowy, tłumaczenie i podsumowanie)
Obsługiwane >(obejmuje transkrypcję mowy i analizę tonacji)
Wykrywanie zdarzeń i śledzenie Obsługiwane (śledzenie osób i pojazdów, wykrywanie zdarzeń) Nieobsługiwane jeszcze w przeglądarce Edge. Jest częściowo obsługiwana w chmurze.
Obsługa usługi Azure Arc Nieobsługiwane Natywna obsługa
Obszar, na którym się skupiasz Analiza wizualna z wyspecjalizowanym śledzeniem Kompleksowa analiza zawartości audio i wizualnej

Od teraz do 30 marca 2025 r. możesz nadal używać usługi Azure AI Vision Spatial Analysis lub przejść do usługi Azure AI Video Indexer przed określoną datą. Po 30 marca 2025 r. kontener analizy przestrzennej nie będzie już obsługiwany i przestanie przetwarzać nowe strumienie.

Analiza przestrzenna usługi Azure AI Vision umożliwia wykrywanie obecności i ruchów osób w filmie wideo. Pozyskiwanie strumieni wideo z kamer, wyodrębnianie szczegółowych informacji i generowanie zdarzeń, które mają być używane przez inne systemy. Usługa może wykonywać takie czynności, jak zliczanie liczby osób wchodzących w przestrzeń lub mierzenie zgodności z maską twarzy i wytycznymi dotyczącymi dystansowania społecznego. Przetwarzając strumienie wideo z przestrzeni fizycznych, możesz dowiedzieć się, jak ludzie z nich korzystają i maksymalizować wartość przestrzeni w organizacji.

Wypróbuj możliwości analizy przestrzennej szybko i łatwo w przeglądarce przy użyciu usługi Azure AI Vision Studio.

Liczenie osób

Ta operacja zlicza liczbę osób w określonej strefie w czasie przy użyciu operacji PersonCount . Generuje niezależną liczbę dla każdej przetworzonej ramki bez próby śledzenia osób w ramkach. Ta operacja może służyć do oszacowania liczby osób w przestrzeni lub wygenerowania alertu po wyświetleniu osoby.

Animacja przedstawiająca sposób, w jaki analiza przestrzenna zlicza liczbę osób w polu kamery widoku.

Liczenie wejścia

Ta funkcja monitoruje, jak długo ludzie pozostają w okolicy lub kiedy wchodzą przez drzwi. To monitorowanie można wykonać przy użyciu operacji PersonCrossingPolygon lub PersonCrossingLine. W scenariuszach sprzedaży detalicznej te operacje mogą służyć do mierzenia czasów oczekiwania dla wiersza zakupu lub zakontraktowania na wyświetlaczu. Ponadto te operacje mogą mierzyć ruch stóp w holu lub określonym piętrze w innych scenariuszach komercyjnych budynków.

Animacja przedstawiająca ramki osób poruszających się i wychodzących z obramowanego miejsca z prostokątami narysowanymi wokół nich.

Rozpoznawanie dystansu społecznego i wykrywanie maski twarzy

Ta funkcja analizuje, jak dobrze ludzie przestrzegają wymagań dotyczących różnic społecznych w przestrzeni. System używa operacji PersonDistance , aby automatycznie skalibrować się, gdy ludzie chodzą w przestrzeni. Następnie określa, kiedy ludzie naruszają określony próg odległości (6 stóp lub 10 stóp).

Animacja przedstawiająca, jak analiza przestrzenna wizualizuje zdarzenia naruszenia dystansu społecznego pokazujące linie między osobami pokazującymi odległość.

Analizę przestrzenną można również skonfigurować pod kątem wykrywania, czy dana osoba ma na sobie osłonę twarzy, taką jak maska. Klasyfikator maski można włączyć dla operacji PersonCount, PersonCrossingLine i PersonCrossingPolygon, konfigurując ENABLE_FACE_MASK_CLASSIFIER parametr .

Zdjęcie przedstawiające, jak analiza przestrzenna klasyfikuje, czy ludzie mają maski twarzy w windze.

Pobieranie wideo

Pobieranie wideo to usługa, która umożliwia tworzenie indeksu wyszukiwania, dodawanie do niego dokumentów (wideo i obrazów) oraz wyszukiwanie za pomocą języka naturalnego. Deweloperzy mogą definiować schematy metadanych dla każdego indeksu i pozyskiwać metadane do usługi, aby ułatwić pobieranie. Deweloperzy mogą również określić, jakie funkcje mają być wyodrębnione z indeksu (wizja, mowa) i filtrować wyszukiwanie na podstawie funkcji.

Wymagania dotyczące danych wejściowych

Analiza przestrzenna działa na filmach wideo, które spełniają następujące wymagania:

  • Wideo musi być w formacie RTSP, rawvideo, MP4,TF lub PF.
  • Koder wideo musi być H.264, HEVC(H.265), rawvideo, VP9 lub MPEG-4.

Odpowiedzialne korzystanie z technologii analizy przestrzennej

Aby dowiedzieć się, jak korzystać z technologii analizy przestrzennej w sposób odpowiedzialny, zobacz notę Przezroczystość. Uwagi dotyczące przejrzystości firmy Microsoft pomagają zrozumieć, w jaki sposób działa nasza technologia sztucznej inteligencji, a właściciele systemów mogą sprawić, że mają wpływ na wydajność i zachowanie systemu. Koncentrują się one na znaczeniu myślenia o całym systemie, w tym technologii, ludzi i środowiska.

Następny krok