Azure AI Video Indexer içgörüleri

Makale
10/09/2024

Azure AI Video Indexer, video ve ses içeriğini analiz etmek için 30'un üzerinde yapay zeka modeli çalıştırır ve transkriptler, optik karakter tanıma öğeleri (OCR' ler), yüz tanıma, konular, duygular vb. gibi video içgörülerini içeren JSON oluşturur. Her içgörü türü, videoda içgörülerin ne zaman görüntülendiğini gösteren zaman aralıklarının örneklerini içerir.

Web portalında her içgörü JSON yanıtını almayı ve API'yi kullanmayı öğrenmek için içgörüler tablosundaki bağlantıları kullanın.

İçgörüler

İçgörü	Açıklama
Yüz algılama	Yüz algılama, bir medya dosyasındaki yüzleri algılar ve benzer yüzlerin örneklerini gruplar halinde toplar. Yüz algılama içgörüleri, küçük resim ve her yüz için bir ad veya kimlik içeren bir JSON dosyasında kategorilere ayrılmış bir liste olarak oluşturulur. Web portalında bir yüzün küçük resmi seçildiğinde kişinin adı (tanındıysa), kişinin görüntülediği video yüzdesi ve ünlüyse kişinin biyografisi gibi bilgiler görüntülenir. Ayrıca, kişinin görüntülendiği videodaki örnekler arasında da kaydırma yapabilirsiniz.
Etiketler tanımlaması	Etiket belirleme, güneş gözlüğü gibi görsel nesneleri veya bir medya dosyasının video görüntüsünde görünen yüzme gibi eylemleri tanımlayan bir Azure AI Video Indexer AI özelliğidir. Birçok etiket tanımlama kategorisi vardır ve ayıklandıktan sonra, etiketler tanımlama örnekleri İçgörüler sekmesinde görüntülenir ve 50'den fazla dile çevrilebilir. Etikete tıklanması medya dosyasında örneği açar, daha fazla örnek görmek için Öncekini Yürüt veya Sonrakini Oynat'ı seçin.
Nesne algılama	Azure AI Video Indexer; videolardaki arabalar, el çantaları, sırt çantaları ve dizüstü bilgisayarlar gibi nesneleri algılar.
Gözlemlenen kişi algılama	Gözlemlenen kişi algılama ve eşleşen yüzler, medya dosyalarındaki kişileri otomatik olarak algılar ve eşleştirilir. Gözlemlenen kişi algılama ve eşleşen yüzler, kişiler, giyimleri ve görünüşlerinin tam zaman çerçevesi hakkında içgörüler görüntülemek için ayarlanabilir.)
OCR	OCR, içgörüler oluşturmak için medya dosyalarındaki resimler, sokak işaretleri ve ürünler gibi görüntülerden metin ayıklar.
Üretim sonrası: clapper board algılama	Clapper kartı algılama, film çekme sırasında kullanılan ve aynı zamanda clapper kartında meta veri olarak algılanan bilgileri (örneğin, üretim, rulo, sahne, çekim vb.) sağlayan clapper panolarını algılar. Clapper board, dosyayı karşıya yükleyip dizine eklediğinizde web portalı gelişmiş ayarlarında seçebileceğiniz üretim sonrası içgörülerin bir parçasıdır.
Üretim sonrası: dijital desenler	Dijital desen algılama, film çekme sırasında kullanılan renk çubuklarını algılar. Dijital desenler, dosyayı karşıya yükleyip dizine eklediğinizde web portalı gelişmiş ayarlarında seçebileceğiniz üretim sonrası içgörülerin bir parçasıdır.
Sahneler, çekimler ve ana kareler	Sahne algılama, görsel ipuçlarına göre bir videoda bir sahnenin ne zaman değiştiğini algılar. Bir sahne tek bir olayı gösterir ve ilgili bir dizi çekimden oluşur.Çekimler , bitişik çerçevelerin renk düzeninde ani ve aşamalı geçişler gibi görsel ipuçlarıyla ayırt edilen bir çerçeve serisidir. Çekimin meta verileri başlangıç ve bitiş saatinin yanı sıra çekime dahil edilen ana karelerin listesini içerir. Ana kare , bir çekimi en iyi temsil eden karedir.

Sesli içgörüler

İçgörü	Açıklama
Ses efektleri algılama	Ses efektleri algılama akustik olayları algılar ve bunları kahkaha, kalabalık tepkileri, alarmlar ve/veya sirenler gibi kategorilere ayırır.
Anahtar sözcük ayıklama	Anahtar sözcük ayıklama, medya dosyalarında açıklanan farklı anahtar sözcüklerle ilgili içgörüleri algılar. Hem tek dilde hem de çok dilli medya dosyalarındaki içgörüleri ayıklar.
Adlandırılmış varlıklar	Adlandırılmış varlık ayıklama, medya dosyalarındaki ses ve görüntülerde görünen konumlar, kişiler ve markalar hakkında içgörüler elde etmek için Doğal Dil İşleme (NLP) kullanır. Adlandırılmış varlık ayıklama içgörüleri transkripsiyon ve optik karakter tanıma (OCR) kullanır.
Metin tabanlı duygu algılama	Duygu algılama, video transkript satırlarındaki duyguları algılar. Başka bir duygu algılanmadıysa her cümle Öfke, Korku, Sevinç, Üzgün, Hiçbiri olarak algılanabilir.
Konu çıkarımı	Konu çıkarımı, dökümü yapılan sesten, görsel metindeki OCR içeriğinden ve Video Indexer yüz tanıma modelini kullanarak videoda tanınan ünlülerden türetilen çıkarımlı içgörüler oluşturur.
Transkripsiyon, çeviri ve dil belirleme	Transkripsiyon, çeviri ve dil belirleme, medya dosyalarındaki konuşmayı algılar, düzenler ve 50'den fazla dile çevirir.

Aracılığıyla paylaş

Azure AI Video Indexer içgörüleri

İçgörüler

Sesli içgörüler

Geri Bildirim

Ek kaynaklar