Aracılığıyla paylaş


Azure AI Video Indexer içgörüleri

Azure AI Video Indexer, video ve ses içeriğini analiz etmek için 30'un üzerinde yapay zeka modeli çalıştırır ve transkriptler, optik karakter tanıma öğeleri (OCR' ler), yüz tanıma, konular, duygular vb. gibi video içgörülerini içeren JSON oluşturur. Her içgörü türü, videoda içgörülerin ne zaman görüntülendiğini gösteren zaman aralıklarının örneklerini içerir.

Web portalında her içgörü JSON yanıtını almayı ve API'yi kullanmayı öğrenmek için içgörüler tablosundaki bağlantıları kullanın.

İçgörüler

İçgörü Açıklama
Yüz algılama Yüz algılama, bir medya dosyasındaki yüzleri algılar ve benzer yüzlerin örneklerini gruplar halinde toplar. Yüz algılama içgörüleri, küçük resim ve her yüz için bir ad veya kimlik içeren bir JSON dosyasında kategorilere ayrılmış bir liste olarak oluşturulur. Web portalında bir yüzün küçük resmi seçildiğinde kişinin adı (tanındıysa), kişinin görüntülediği video yüzdesi ve ünlüyse kişinin biyografisi gibi bilgiler görüntülenir. Ayrıca, kişinin görüntülendiği videodaki örnekler arasında da kaydırma yapabilirsiniz.
Etiketler tanımlaması Etiket belirleme, güneş gözlüğü gibi görsel nesneleri veya bir medya dosyasının video görüntüsünde görünen yüzme gibi eylemleri tanımlayan bir Azure AI Video Indexer AI özelliğidir. Birçok etiket tanımlama kategorisi vardır ve ayıklandıktan sonra, etiketler tanımlama örnekleri İçgörüler sekmesinde görüntülenir ve 50'den fazla dile çevrilebilir. Etikete tıklanması medya dosyasında örneği açar, daha fazla örnek görmek için Öncekini Yürüt veya Sonrakini Oynat'ı seçin.
Nesne algılama Azure AI Video Indexer; videolardaki arabalar, el çantaları, sırt çantaları ve dizüstü bilgisayarlar gibi nesneleri algılar.
Gözlemlenen kişi algılama Gözlemlenen kişi algılama ve eşleşen yüzler, medya dosyalarındaki kişileri otomatik olarak algılar ve eşleştirilir. Gözlemlenen kişi algılama ve eşleşen yüzler, kişiler, giyimleri ve görünüşlerinin tam zaman çerçevesi hakkında içgörüler görüntülemek için ayarlanabilir.)
OCR OCR, içgörüler oluşturmak için medya dosyalarındaki resimler, sokak işaretleri ve ürünler gibi görüntülerden metin ayıklar.
Üretim sonrası: clapper board algılama Clapper kartı algılama, film çekme sırasında kullanılan ve aynı zamanda clapper kartında meta veri olarak algılanan bilgileri (örneğin, üretim, rulo, sahne, çekim vb.) sağlayan clapper panolarını algılar. Clapper board, dosyayı karşıya yükleyip dizine eklediğinizde web portalı gelişmiş ayarlarında seçebileceğiniz üretim sonrası içgörülerin bir parçasıdır.
Üretim sonrası: dijital desenler Dijital desen algılama, film çekme sırasında kullanılan renk çubuklarını algılar. Dijital desenler, dosyayı karşıya yükleyip dizine eklediğinizde web portalı gelişmiş ayarlarında seçebileceğiniz üretim sonrası içgörülerin bir parçasıdır.
Sahneler, çekimler ve ana kareler Sahne algılama, görsel ipuçlarına göre bir videoda bir sahnenin ne zaman değiştiğini algılar. Bir sahne tek bir olayı gösterir ve ilgili bir dizi çekimden oluşur.Çekimler , bitişik çerçevelerin renk düzeninde ani ve aşamalı geçişler gibi görsel ipuçlarıyla ayırt edilen bir çerçeve serisidir. Çekimin meta verileri başlangıç ve bitiş saatinin yanı sıra çekime dahil edilen ana karelerin listesini içerir. Ana kare , bir çekimi en iyi temsil eden karedir.

Sesli içgörüler

İçgörü Açıklama
Ses efektleri algılama Ses efektleri algılama akustik olayları algılar ve bunları kahkaha, kalabalık tepkileri, alarmlar ve/veya sirenler gibi kategorilere ayırır.
Anahtar sözcük ayıklama Anahtar sözcük ayıklama, medya dosyalarında açıklanan farklı anahtar sözcüklerle ilgili içgörüleri algılar. Hem tek dilde hem de çok dilli medya dosyalarındaki içgörüleri ayıklar.
Adlandırılmış varlıklar Adlandırılmış varlık ayıklama, medya dosyalarındaki ses ve görüntülerde görünen konumlar, kişiler ve markalar hakkında içgörüler elde etmek için Doğal Dil İşleme (NLP) kullanır. Adlandırılmış varlık ayıklama içgörüleri transkripsiyon ve optik karakter tanıma (OCR) kullanır.
Metin tabanlı duygu algılama Duygu algılama, video transkript satırlarındaki duyguları algılar. Başka bir duygu algılanmadıysa her cümle Öfke, Korku, Sevinç, Üzgün, Hiçbiri olarak algılanabilir.
Konu çıkarımı Konu çıkarımı, dökümü yapılan sesten, görsel metindeki OCR içeriğinden ve Video Indexer yüz tanıma modelini kullanarak videoda tanınan ünlülerden türetilen çıkarımlı içgörüler oluşturur.
Transkripsiyon, çeviri ve dil belirleme Transkripsiyon, çeviri ve dil belirleme, medya dosyalarındaki konuşmayı algılar, düzenler ve 50'den fazla dile çevirir.