Görüntü Analizi nedir?

Makale
06/13/2024

Azure AI Görüntü İşleme Görüntü Analizi hizmeti, görüntülerinizden çok çeşitli görsel özellikleri ayıklayabilir. Örneğin, bir görüntünün yetişkinlere yönelik içerik içerip içermediğini, belirli markaları veya nesneleri veya insan yüzlerini bulup bulmadığını belirleyebilir.

Artık genel kullanıma sunulan Görüntü Analizi 4.0'ın en son sürümü, zaman uyumlu OCR ve kişi algılama gibi yeni özelliklere sahiptir. Bundan sonra bu sürümü kullanmanızı öneririz.

Görüntü Analizi'ni bir istemci kitaplığı SDK'sı aracılığıyla veya REST API'yi doğrudan çağırarak kullanabilirsiniz. Başlamak için hızlı başlangıcı izleyin.

Hızlı Başlangıç

Alternatif olarak, Görüntü Analizi'nin özelliklerini Vision Studio'yu kullanarak tarayıcınızda hızlı ve kolay bir şekilde deneyebilirsiniz.

Vision Studio'yu deneyin

Bu belge aşağıdaki makale türlerini içerir:

Hızlı başlangıçlar , hizmete çağrı yapmanıza ve kısa bir süre içinde sonuç almanıza olanak sağlayan adım adım yönergelerdir.
Nasıl yapılır kılavuzları , hizmeti daha belirli veya özelleştirilmiş yollarla kullanmaya yönelik yönergeler içerir.
Kavramsal makaleler , hizmetin işlevselliği ve özellikleri hakkında ayrıntılı açıklamalar sağlar.
Öğreticiler, bu hizmetin daha geniş iş çözümlerinde bileşen olarak nasıl kullanılacağını gösteren daha uzun kılavuzlardır.

Daha yapılandırılmış bir yaklaşım için Görüntü Analizi için eğitim modülünü izleyin.

Azure AI Vision hizmetiyle görüntüleri analiz etme

Görüntü Analizi sürümleri

Önemli

Gereksinimlerinize en uygun Görüntü Analizi API'sini seçin.

Sürüm	Kullanılabilir özellikler	Tavsiye
sürüm 4.0	Metin okuma, Resim Yazıları, Yoğun açıklamalı alt yazılar, Etiketler, Nesne algılama, Özel görüntü sınıflandırması / nesne algılama, Kişiler, Akıllı kırpma	Daha iyi modeller; kullanım örneğinizi destekliyorsa 4.0 sürümünü kullanın.
sürüm 3.2	Etiketler, Nesneler, Açıklamalar, Markalar, Yüzler, Görüntü türü, Renk düzeni, Yer İşaretleri, Ünlüler, Yetişkin içeriği, Akıllı kırpma	Daha geniş özellik yelpazesi; kullanım örneğinin sürüm 4.0'da henüz desteklenmemesi durumunda 3.2 sürümünü kullanın

Kullanım örneğinizi destekliyorsa Görüntü Analizi 4.0 API'sini kullanmanızı öneririz. Kullanım örneğiniz henüz 4.0 tarafından desteklenmiyorsa 3.2 sürümünü kullanın.

Görüntü açıklamalı alt yazılar yapmak istiyorsanız ve Görüntü İşleme kaynağınız desteklenen Azure bölgelerinin dışındaysa 3.2 sürümünü de kullanmanız gerekir. Görüntü Analizi 4.0'daki resim yazısı özelliği yalnızca belirli Azure bölgelerinde desteklenir. Sürüm 3.2'deki resim yazısı tüm Azure AI Vision bölgelerinde kullanılabilir. Bkz. Bölge kullanılabilirliği.

Görüntüyü Analiz Et

Görüntüleri analiz ederek görsel özellikleri ve özellikleri hakkında içgörüler sağlayabilirsiniz. Bu listedeki tüm özellikler Görüntü Analizi API'si tarafından sağlanır. Başlamak için hızlı başlangıcı izleyin.

Veri Akışı Adı	Açıklama	Kavram sayfası
Model özelleştirme (yalnızca v4.0 önizlemesi)	Görüntü sınıflandırma veya nesne algılama yapmak için özel modeller oluşturabilir ve eğitebilirsiniz. Kendi görüntülerinizi getirin, bunları özel etiketlerle etiketleyin ve Görüntü Analizi, kullanım örneğiniz için özelleştirilmiş bir model eğiter.	Model özelleştirme
Görüntülerden metin okuma (yalnızca v4.0)	Görüntü Analizi sürüm 4.0 önizlemesi, görüntülerden okunabilir metin ayıklama olanağı sunar. Zaman uyumsuz Görüntü İşleme 3.2 Okuma API'siyle karşılaştırıldığında, yeni sürüm tek bir API çağrısında diğer içgörülerle birlikte OCR'yi almayı kolaylaştıran birleşik bir performans gelişmiş zaman uyumlu API'de tanıdık Read OCR altyapısını sunar.	Görüntüler için OCR
Görüntülerdeki kişileri algılama (yalnızca v4.0)	Görüntü Analizi'nin 4.0 sürümü, görüntülerde görünen kişileri algılama olanağı sunar. Algılanan her kişinin sınırlayıcı kutu koordinatları, güvenilirlik puanıyla birlikte döndürülür.	Kişi algılama
Resim yazısı oluşturma	Tümceleri kullanarak, insan tarafından okunabilen bir dilde bir resmin resim yazısı oluşturun. Görüntü İşleme algoritmaları, görüntüde tanımlanan nesneleri temel alan açıklamalı alt yazılar oluşturur. Sürüm 4.0 resim yazısı modeli daha gelişmiş bir uygulamadır ve daha geniş bir giriş görüntüsü yelpazesiyle çalışır. Yalnızca belirli coğrafi bölgelerde kullanılabilir. Bkz. Bölge kullanılabilirliği. Sürüm 4.0 ayrıca, görüntüde bulunan tek tek nesneler için ayrıntılı açıklamalı alt yazılar oluşturan yoğun açıklamalı alt yazıları kullanmanıza da olanak tanır. API, görüntüde bulunan her nesnenin sınırlayıcı kutu koordinatlarını (piksel cinsinden) ve bir resim yazısı döndürür. Bir görüntünün ayrı bölümlerinin açıklamalarını oluşturmak için bu işlevi kullanabilirsiniz.	Resim yazısı oluşturma (v3.2) (v4.0)
Nesneleri algılama	Nesne algılama etiketlemeye benzer, ancak API uygulanan her etiket için sınırlayıcı kutu koordinatlarını döndürür. Örneğin, bir görüntüde köpek, kedi ve kişi varsa, Algıla işlemi bu nesneleri görüntüdeki koordinatlarıyla birlikte listeler. Bir görüntüdeki nesneler arasındaki daha fazla ilişkiyi işlemek için bu işlevi kullanabilirsiniz. Ayrıca, bir görüntüde aynı etiketin birden çok örneği olduğunda da sizi haberdar eder.	Nesneleri algılama (v3.2) (v4.0)
Görsel özellikleri etiketleme	Binlerce tanınabilir nesne, canlı, manzara ve eylem kümesinden görüntüdeki görsel özellikleri tanımlayın ve etiketleyin. Etiketler belirsiz olduğunda veya yaygın bilgi olmadığında, API yanıtı etiketin bağlamını netleştirmek için ipuçları sağlar. Etiketleme yalnızca temel konu ile sınırlı kalmayıp ortam (iç mekân veya dış mekân), mobilyalar, aletler, bitkiler, hayvanlar, aksesuarlar, araçlar ve benzer öğeleri de kapsar.	Etiket görseli özellikleri (v3.2) (v4.0)
İlgi alanını alın / akıllı ürün	Belirli bir en boy oranıyla eşleşen ilgi alanının koordinatlarını döndürmek için görüntünün içeriğini analiz edin. Görüntü İşleme bölgenin sınırlayıcı kutu koordinatlarını döndürür, böylece çağıran uygulama özgün görüntüyü istediğiniz gibi değiştirebilir. Sürüm 4.0 akıllı kırpma modeli daha gelişmiş bir uygulamadır ve daha geniş bir giriş görüntüsü yelpazesiyle çalışır. Yalnızca belirli coğrafi bölgelerde kullanılabilir. Bkz. Bölge kullanılabilirliği.	Küçük resim oluşturma (v3.2) (v4.0 önizlemesi)
Markaları algılama (yalnızca v3.2)	Binlerce küresel logo içeren bir veritabanındaki resim veya videolardaki ticari markaları tanımlayın. Bu özelliği, örneğin, hangi markaların sosyal medyada en popüler olduğunu veya medya ürün yerleştirmede en yaygın olduğunu keşfetmek için kullanabilirsiniz.	Markaları algılama
Görüntüyü kategorilere ayırma (yalnızca v3.2)	Üst/alt öğe kalıtım hiyerarşileri içeren bir kategori sınıflandırması kullanarak bir görüntüyü bütünüyle tanımlayın ve kategorilere ayırın. Kategoriler tek başına veya yeni etiketleme modellerimizle birlikte kullanılabilir. Şu anda, görüntülerin etiketlenmesi ve kategorilere ayrılması için yalnızca İngilizce desteklenmektedir.	Bir görüntüyü kategorilere ayırma
Yüzleri algılama (yalnızca v3.2)	Bir görüntüdeki yüzleri algılayın ve algılanan her bir yüz için bilgiler sunun. Azure AI Vision, algılanan her yüz için koordinatları, dikdörtgeni, cinsiyeti ve yaşı döndürür. Bu amaçlar için ayrılmış Yüz Tanıma API'sini de kullanabilirsiniz. Yüz tanıma ve poz algılama gibi daha ayrıntılı analiz sağlar.	Yüz algılama
Görüntü türlerini algılama (yalnızca v3.2)	Bir görüntü ile ilgili özellikleri (görüntünün çizim olup olmaması veya küçük resim olup olmama olasılığı gibi) algılayın.	Görüntü türünü algılama
Etki alanına özgü içeriği algılama (yalnızca v3.2)	Bir görüntüde yer alan, ünlüler ve önemli yerler gibi etki alanına özgü içerikleri algılamak ve tanımak için etki alanı modelleri kullanın. Örneğin, bir görüntüde kişiler varsa Azure AI Vision, görüntüde algılanan kişilerin ünlü olup olmadığını belirlemek üzere ünlüler için bir etki alanı modeli kullanabilir.	Etki alanına özgü içeriği algılama
Renk düzenini algılama (yalnızca v3.2)	Bir görüntüdeki renk kullanımını analiz edin. Azure AI Vision, görüntünün siyah beyaz mı yoksa renkli mi olduğunu belirleyebilir ve renkli görüntüler için baskın ve vurgu renklerini belirleyebilir.	Renk düzenini algılama
Görüntülerdeki içeriği denetleme (yalnızca v3.2)	Bir görüntüdeki yetişkinlere yönelik içeriği algılamak ve farklı sınıflandırmalar için güvenilirlik puanları döndürmek için Azure AI Vision'ı kullanabilirsiniz. İçerik etiketleme eşiği, tercihlerinize uyum sağlamak için kayan bir ölçekte ayarlanabilir.	Yetişkinlere açık içeriği algılama

İpucu

Azure OpenAI hizmeti aracılığıyla Görüntü Analizi'nin Metin okuma ve Nesne algılama özelliklerini kullanabilirsiniz. GpT-4 Görüntü İşlemeli Turbo modeli, paylaştığınız görüntüleri analiz eden bir yapay zeka yardımcısı ile sohbet etmenizi sağlar ve Görüntü geliştirme seçeneği görüntü hakkında daha fazla ayrıntı (okunabilir metin ve nesne konumları) yapay zeka yardımı sağlamak için Görüntü Analizi'ni kullanır. Daha fazla bilgi için bkz . GPT-4 Turbo with Vision hızlı başlangıcı.

Ürün Tanıma (yalnızca v4.0 önizlemesi)

Ürün Tanıma API'leri, perakende satış mağazasındaki rafların fotoğraflarını analiz etmenizi olanaklı kılmaktadır. Ürünlerin varlığını veya yokluğunu algılayabilir ve sınırlayıcı kutu koordinatlarını alabilirsiniz. Modeli belirli ürünlerinizi tanımlamak üzere eğitmek için model özelleştirmesiyle birlikte kullanın. Ürün Tanıma sonuçlarını mağazanızın planogram belgesiyle de karşılaştırabilirsiniz.

Ürün Tanıma

Çok modüllü eklemeler (yalnızca v4.0)

Çok modüllü ekleme API'leri, görüntülerin ve metin sorgularının vektörleştirilmesini sağlar. Görüntüleri çok boyutlu vektör uzayında koordinatlara dönüştürürler. Ardından, gelen metin sorguları vektörlere dönüştürülebilir ve görüntüler semantik yakınlık temelinde metinle eşleştirilebilir. Bu, kullanıcının görüntü etiketlerini veya diğer meta verileri kullanmaya gerek kalmadan metin kullanarak bir görüntü kümesinde arama yapmasına olanak tanır. Anlamsal yakınlık genellikle aramada daha iyi sonuçlar üretir.

API, 2024-02-01 102 dilde metin aramayı destekleyen çok dilli bir model içerir. Özgün yalnızca İngilizce modeli hala kullanılabilir, ancak aynı arama dizinindeki yeni modelle birleştirilemez. Yalnızca İngilizce modeli kullanarak metin ve görüntüleri vektörleştirdiyseniz, bu vektörler çok dilli metin ve görüntü vektörleriyle uyumlu olmayacaktır.

Bu API'ler yalnızca belirli coğrafi bölgelerde kullanılabilir. Bkz. Bölge kullanılabilirliği.

Çok modüllü eklemeler

Arka planı kaldırma (yalnızca v4.0 önizlemesi)

Görüntü Analizi 4.0 (önizleme) bir görüntünün arka planını kaldırma olanağı sunar. Bu özellik, algılanan ön plan nesnesinin saydam arka planı olan bir görüntüsünü veya algılanan ön plan nesnesinin opaklığını gösteren gri tonlamalı alfa mat bir görüntü oluşturabilir.

Arka planı kaldırma

Özgün resim	Arka plan kaldırılmış	Alfa mat

Hizmet sınırları

Görüntü Analizi aşağıdaki gereksinimleri karşılayan görüntüleri analiz edebilir:

Görüntü JPEG, PNG, GIF, BMP, WEBP, ICO, TIFF veya MPO biçiminde olmalıdır
Görüntünün dosya boyutunun 20 megabayt (MB) değerini aşmaması gerekir
Görüntünün boyutları 50x50 pikselden büyük ve 16.000x16.000 pikselden küçük olmalıdır

İpucu

Çok modüllü eklemeler için giriş gereksinimleri farklıdır ve Multimodal eklemeler bölümünde listelenmiştir

Dil desteği

Farklı dillerde farklı Görüntü Analizi özellikleri kullanılabilir. Dil desteği sayfasına bakın.

Bölgesel kullanılabilirlik

Görüntü Analizi API'lerini kullanmak için Azure AI Vision kaynağınızı desteklenen bir bölgede oluşturmanız gerekir. Görüntü Analizi özellikleri aşağıdaki bölgelerde kullanılabilir:

Bölge	Görüntüyü Analiz Et (eksi 4.0 Resim Yazısı)	Görüntüyü Analiz Et (4.0 Resim Yazıları dahil)	Ürün Tanıma	Çok modüllü eklemeler	Arka planı kaldırma
Doğu ABD	✅	✅	✅	✅	✅
Batı ABD	✅	✅		✅	✅
Batı ABD 2	✅		✅	✅
Orta Fransa	✅	✅		✅	✅
Kuzey Avrupa	✅	✅		✅	✅
West Europe	✅	✅		✅	✅
Orta İsveç	✅			✅
Kuzey İsviçre	✅			✅
Doğu Avustralya	✅			✅
Güneydoğu Asya	✅	✅		✅	✅
Doğu Asya	✅	✅
Güney Kore - Orta	✅	✅		✅	✅
Doğu Japonya	✅			✅

Veri gizliliği ve güvenliği

Tüm Azure yapay zeka hizmetlerinde olduğu gibi, Azure AI Vision hizmetini kullanan geliştiriciler de Microsoft'un müşteri verilerine yönelik ilkelerinin farkında olmalıdır. Daha fazla bilgi edinmek için Microsoft Güven Merkezi'nin Azure AI hizmetleri sayfasına bakın.

Sonraki adımlar

Tercih ettiğiniz geliştirme dilindeki hızlı başlangıç kılavuzunu izleyerek Görüntü Analizi'ni kullanmaya başlayın:

Aracılığıyla paylaş