Microsoft Foundry portalında İçerik Güvenliği (klasik)

Yalnızca şunlar için geçerlidir:Dökümhane (klasik) portalı. Bu makale yeni Dökümhane portalında kullanılamaz. Yeni portal hakkında daha fazla bilgi edinin.

Uyarı

Bu makaledeki bağlantılar, şu anda görüntülediğiniz Dökümhane (klasik) belgeleri yerine yeni Microsoft Foundry belgelerinde içerik açabilir.

Azure Yapay Zeka İçerik Güvenliği, uygulama ve hizmetlerde kullanıcı tarafından oluşturulan ve yapay zeka tarafından oluşturulan zararlı içerikleri algılayan bir yapay zeka hizmetidir. Azure Yapay Zeka İçerik Güvenliği, zararlı içeriğin çıkışını algılamanıza ve önlemenize yardımcı olan API'leri içerir. Microsoft Foundry portalındaki etkileşimli İçerik Güvenliği inceleme sayfası, farklı yöntemler üzerindeki zararlı içerikleri algılamak için örnek kodu görüntülemenize, keşfetmenize ve denemenize olanak tanır.

Özellikler

Aşağıdaki senaryolar için Azure Yapay Zeka İçerik Güvenliği kullanın:

Metin içeriği

  • Metin içeriğini ortala: Metin içeriğini tarar ve denetler. Uygun yanıtları sağlamak için metni farklı önem düzeylerine göre tanımlar ve kategorilere ayırır.
  • Gerçeklik tespiti: Yapay zekanın yanıtlarının güvenilir, kullanıcı tarafından sağlanan kaynaklara dayalı olup olmadığını belirler. Bu özellik, yanıtların hedeflenen malzemeye dayalı olmasını sağlar. Temellendirme algılama, yanıtların güvenilirliğini ve olgusal doğruluğunu artırmaya yardımcı olur.
  • Metin için korumalı malzeme algılama: Bilinen şarkı sözleri, makaleler veya diğer içerikler gibi korumalı metin malzemelerini tanımlar. Bu özellik, yapay zekanın bu içeriği izni olmadan çıkışını yapmamasını sağlar.
  • Kod için korumalı malzeme algılama: Modelin çıkışında ortak depolardan gelen bilinen kodla eşleşen kod kesimlerini algılar. Bu özellik, kaynak kodun izinsiz veya yetkisiz çoğaltılmasını önlemeye yardımcı olur.
  • İstem kalkanları: "Jailbreak" ve "Dolaylı Saldırıları" ele almak için birleşik bir API sağlar:
    • Jailbreak Saldırıları: Kullanıcıların güvenlik protokollerini veya etik yönergelerini atlayarak yapay zekayı yönlendirme girişimleri. Örneklere, yapay zekayı uygunsuz yanıtlar vermeye kandırmak veya önlemesi için programlandığı görevleri gerçekleştirmeye itmek amacıyla tasarlanmış istemler dahildir.
    • Dolaylı Saldırılar: Etki Alanları Arası İstem Ekleme Saldırıları olarak da bilinir. Dolaylı saldırılar, yapay zekanın işleyebileceği belgelere kötü amaçlı istemler eklemeyi içerir. Örneğin, bir belgede gizli yönergeler varsa yapay zeka bunları yanlışlıkla takip ederek istenmeyen veya güvenli olmayan çıkışlara yol açabilir.

Resim içeriği

  • Orta düzey görüntü içeriği: Metin denetimine benzer şekilde, bu özellik uygunsuz veya zararlı görselleri algılamak için görüntü içeriğini filtreler ve değerlendirir.
  • Orta düzeyde çok modüllü içerik: Metin ve görüntülerin birleşimini işlemek için tasarlanmıştır. Genel bağlamı ve birden çok içerik türündeki olası riskleri değerlendirir.

Özel filtreleme

  • Özel kategoriler: Kullanıcıların içeriği denetlemek ve filtrelemek için belirli kategoriler tanımlamasına olanak tanır. Güvenlik protokollerini benzersiz ihtiyaçlara göre uyarlar.
  • Güvenlik sistemi iletisi: Yapay zekaya istenen davranış ve sınırlamaları bildirmek için bir "Sistem İletisi" ayarlamak için bir yöntem sağlar. Güvenlik sınırlarını güçlendirir ve istenmeyen çıkışların önlenmesine yardımcı olur.

Zarar kategorilerini anlama

Zarar kategorileri

Kategori Description API terimi
Nefret ve Eşitlik Nefret ve adalet zararları, bu grupların belirli ayırt edici özniteliklerine dayalı olarak bir kişiye ya da kimlik grubuna saldıran veya ayrımcı dil kullanan içeriklere başvurur.

Bu, şunları içerir ancak bunlarla sınırlı değildir:
  • Irk, etnik köken, milliyet
  • Cinsiyet kimlik grupları ve ifadesi
  • Cinsel yönelim
  • Din
  • Kişisel görünüm ve vücut boyutu
  • Engellilik durumu
  • Taciz ve zorbalık
Hate
Seksüel Cinsel, anatomik organlar ve cinsel organlar, romantik ilişkiler ve cinsel eylemlerle ilgili dili tanımlar; erotik veya sevgi dolu terimlerle betimlenen, bir saldırı olarak veya zorla, mağdurun isteği hilafına gerçekleştirilen cinsel şiddet eylemlerini de içerir.

Buna şunlar dahildir ancak bunlarla sınırlı değildir:
  • Kaba içerik
  • Fuhuş
  • Çıplaklık ve Pornografi
  • Suiistimal
  • Çocuk istismarı, çocuk suistimali, çocuğun istismara hazırlanması
Sexual
Şiddet Şiddet, birini veya bir şeyi yaralayan, yaralayan, zarar verecek veya öldürmeye yönelik fiziksel eylemlerle ilgili dili tanımlar; silahları, silahları ve ilgili varlıkları açıklar.

Buna şunlar dahildir ancak bunlarla sınırlı değildir:
  • Silahlar
  • Zorbalık ve gözdağı verme
  • Terörist ve şiddet dolu aşırılık
  • Taciz amaçlı takip
Violence
Kendine Zarar Verme Kendine zarar verme, kişinin kasıtlı olarak kendi bedenine zarar vermek, yaralamak veya kendini öldürmek amacıyla yaptığı fiziksel eylemlerle ilgili dili ifade eder.

Buna şunlar dahildir ancak bunlarla sınırlı değildir:
  • Yeme Bozuklukları
  • Zorbalık ve gözdağı verme
SelfHarm
Göreve Bağlılık Yapay Zeka Aracılarının kullanıcı yönergeleri ve görev hedefleriyle tutarlı bir şekilde uyumlu davranmasını sağlamaya yardımcı olur. Yanlış hizalanmış araç çağrıları, kullanıcı amacına göre yanlış araç girişi veya çıkışı ve yanıtlarla müşteri girişi arasındaki tutarsızlıklar gibi tutarsızlıkları tanımlar.

Ciddiyet seviyeleri

Seviye Description
Güvenli İçerik şiddet, kendine zarar verme, cinsel veya nefret kategorilerine bağlı olabilir. Ancak terimler, çoğu hedef kitle için uygun olan genel, gazetecilik, bilimsel, tıbbi ve benzer profesyonel bağlamlarda kullanılır.
Low Önyargılı, yargılayıcı veya düşünceli görüşleri ifade eden içerik; dilin rahatsız edici kullanımını, klişeleme, kurgusal bir dünyayı keşfeden kullanım örneklerini (örneğin, oyun, edebiyat) ve düşük yoğunlukta tasvirleri içerir.
Orta Belirli kimlik gruplarına karşı rahatsız edici, aşağılayıcı, alaycı, göz korkutucu veya küçültücü dil kullanan içerik, orta şiddette zarar verici talimatların aranması ve uygulanmasına yönelik tasvirler, fanteziler, yüceltme, zararların teşviki gibi ögeleri içerir.
Yüksek Açık ve ciddi zararlı talimatlar, eylemler, hasar veya kötüye kullanım sergileyen içerik; ciddi zararlı eylemlerin onaylanması, yüceltilmesi veya teşvike edilmesi, aşırı veya yasa dışı zarar türleri, radikalleşme ya da rıza dışı güç alışverişi veya kötüye kullanımını içerir.

Sınırlamalar

Tüm özellikler için desteklenen bölgeler, hız sınırları ve giriş gereksinimleri için bkz. Content Safety hizmetine genel bakış. Desteklenen diller için Language support sayfasına bakın.

Sonraki adım

How-to guide izleyerek Foundry portalında Azure Yapay Zeka İçerik Güvenliği kullanmaya başlayın.