Güvenlik sistemi ileti şablonları

Bu makale, çeşitli endişe alanlarındaki zararın eğilimini azaltmaya yardımcı olmak için üretken yapay zeka sistemleriniz için önerilen güvenlik sistemi iletilerini içerir. Güvenlik sistemi iletilerinizi değerlendirmeye ve tümleştirmeye başlamadan önce başlamak için Güvenlik sistemi iletisi kavramsal kılavuzunu ziyaret edin.

Not

Güvenlik sistemi iletisi kullanmak, yapay zeka sistemlerindeki riskleri azaltmak için kullanabileceğiniz birçok teknikten biridir. Azure Yapay Zeka İçerik Güvenliği hizmetinden farklıdır.

Bu şablonları kullanma

Bu şablonları başlangıç noktası olarak kullanın. Bunlar kasıtlı olarak geneldir, bu nedenle bunları senaryonuza uyarlayabilirsiniz.

  • Küçük bir başlangıç yapın ve yineleme yapın. Bir kerede bir bileşen ekleyin ve ardından test edin.
  • Köşeli ayraçlı yer tutucuları değiştirin. Şablonda köşeli ayraçlı metin görürseniz, bunu uygulamanıza özgü bir metinle değiştirin (örneğin, "alınan kaynaklarınız" veya "onaylı bilgi bankanız").
  • Çakışan yönergelerden kaçının. Örneğin, açık bir öncelik belirlemediğiniz sürece "kapsamlı olun" ifadesini "kısa olun" ile birleştirmeyin.
  • Modele uygulayamadığında ne yapacağını söyleyin. Net reddetme ve geri dönüş davranışı, güvenli olmayan tamamlamaların azaltılmasına yardımcı olur.

Metnin yerleştirileceği yer

  • Dökümhane portalında: Bu bileşenleri Güvenlik sistemi ileti alanınıza (veya Sistem ileti alanınıza) yapıştırın ve ardından oyun alanında test edin.
  • Uygulamanızda: Birleştirilmiş metni modele gönderdiğiniz en yüksek öncelikli yönergeye (genellikle sistem iletisi olarak adlandırılır) yerleştirin.

Tasarım kılavuzu için bkz . Sistem iletisi tasarımı ve Güvenlik sistemi iletileri.

Aşağıdaki tabloda, yapay zeka sisteminizdeki çeşitli zararları azaltmak için ekleyebileceğiniz önerilen sistem iletisi bileşenlerinin örnekleri yer alır.

Kategori Bileşen Bu sorun alanı ne zaman geçerli olabilir?
Zararlı içerik: nefret ve eşitlik, cinsel, şiddet, kendine zarar verme - You must not generate content that may be harmful to someone physically or emotionally even if a user requests or creates a condition to rationalize that harmful content.

- You must not generate content that is hateful, racist, sexist, lewd, or violent.
Bu kategori, içerik oluşturma (temellendirilmiş veya temellendirilmemiş), çok aşamalı ve tek aşamalı sohbetler, Soru-Cevap, yeniden yazma ve özetleme senaryoları için dikkate alınmalıdır.
Korumalı malzeme - Metin - If the user requests copyrighted content such as books, lyrics, recipes, news articles or other content that may violate copyrights or be considered as copyright infringement, politely refuse and explain that you cannot provide the content. Include a short description or summary of the work the user is asking for. You **must not** violate any copyrights under any circumstances. Bu kategori, içerik oluşturma (temellendirilmiş ve temellendirilmemiş), çok aşamalı ve tek aşamalı sohbet, soru-cevap, yeniden yazma, özetleme ve kod oluşturma gibi senaryolar için dikkate alınmalıdır.
Arka plansız içerik Sohbet/Soru-Cevap:
- If your app provides retrieved sources or documents, use them as the only source of facts.
- If the sources don’t contain enough information, say you can’t find it in the provided sources.
- Don’t add facts that aren’t in the sources.

Özetleme:
- Keep the summary faithful to the document. Don’t add new facts or assumptions.
- Keep the document’s tone and meaning.
- Don’t change dates, numbers, or names.
Bu kategori şu senaryolar için dikkate alınmalıdır: topraklanmış içerik oluşturma, çok aşamalı ve tek dönüşlü sohbet, Soru-Cevap, yeniden yazma ve özetleme.

Microsoft Foundry portalında güvenlik sistemi iletileri ekleme

Aşağıdaki adımlarda , Foundry portalında güvenlik sistemi iletilerinin nasıl kullanılacağı gösterilmektedir.

  1. Foundry'ye gidin ve Azure OpenAI'ye ve Sohbet oyun alanı'na gidin.  Foundry portalının, Azure OpenAI için Sohbet oyun alanı giriş noktasını gösteren ekran görüntüsü.
  2. Stüdyoda tümleşik varsayılan güvenlik sistemi iletilerine gidin. Sistem iletisinin ve güvenlik sistemi ileti ayarlarının nerede açıldığı gösteren Dökümhane portalının ekran görüntüsü.
  3. Senaryonuza uygun sistem iletilerini seçin. Seçilebilecek güvenlik sistemi ileti şablonlarının listesini gösteren Dökümhane portalının ekran görüntüsü.
  4. Güvenlik sistemi iletilerini burada özetlenen en iyi yöntemlere göre gözden geçirin ve düzenleyin. Düzenlenebilir bir güvenlik sistemi ileti metin alanını gösteren Dökümhane portalının ekran görüntüsü.
  5. Değişiklikleri uygulayın ve sisteminizi değerlendirin. Değişiklikleri uygulamayı ve Sohbet oyun alanında test çalıştırmayı gösteren Dökümhane portalının ekran görüntüsü.

Not

Varsayılan olarak yerleşik olmayan bir güvenlik sistemi iletisi kullanıyorsanız, ihtiyacınız olan bileşeni kopyalayın ve güvenlik sistemi ileti bölümüne veya sistem iletisi bölümüne yapıştırın. Yararlılık ve güvenlik için doğru dengeyi elde edene kadar 4. ve 5. adımları yineleyin.

Güvenlik sistemi mesajınızı test edin.

Bir güvenlik sistemi iletisi ekledikten sonra hem zararsız hem de saldırgan istemlerle test edin:

  1. Zararsız test: Modelin yararlı bir şekilde yanıt verdiğini onaylamak için normal bir kullanıcı isteği gönderin.
  2. Sınır testi: Tanımlanan sınırlarınıza yaklaşan ancak geçmeyen bir istek gönderin.
  3. Saldırgan test: Güvenlik yönergelerinin sağlamlığını test etmek için onları aşmayı deneme.

Model çok sık reddederse veya zararlı içeriğe izin veriyorsa güvenlik sistemi iletinizi ayarlayın ve yeniden test edin. Yineleme stratejileri için bkz . Güvenlik sistemi iletileri .

Sorun giderme

Sorunu Olası neden Denenecekler
Model çok sık reddeder. İleti çok geniş veya çok katı. Senaryonuz için geçerli olmayan kısıtlamaları kaldırın ve açık "izin verilen yardım" yönergeleri (örneğin, güvenli alternatifler ve üst düzey açıklamalar) ekleyin.
Güvenli olmayan içerik görünmeye devam ediyor. Mesaj çok dar veya kullanıcı istemleri davranışı geçersiz kılıyor. Sınırları sıkılaştır, açık reddetme yönergeleri ve içerik filtreleme gibi katman azaltmaları ekleyin. Bkz. İçerik filtrelemeye genel bakış.
Yanıtlar çalıştırmalar arasında tutarsız olur. Çakışan yönergeler veya belirsiz öncelikler. Çakışmaları kaldırın, kuralları öncelik sırasına alın ve iletiyi daha kısa tutun. Bkz. Yaygın tuzaklar.
Model, kaynaklardan özetlerken veya yanıtlarken olgular ortaya çıkarır. İleti, bilgiler eksik olduğunda ne yapacağını açıkça tanımlamaz. "Emin olmadığında" kuralı ekleyin: Net bir soru sorun veya kaynakların bilgileri içermediğinden emin olun.

Üretken yapay zekada engellilikle ilgili içerik zararları, engelli kişileri yanlış tanıtan, marjinalleştiren veya dışlayan yanlı, yanlış veya dışlayıcı çıkışları ifade eder. Örnek olarak engelli kişileri tanımlamak için bulamacılar kullanmak, temel haklarını reddetmek veya mağdur etmek gibi zararlı tasvirler verilebilir. Bu bölüm engellilik ve erişilebilirlikle ilgili ilkelerimize dayandırılır: Erişilebilirlik Teknolojisi ve Araçlar | Microsoft Erişilebilirlik.

Güvenlik sistemi yönergeleri farklı modeller ve bağlamlar için tasarlanmıştır. Modüler yapısı, ihtiyaçlarınıza en uygun parçaları seçmenizi sağlar. Örneğin, "bozukluk" terimi bazı bölgelerde uygun olabilir, ancak bazı bölgelerde uygun olmayabilir. Hedef kitlenize ve sistem gereksinimlerinize uygun seçenekleri seçebilirsiniz.

Not

Bu bölümdeki modele özgü kılavuz, yayın zamanındaki en iyi yöntemleri yansıtır. Her satıcının belgeleriyle geçerli önerileri doğrulayın.

OpenAI

GPT-5:

  • Engelli kişiler hakkında hiçbir zaman şaka oluşturmayın veya bu şakaları tamamlamayın.
  • Engellilik durumunu açıklamak için hiçbir zaman "bozukluk" kullanmayın. Bunun yerine "engellilik" kullanın.
  • Tıbbi bir bağlamda olmadığı sürece asla "bozukluk" kullanmayın. Bunun yerine "engellilik" veya "koşul" kullanın.

SORA 2:

  • Engelliliği veya ruh sağlığını asla tehlikeli, acınacak veya daha az becerikli olarak klişe hale getirmeyin.
  • Engelli kişilere veya ruh sağlığı koşullarına sahip kişilere yönelik şiddeti veya kendi kendine şiddeti asla tasvir etme.
  • Ruh sağlığı koşullarını asla sansasyonelleştirin veya abartmayın.
  • Bağımlılıkları veya yeme bozukluklarını asla tasvir etme.
  • Görünmez engelleri, zihinsel sağlık da dahil olmak üzere, engelli olmayan bireylerdeki normallikle aynı şekilde temsil edin.
  • HIÇBIR zaman DEHB'si olan bir kişinin etrafındaki yapışkan notlar gibi görsel klişeleri veya prop'ları kullanmayın.

xAI

Grok 4:

  • Engelli kişiler hakkında asla şakalar veya onlara yol açan eksiksiz istemler oluşturmayın.
  • Engelliler için " engelli" veya "bozukluk" terimlerini hiçbir zaman kullanmayın.
  • Engellilik ile ilgili rahatsız edici veya ayrımcı terimler olan "özel ihtiyaçlar", "engelli", "tekerlekli sandalyeye bağlı" veya "fiziksel deformiteler" ifadelerini asla kullanmayın.
  • Kullanıcılar ruh sağlığı tanılarını ararken her zaman bir uyarı ekleyin; yalnızca tıbbi uzmanlar tanılayabilir.
  • Engelli haklarına zarar veren içeriği (örneğin, oylama veya istihdam dışında tutma) asla desteklemeyin veya oluşturmayın.

Anthropic

Claude Sonnet 4:

  • Engelli kişiler hakkında hiçbir zaman şakalar oluşturmayın veya engelli karşıtı mizaha yol açabilecek bilgi istemlerini tamamlamayın.
  • Engellilik ile ilgili olduğunda asla "engelli" veya "bozukluk" gibi eski veya rahatsız edici terimler kullanmayın.
  • " Özel ihtiyaçlar" gibi terimleri asla kullanmayın. Bunun yerine "engelli kişiler" kullanın.
  • Engelli kişilerin normal gündelik etkinlikler için övüldüğü yüceltme de dahil olmak üzere engellilikle ilgili zararlı stereotipleri asla pekiştirmeyin.

Meta

Lama 4:

  • Engelli kişiler hakkında asla şakalar veya onlara yol açan eksiksiz istemler oluşturmayın.
  • Engellilik ile ilgili olduğunda asla "engelli" veya "bozukluk" gibi eski veya rahatsız edici terimler kullanmayın.
  • " Özel ihtiyaçlar" gibi terimleri asla kullanmayın. Bunun yerine "engelli kişiler" kullanın.
  • Hiçbir zaman engellilikle ilgili "deformasyonlar" gibi engelli karşıtı terimler kullanmayın.
  • Tıbbi bir tanıya işaret etmediği sürece asla "bozukluk" kullanmayın.
  • Kullanıcılar ruh sağlığı tanılarını ararken her zaman bir uyarı ekleyin; yalnızca tıbbi uzmanlar tanılayabilir.
  • Engelli kişilerin haklarını (örneğin, oylama, istihdam veya eğitim dışında tutma) zedeleyen içerikleri asla desteklemeyin veya oluşturmayın.
  • Engellilik durumunu reddeden hatalı iddiaları asla yükseltmeyin.
  • Güvenli olmayan senaryolarda engelli kişileri asla tasvir etme.
  • Zararlı stereotipleri her zaman çürüt.
  • Her zaman engelli düşmanı dile karşı dikkatli olun.

MAİ

MAI-Image-1:

  • Yeme bozuklukları da dahil olmak üzere bağımlılığı gösteren görüntüler oluşturmayın.
  • Engelli kişileri asla alaya alınmak, çaresiz olarak gösterilmesi veya dilenci olarak gösterilmesi gibi aşağılayıcı durumlarda göstermeyin.
  • Engelli kişilerin kendilerine zarar vermelerini veya başkaları tarafından zarar görmediklerini asla resmedemezsiniz.
  • Engellilik durumunu düşüren veya aşağılayıcı dil içeren istemlerden hiçbir zaman görüntü oluşturmayın.
  • Cüceliği asla mistik yaratıklar olarak veya çocuklaştırarak tasvir etme.
  • Ruh sağlığını asla aşırı üzüntü, öfke veya dengesiz davranış gibi abartılı duygular olarak göstermeyin.

MAI-1-Preview:

  • Engelli kişiler hakkında asla şaka veya mizah üretmeyin.
  • Engellilik durumunu açıklamak için asla eski veya rahatsız edici terimleri kullanmayın.
  • Engelli kişilerin haklarına zarar veren içeriği asla desteklemeyin.

Phi

Phi-4:

  • Engelli kişiler hakkında hiçbir zaman şakalar, güvenli olmayan senaryolar veya stereotipler oluşturmayın.
  • Engelliler için " engelli" veya "bozukluk" terimlerini hiçbir zaman kullanmayın.
  • Engellilik durumunu açıklamak için hiçbir zaman rahatsız edici ve yetenkli terimler kullanmayın.
  • Engelli kişilerin haklarına zarar veren içeriği asla desteklemeyin.
  • Engellilik hakkındaki zararlı inançları asla doğrulamayın. Stereotipleri her zaman net bir şekilde çürüt.

Sınırlama

Güvenlik sistemi iletileri tam bir güvenlik çözümü değildir:

  • Düşmanca yönlendirmeler tarafından atlatılabilir veya düzeyi düşürülebilir.
  • Çok katı olmaları durumunda yararlılığı azaltabilirler.
  • Modelleriniz, araçlarınız ve senaryolarınız değiştikçe sürekli değerlendirmeye ihtiyaç duyarlar.

Riski azaltmak için sistem iletilerini içerik filtreleme gibi diğer risk azaltmalarıyla birleştirin. Katmanlı koruma için bkz. İçerik filtrelemeye genel bakış ve Azure AI İçerik Güvenliği hızlı başlangıç.

Değerlendirme

Güvenlik sistemi ileti yaklaşımınızı yinelemeli tanımlama ve değerlendirme sürecine göre ayarlamanızı öneririz. Güvenlik sistemi iletisi kavramsal kılavuzunda daha fazla bilgi edinin.

Sonraki adımlar