Azure OpenAI Hizmeti ile içerik filtrelerini yapılandırma
Azure OpenAI Hizmeti ile tümleştirilmiş içerik filtreleme sistemi, DALL-E görüntü oluşturma modelleri de dahil olmak üzere çekirdek modellerle birlikte çalışır. Sırasıyla dört önem düzeyinde (güvenli, düşük, orta ve yüksek) dört zararlı içerik kategorisini (şiddet, nefret, cinsel ve kendine zarar verme) ve jailbreak riskini, mevcut metni ve genel depolardaki kodu algılamak için isteğe bağlı ikili sınıflandırıcıları algılamak için çok sınıflı sınıflandırma modellerinden oluşan bir grup kullanır. Varsayılan içerik filtreleme yapılandırması, hem istemler hem de tamamlamalar için dört içerik zarar kategorisi için orta önem düzeyinde filtre olacak şekilde ayarlanır. Bu, önem düzeyi orta veya yüksek olarak algılanan içeriğin filtrelendiği, önem düzeyi düşük veya güvenli olarak algılanan içeriğin ise içerik filtreleri tarafından filtrelenmediği anlamına gelir. İçerik kategorileri, önem derecesi düzeyleri ve içerik filtreleme sisteminin davranışı hakkında buradan daha fazla bilgi edinin. Jailbreak risk algılama ve korumalı metin ve kod modelleri varsayılan olarak isteğe bağlıdır ve kapalıdır. Jailbreak ve korumalı malzeme metin ve kod modelleri için, yapılandırılabilirlik özelliği tüm müşterilerin modelleri açıp kapatmasını sağlar. Modeller varsayılan olarak kapalıdır ve senaryonuza göre açılabilir. Müşteri Telif Hakkı Taahhüdü kapsamındaki kapsamı korumak için bazı modellerin belirli senaryolarda açık olması gerekir.
Not
Tüm müşteriler içerik filtrelerini değiştirme ve önem derecesi eşiklerini (düşük, orta, yüksek) yapılandırma olanağına sahiptir. İçerik filtrelerini kısmen veya tamamen kapatmak için onay gereklidir. Yönetilen müşteriler yalnızca şu form aracılığıyla tam içerik filtreleme denetimine başvurabilir: Azure OpenAI Sınırlı Erişim Gözden Geçirmesi: Değiştirilen İçerik Filtreleri. Şu anda yönetilen müşteri olmak mümkün değildir.
İçerik filtreleri kaynak düzeyinde yapılandırılabilir. Yeni bir yapılandırma oluşturulduktan sonra bir veya daha fazla dağıtımla ilişkilendirilebilir. Model dağıtımı hakkında daha fazla bilgi için bkz. kaynak dağıtım kılavuzu.
Önkoşullar
- İçerik filtrelerini yapılandırmak için bir Azure OpenAI kaynağınız ve büyük bir dil modeli (LLM) dağıtımınız olmalıdır. Başlamak için hızlı başlangıcı izleyin.
İçerik filtresi yapılandırılabilirliğini anlama
Azure OpenAI Hizmeti, Azure OpenAI Whisper hariç tüm modellere uygulanan varsayılan güvenlik ayarlarını içerir. Bu yapılandırmalar, içerik filtreleme modelleri, blok listeleri, istem dönüştürme, içerik kimlik bilgileri ve diğerleri dahil olmak üzere varsayılan olarak sorumlu bir deneyim sunar. Bu konuda daha fazla bilgiyi burada bulabilirsiniz.
Ayrıca tüm müşteriler içerik filtrelerini yapılandırabilir ve kullanım örneği gereksinimlerine göre uyarlanmış özel güvenlik ilkeleri oluşturabilir. Yapılandırılabilirlik özelliği, müşterilerin aşağıdaki tabloda açıklandığı gibi her içerik kategorisinin içeriğini farklı önem düzeylerinde filtrelemek üzere istemler ve tamamlamalar için ayrı olarak ayarları yapmasına olanak tanır. 'Güvenli' önem düzeyinde algılanan içerik ek açıklamalarda etiketlenmiştir, ancak filtrelemeye tabi değildir ve yapılandırılamaz.
Önem derecesi filtrelendi | İstemler için yapılandırılabilir | Tamamlamalar için yapılandırılabilir | Açıklamalar |
---|---|---|---|
Düşük, orta, yüksek | Yes | Yes | En katı filtreleme yapılandırması. Önem derecesi düşük, orta ve yüksek düzeylerde algılanan içeriğe filtre uygulanmış. |
Orta, yüksek | Yes | Yes | Önem derecesi düşük düzeyde algılanan içerik filtrelenmez, orta ve yüksek düzeydeki içerik filtrelenmiştir. |
Yüksek | Yes | Yes | Önem derecesi düşük ve orta düzeylerde algılanan içerik filtrelenmez. Yalnızca önem derecesi yüksek içerik filtrelenmiştir. |
Filtre yok | Onaylanırsa1 | Onaylanırsa1 | Algılanan önem düzeyinden bağımsız olarak hiçbir içerik filtrelenmez. Onaygerektirir 1. |
Yalnızca açıklama ekle | Onaylanırsa1 | Onaylanırsa1 | Filtre işlevini devre dışı bırakır, bu nedenle içerik engellenmez, ancak ek açıklamalar API yanıtı aracılığıyla döndürülür. Onaygerektirir 1. |
1 Azure OpenAI modellerinde yalnızca değiştirilmiş içerik filtrelemesi için onaylanan müşteriler tam içerik filtreleme denetimine sahiptir ve içerik filtrelerini kapatabilir. Değiştirilen içerik filtreleri için şu form aracılığıyla uygulayın: Azure OpenAI Sınırlı Erişim gözden geçirmesi: Değiştirilen İçerik Filtreleri. Azure Kamu müşteriler için şu form aracılığıyla değiştirilmiş içerik filtreleri için uygulayın: Azure Kamu - Azure OpenAI Hizmeti için Değiştirilmiş İçerik Filtreleme İsteği.
Girişler (istemler) ve çıkışlar (tamamlamalar) için yapılandırılabilir içerik filtreleri aşağıdaki Azure OpenAI modelleri için kullanılabilir:
- GPT model serisi
- GPT-4 Turbo Vision GA* (
turbo-2024-04-09
) - GPT-4o
- GPT-4o mini
- DALL-E 2 ve 3
Yapılandırılabilir içerik filtreleri
- o1-önizleme
- o1-mini
*Yalnızca GPT-4 Turbo Vision GA için kullanılabilir, GPT-4 Turbo Görüntü İşleme önizlemesi için geçerli değildir
İçerik filtreleme yapılandırmaları Azure AI Studio'daki bir Kaynak içinde oluşturulur ve Dağıtımlarla ilişkilendirilebilir. Yapılandırılabilirlik hakkında daha fazla bilgiyi burada bulabilirsiniz.
Müşteriler, Azure OpenAI'yi tümleştiren uygulamaların Kullanım Kuralları ile uyumlu olduğundan emin olmakla sorumludur.
Diğer filtreleri anlama
Varsayılan zarar kategorisi filtrelerine ek olarak aşağıdaki filtre kategorilerini yapılandırabilirsiniz.
Filtre kategorisi | Durum | Varsayılan ayar | İstem veya tamamlamaya uygulandı mı? | Açıklama |
---|---|---|---|---|
Doğrudan saldırılar için Kalkanları iste (jailbreak) | GA | Açık | Kullanıcı istemi | Jailbreak Riski sunabilecek kullanıcı istemlerini filtreler / açıklama ekler. Ek açıklamalar hakkında daha fazla bilgi için Bkz . Azure OpenAI Hizmeti içerik filtreleme. |
Dolaylı saldırılar için Kalkanları iste | GA | Açık | Kullanıcı istemi | Dolaylı İstem Saldırıları veya Etki Alanları Arası İstem Ekleme Saldırıları olarak da adlandırılan Dolaylı Saldırılara filtre uygulama/açıklama ekleme; üçüncü tarafların, oluşturan yapay zeka sisteminin erişebileceği ve işleyebileceği belgelerin içine kötü amaçlı yönergeler yerleştirdiği olası bir güvenlik açığıdır. Gerekli: Belge biçimlendirmesi. |
Korumalı malzeme - kod | GA | Açık | Tamamlama | Korumalı kodu filtreler veya GitHub Copilot tarafından desteklenen genel kod kaynaklarıyla eşleşen kod parçacıkları için ek açıklamalarda örnek alıntı ve lisans bilgilerini alır. Ek açıklamaları kullanma hakkında daha fazla bilgi için içerik filtreleme kavramları kılavuzuna bakın |
Korumalı malzeme - metin | GA | Açık | Tamamlama | Bilinen metin içeriğinin model çıkışında (örneğin, şarkı sözleri, tarifler ve seçili web içeriği) görüntülenmesini tanımlar ve engeller. |
Azure OpenAI Studio aracılığıyla içerik filtrelerini yapılandırma
Aşağıdaki adımlarda kaynağınız için özelleştirilmiş içerik filtreleme yapılandırmasının nasıl ayarlanacağı gösterilmektedir.
Azure OpenAI Studio'ya gidin ve İçerik Filtreleri sekmesine gidin (sol alt gezinti bölmesinde, aşağıdaki kırmızı kutuyla belirtildiği gibi).
Yeni bir özelleştirilmiş içerik filtreleme yapılandırması oluşturun.
Bu, özel içerik filtreleme yapılandırması için bir ad seçebileceğiniz aşağıdaki yapılandırma görünümüne yol açar. Bir ad girdikten sonra, giriş filtrelerini (kullanıcı istemleri) ve çıkış filtrelerini (model yanıtı) yapılandırabilirsiniz. İlk dört içerik kategorisi için yapılandırılabilir üç önem düzeyi vardır: Düşük, orta ve yüksek. Uygulamanızın veya kullanım senaryonuzun varsayılan değerlerden farklı filtreleme gerektirdiğini belirlerseniz, önem eşiğini ayarlamak için kaydırıcıları kullanabilirsiniz. Bazı filtreler, modelin açıklama eklemesi ve/veya engellemesi gerekip gerekmediğini belirlemenizi sağlar. Açıklama ekle'yi seçtiğinizde ilgili model çalıştırılır ve API yanıtı aracılığıyla ek açıklamalar döndürülür, ancak içerik filtrelenmez. Ek açıklamalara ek olarak, Filtrele iki durumlu düğmesini açık olarak değiştirerek içeriği filtrelemeyi de seçebilirsiniz.
Kullanım örneğiniz yukarıda açıklandığı gibi değiştirilmiş içerik filtreleri için onaylandıysa, içerik filtreleme yapılandırmaları üzerinde tam denetim sahibi olursunuz ve filtrelemeyi kısmen veya tamamen kapatmayı seçebilirsiniz.
Gereksinimlerinize göre birden çok içerik filtreleme yapılandırması oluşturabilirsiniz.
Ardından, özel içerik filtreleme yapılandırmasını çalışır duruma getirmek için kaynağınızdaki bir veya daha fazla dağıtıma bir yapılandırma atayın. Bunu yapmak için Dağıtımlar sekmesine gidin ve dağıtımınızı seçin. Ardından Düzenle’yi seçin.
Görüntülenen Dağıtımı güncelleştir penceresinde İçerik filtresi açılan menüsünden özel filtrenizi seçin. Ardından Kaydet ve kapat'ı seçerek seçilen yapılandırmayı dağıtıma uygulayın.
Gerekirse bir içerik filtresi yapılandırmasını düzenleyebilir ve silebilirsiniz. Bunu yapmak için içerik filtreleri sekmesine gidin ve bir yapılandırma seçin. Ardından istediğiniz eylemi seçin. Bir kerede yalnızca bir filtreleme yapılandırmasını düzenleyebilirsiniz.
Not
İçerik filtreleme yapılandırmasını silmeden önce, Dağıtımlar sekmesindeki herhangi bir dağıtımdan atamasını kaldırmanız gerekir.
En iyi yöntemleri izleyin
Belirli bir model, uygulama ve dağıtım senaryosuyla ilgili olası zararları gidermek için içerik filtreleme yapılandırma kararlarınızı yinelemeli bir tanımlama (örneğin, kırmızı ekip testi, stres testi ve analiz) ve ölçüm süreciyle bilgilendirmenizi öneririz. İçerik filtreleme gibi risk azaltmaları uyguladıktan sonra etkinliği test etmek için ölçümü yineleyin. Microsoft Sorumlu Yapay Zeka Standardı'nda temellenen Azure OpenAI için Sorumlu Yapay Zeka önerileri ve en iyi yöntemler, Azure OpenAI için Sorumlu Yapay Zekaya Genel Bakış sayfasında bulunabilir.
İlgili içerik
- Azure OpenAI için Sorumlu yapay zeka uygulamaları hakkında daha fazla bilgi edinin: Azure OpenAI modelleri için sorumlu yapay zeka uygulamalarına genel bakış.
- Azure OpenAI Hizmeti ile içerik filtreleme kategorileri ve önem düzeyleri hakkında daha fazla bilgi edinin.
- Kırmızı grup oluşturma hakkında daha fazla bilgi için bkz. Büyük dil modellerinde (LLM) kırmızı grup oluşturma makalemize giriş.