Windows'da Sorumlu Üretken Yapay Zeka Uygulamaları ve Özellikleri Geliştirme

Bu belge, Windows'ta üretken yapay zeka ile uygulama ve özellik oluştururken kullanılması önerilen sorumlu geliştirme uygulamalarına genel bir bakış sağlar.

Windows'ta üretken yapay zeka uygulamalarının ve özelliklerinin sorumlu şekilde geliştirilmesine yönelik yönergeler

Microsoft'taki her ekip, Windows dahil olmak üzere yapay zekayı sorumlu bir şekilde oluşturmak ve göndermek için temel ilke ve uygulamaları izler. Microsoft Sorumlu Yapay Zeka Saydamlık RaporuMicrosoft'un sorumlu geliştirme yaklaşımı hakkında daha fazla bilgi edinebilirsiniz. Windows, Ulusal Standartlar ve Teknoloji Enstitüsü (NIST) Yapay Zeka Risk Yönetimi Çerçevesi ile uyumlu olan RAI geliştirmenin temel yapılarını (idare, harita, ölçü ve yönetim) izler.

İdare - İlkeler, uygulamalar ve süreçler

Standartlar, idare ve uyumluluk süreçlerinin temelini oluşturur. Microsoft, kendi Sorumlu Yapay Zeka Standardımızı, altı ilke dahil olmak üzere geliştirmiştir, ki bu ilkeleri sorumlu yapay zeka yönergelerinizi geliştirmek için bir başlangıç noktası olarak kullanabilirsiniz. Geliştirme yaşam döngüsü uçtan uca yapay zeka ilkelerinin yanı sıra gizlilik, güvenlik ve sorumlu yapay zeka ile ilgili yasalar ve düzenlemelere uyumluluk için süreçlerinize ve iş akışlarınıza yapay zeka ilkeleri oluşturmanızı öneririz. Bu, Yapay Zeka Eşitliği Denetim Listesi ve Human-AI Etkileşimi için Yönergeleri - Microsoft Research gibi araçları kullanarak yapay zeka karşılaştırmalarını izleme ve gözden geçirme, Sorumlu yapay zeka karnesigibi araçları kullanarak sınanma ve işlemleri kullanarak yapay zeka özelliklerinizin özellikleri ve sınırlamaları ile kullanıcı ifşası ve denetimleri gibi genel belgelere kadar her bir yapay zeka özelliğinin erken değerlendirmesine kadar her bir yapay zeka özelliğinin erken değerlendirmesini içerir. Bildirim, onay, veri toplama ve işleme bilgileri vb. geçerli gizlilik yasalarına, mevzuat gereksinimlerine ve ilkelerine uygun olarak.

Harita - Riski belirleme

Riskleri belirlemek için önerilen uygulamalar şunlardır:

Uçtan uca test

Uçtan uca test, yapay zeka sisteminin amaçlandığı gibi çalıştığından ve belirlenen standartlara uydığından emin olmak için baştan sona tüm yapay zeka sistemini değerlendirir. Bu kapsamlı yaklaşım şunları içerebilir:

Kırmızı ekip oluşturma

Kırmızı ekip oluşturma terimi, geçmişte güvenlik açıklarını test etme amaçlı sistematik saldırgan saldırıları tanımlamıştır. Daha yakın zamanda, bu terim geleneksel siber güvenliğin ötesine geçti ve yapay zeka sistemlerinin birçok tür araştırmasını, testini ve saldırısını açıklamak için yaygın kullanımda gelişti.

Hem büyük dil modellerinde (LLM'ler) hem de küçük dil modellerinde (SLM) hem zararsız hem de saldırgan kullanım, nefret söylemi, şiddeti teşvik etme veya yüceltme ya da cinsel içerik gibi birçok biçim alabilen zararlı çıkışlar üretebilir. Kapsamlı kırmızı ekip oluşturma, sisteminizin stres testini yapmanızı ve sisteminizin zarar verme olasılığını azaltmak için içerik stratejinizi geliştirmenizi sağlar.

Hem üretken yapay zeka kullanan yüksek riskli sistemler hem de üretken olmayan yapay zeka kullanan düşük riskli sistemler için tüm yapay zeka sistemleri, işleve ve amaca bağlı olarak kırmızı takım testinden geçirilmelidir:

  • Resmi kırmızı grup oluşturma: Büyük dil modellerini (LLM) kullanarak üretken yapay zeka kullanan tüm yüksek riskli sistemler için bağımsız kırmızı ekip oluşturma tamamlanmalıdır. Resmi kırmızı ekip oluşturma, kırmızı ekip oluşturma etkinliklerine katılmak için kuruluşunuzun dışındaki profesyonelleri işe almayı içerir.

  • İç kırmızı ekip oluşturma: En azından tüm düşük riskli, üretken olmayan yapay zeka sistemleri için iç kırmızı ekip oluşturmayı planlayın. Bu, kuruluşunuz içindeki kişiler tarafından yapılabilir.

Kırmızı ekip oluşturma ve sisteminizin kırmızı ekip oluşturma gereksinimlerini değerlendirme hakkında daha fazla bilgi edinin: Microsoft AI Red Team

Model değerlendirmesi

Uçtan uca testin bir parçası olarak modelin kendisini değerlendirmek önemlidir.

  • Model Kartı: HuggingFace'de bulunanlar gibi genel kullanıma açık modeller için, bir modelin kullanım örneğiniz için doğru model olup olmadığını anlamak için her modelin Model Kartını kullanışlı bir başvuru olarak kontrol edebilirsiniz. Model Kartlarıhakkında daha fazla bilgi edinin.

  • El ile test: Betikler olmadan adım adım testler gerçekleştiren insanlar, model değerlendirmesinin önemli bir bileşenidir ve destekler...

    • Küçük bir öncelik sorunları kümesinde ilerleme durumunu ölçme. Belirli zararları hafifletirken, otomatik ölçüme geçmeden önce zarar artık gözlemlenmeden önce küçük bir veri kümesine karşı ilerleme durumunu el ile denetlemeye devam etmek genellikle en üretken işlemdir.

    • Otomatik ölçüm tek başına kullanılacak kadar güvenilir olana kadar ölçümleri tanımlama ve raporlama.

    • Otomatik ölçümün kalitesini ölçmek için düzenli aralıklarla noktalı kontrol.

  • Otomatik test: Otomatik olarak yürütülen testler, model değerlendirmesinin önemli bir bileşenidir ve...

    • Daha kapsamlı sonuçlar sağlamak için daha geniş kapsamlı kapsama sahip büyük ölçekte ölçüm.

    • Sistem, kullanım ve azaltmalar geliştikçe herhangi bir regresyonu izlemek için devam eden ölçüm.

  • Model seçimi: Amacınıza uygun bir model seçin ve özelliklerini, sınırlamalarını ve olası güvenlik zorluklarını anlamak için kendinizi eğitin. Modelinizi test ederken, modelin kullanımınıza uygun sonuçlar ürettiğine emin olun. Başlamak için Microsoft (ve Microsoft dışı/açık kaynak) model kaynaklarının hedefleri şunlardır:

Ölçü - Riskleri değerlendirme ve risk azaltma

Önerilen uygulamalar şunlardır:

  • Bir İçerik Moderatörü Atayın: İçerik Moderatörü, rahatsız edici, riskli veya başka bir şekilde istenmeyen materyalleri belirlemek için metin, görüntü ve video içeriklerini denetler. Daha fazla bilgi edinin: Content Moderator'a Giriş (Microsoft Learn Eğitimi).

    • İçerik güvenliği filtrelerinikullanın: Çok sınıflı sınıflandırma modellerinin bu grubu, çeşitli önem düzeylerinde (düşük, orta ve yüksek) dört zararlı içerik kategorisi (şiddet, nefret, cinsel ve kendine zarar verme) algılar. Daha fazla bilgi edinin: Azure OpenAI Serviceile içerik filtrelerini yapılandırma.

    • Meta istem uygulama: Meta istem, istemin başına eklenen bir sistem iletisidir ve modeli bağlam, yönergeler veya kullanım örneğinle ilgili diğer bilgilerle ayarlamak için kullanılır. Bu yönergeler modelin davranışına yol göstermek için kullanılır. Daha fazla bilgi edinin: Metaprompt / sistem ileti mühendisliğiile etkili güvenlik korumaları oluşturma.

    • Blok listelerini kullanma: Bu komut isteminde belirli terimlerin veya desenlerin kullanımını engeller. Daha fazla bilgi edinin: Azure OpenAI'da blok listesi kullanma.

    • Modelinkanıtlanmışlığı hakkında bilgi edinin: Provenance, bir modelin sahiplik tarihidir veya kim-ne-nerede-ne zaman olduğunu anlamak çok önemlidir. Modeldeki verileri kim topladı? Veriler kime ait? Ne tür veriler kullanılır? Veriler nerede toplandı? Veriler ne zaman toplandı? Model verilerinin nereden geldiğini bilmek, kalitesini, güvenilirliğini değerlendirmenize ve etik olmayan, haksız, yanlı veya yanlış veri kullanımından kaçınmanıza yardımcı olabilir.

    • Standart işlem hattıkullanın: Parçaları parça parça çekmek yerine tek bir içerik denetleme işlem hattı kullanın. Daha fazla bilgi edinin: makine öğrenmesi işlem hatlarını anlama.

  • kullanıcı arabirimiönlemlerini uygula: Bunlar, yapay zeka tabanlı bir özelliğin yetenekleri ve sınırlamaları hakkında kullanıcınıza önemli bir netlik sunar. Kullanıcılara yardımcı olmak ve özelliğinizle ilgili saydamlık sağlamak için şunları yapabilirsiniz:

    • Kullanıcıları kabul etmeden önce çıktıları düzenlemeleri için teşvik etme

    • Yapay zeka çıkışlarındaki olası yanlışlıkları vurgulama

    • Yapay zekanın etkileşimdeki rolünü açıklama

    • Referansları ve kaynakları alıntıla

    • Uygun yerlerde girişin ve çıkışın uzunluğunu sınırlayın

    • Girdi veya çıktıya yapı kazandırma – istemlerin standart bir biçime uyması gerekir.

    • Tartışmalı istemler için önceden belirlenmiş yanıtları hazırlayın.

  • Müşteri geri bildirim döngülerini uygulama: Kullanıcılarınızı geri bildirim döngülerine etkin bir şekilde katılmaları için teşvik edin:

    • Kullanıcı deneyiminin bir parçası olarak bağlam içinde kullanılabilen basit bir geri bildirim mekanizmasını kullanarak doğrudan uygulamanızda/ ürününüzün geri bildirimini isteyin.

    • Müşterilerinizin özellik sorunları, endişeleri ve olası zararlarla ilgili erken konuşmalar için kullandığı kanallara sosyal dinleme teknikleri uygulayın.

Yönetme - Yapay zeka risklerini azaltma

Yapay zeka risklerini azaltmaya yönelik öneriler şunlardır:

  • Kötüye Kullanımı izleme: Bu metodoloji, bir hizmetin Kullanım Kuralları'nı veya diğer geçerli ürün koşullarını ihlal eden bir şekilde kullanıldığını öneren yinelenen içerik ve/veya davranışların örneklerini algılar ve azaltır. Daha fazla bilgi edinin: kötüye kullanım izleme.

  • Aşamalı teslim: Gelen raporları ve endişeleri işlemek için yapay zeka çözümünüzü yavaş bir şekilde kullanıma sunma.

  • Olay yanıtı planı: Her yüksek öncelikli risk için ne olacağını ve bir olaya yanıt vermenin ne kadar süreceğini ve yanıt sürecinin nasıl görüneceğini değerlendirin.

  • Özelliği veya sistemikapatabilme: Daha fazla zarar vermemek için işlevselliğin duraklatılmasını gerektiren bir olay gerçekleşmek üzereyse veya oluştuysa özelliği kapatmak için işlevsellik sağlayın.

  • Kullanıcı erişim denetimleri/engelleme: Sistemi yanlış kullanan kullanıcıları engellemek için bir yol geliştirin.

  • Kullanıcı geri bildirimi: Kullanıcı tarafından gelen sorunları algılamak için mekanizmalar kullanın.

    • Tipik bir iş akışı bağlamında kullanılabilen basit bir geri bildirim mekanizmasıyla doğrudan ürününüzde geri bildirim isteyin.

    • Müşterilerinizin özellik sorunları, endişeleri ve olası zararlarla ilgili erken konuşmalar için kullandığı kanallara sosyal dinleme teknikleri uygulayın.

  • Telemetri verilerinin sorumlu dağıtımı: Kullanıcı memnuniyetini veya sistemi istenen şekilde kullanma becerisini gösteren sinyalleri tanımlayın, toplayın ve izleyin; bu da geçerli gizlilik yasalarına, ilkelerine ve taahhütlerine uymanızı sağlar. Aralıkları belirlemek ve sistemi geliştirmek için telemetri verilerini kullanın.

Araçlar ve kaynaklar

Ek kaynaklar