Opracowywanie odpowiedzialnych aplikacji i funkcji sztucznej inteligencji na platformie Windows

Ten dokument zawiera omówienie zalecanych praktyk w zakresie odpowiedzialnego programowania, które mają być używane podczas tworzenia aplikacji i funkcji na Windows z generowaniem sztucznej inteligencji.

Microsoft Foundry na Windows modele generatywne AI uruchamiane na urządzeniach mogą pomóc w wymuszaniu lokalnych funkcji bezpieczeństwa treści, takich jak silniki klasyfikacji dla szkodliwych treści i domyślna lista blokowania. Microsoft priorytetowo wspiera deweloperów w tworzeniu bezpiecznych, godnych zaufania doświadczeń AI z lokalnymi modelami w systemie Windows.

Wytyczne dotyczące odpowiedzialnego opracowywania generowanych aplikacji i funkcji sztucznej inteligencji w Windows

Każdy zespół w Microsoft przestrzega podstawowych zasad i praktyk, aby odpowiedzialnie tworzyć i wydawać sztuczną inteligencję, w tym Windows. Więcej informacji na temat podejścia Microsoft do odpowiedzialnego rozwoju można przeczytać w Raporcie Microsoft dotyczącym przejrzystości odpowiedzialnej AI. Windows jest zgodny z podstawowymi filarami rozwoju RAI — zarządzać, mapować, mierzyć i zarządzać — które są dostosowane do ram zarządzania ryzykiem AI Krajowego Instytutu Standardów i Technologii (NIST).

Zarządzanie — zasady, praktyki i procesy

Standardy są podstawą procesów zapewniania ładu i zgodności. Microsoft opracowała własne Responsible AI Standard, w tym six zasad których można użyć jako punktu wyjścia do opracowania wytycznych dotyczących odpowiedzialnej sztucznej inteligencji. Zalecamy tworzenie zasad sztucznej inteligencji na koniec cyklu projektowania, a także procesów i przepływów pracy w celu zapewnienia zgodności z przepisami i przepisami dotyczącymi prywatności, zabezpieczeń i odpowiedzialnej sztucznej inteligencji. Obejmuje to wczesną ocenę każdej funkcji sztucznej inteligencji przy użyciu narzędzi takich jak AI Fairness Checklist i Guidelines for Human-AI Interaction - Microsoft Research, do monitorowania i przeglądania testów porównawczych sztucznej inteligencji, testowanie i procesy przy użyciu narzędzi, takich jak Responsible AI scorecard, publicznej dokumentacji dotyczącej możliwości i ograniczeń funkcji sztucznej inteligencji oraz ujawniania informacji i kontroli użytkowników — powiadomienia, zgody, zbierania i przetwarzania informacji itp. — zgodnie z obowiązującymi przepisami dotyczącymi prywatności, wymaganiami prawnymi i zasadami.

Mapa — identyfikowanie ryzyka

Zalecane rozwiązania dotyczące identyfikowania czynników ryzyka obejmują:

Kompleksowe testowanie

Kompleksowe testowanie ocenia cały system sztucznej inteligencji od początku do końca, aby upewnić się, że działa zgodnie z oczekiwaniami i jest zgodny z ustalonymi standardami. To kompleksowe podejście może obejmować:

Red teaming (analiza zagrożeń lub symulacja przeciwnika)

Termin red teaming historycznie opisywał systematyczne ataki przeciwnika na potrzeby testowania luk w zabezpieczeniach. Ostatnio termin ten wykracza poza tradycyjne cyberbezpieczeństwo i ewoluował we wspólnym użyciu, aby opisać wiele rodzajów sondowania, testowania i atakowania systemów sztucznej inteligencji.

Zarówno w przypadku dużych modeli językowych (LLM), jak i małych modeli językowych (SLM), zarówno nieszkodliwe, jak i wrogie użycie może prowadzić do potencjalnie szkodliwych rezultatów, które mogą przybierać wiele form, w tym mowę nienawiści, podżeganie lub gloryfikowanie przemocy, czy też treści seksualne. Dokładne testy penetracyjne pozwalają przetestować system i udoskonalić strategię treści, aby zmniejszyć prawdopodobieństwo, że system wyrządzi szkodę.

Wszystkie systemy sztucznej inteligencji powinny być poddawane czerwonym testom zespołowym, w zależności od funkcji i celu, zarówno w systemach wysokiego ryzyka, które korzystają z generowania sztucznej inteligencji, jak i systemów o niższym ryzyku, które używają niegeneracyjnych sztucznej inteligencji:

Formalne red teaming: Niezależne red teaming powinno zostać przeprowadzone dla wszystkich systemów wysokiego ryzyka, które wykorzystują generatywną sztuczną inteligencję przy użyciu dużych modeli językowych (LLMs). Formalne red teaming obejmuje rekrutację specjalistów spoza organizacji do uczestniczenia w działaniach red teaming.
Wewnętrzne testy red teamingu: Co najmniej zaplanuj wewnętrzne testy red teamingu dla wszystkich systemów sztucznej inteligencji o niższym ryzyku. Można to zrobić przez osoby w organizacji.

Dowiedz się więcej na temat tworzenia zespołu czerwonego i sposobu oceny potrzeb zespołu czerwonego systemu: Microsoft AI Red Team

Ocena modelu

W ramach kompleksowego testowania ważne jest, aby ocenić sam model.

Karta modelu: w przypadku modeli dostępnych publicznie, takich jak te na karcie Hugging Face, możesz sprawdzić kartę modelu każdego modelu jako przydatne odwołanie, aby dowiedzieć się, czy model jest odpowiedni dla danego przypadku użycia. Przeczytaj więcej na temat kart modelu.
Testowanie ręczne: Ludzie wykonujący testy krok po kroku bez skryptów są ważnym składnikiem oceny modelu, który obsługuje...
- Mierzenie postępu dla niewielkiej liczby priorytetowych kwestii. W przypadku łagodzenia określonych szkód najczęściej najbardziej produktywne jest ręczne sprawdzanie postępu w odniesieniu do małego zestawu danych, dopóki szkoda nie zostanie już zaobserwowana przed przejściem do zautomatyzowanego pomiaru.
- Definiowanie i raportowanie metryk aż automatyczny pomiar będzie wystarczająco niezawodny, aby można było stosować go samodzielnie.
- Sprawdzanie punktowe okresowo w celu pomiaru jakości pomiarów automatycznych.
zautomatyzowane testowanie: Automatyczne testowanie jest również ważnym składnikiem oceny modelu, które wspiera...
- Pomiar na dużą skalę ze zwiększonym pokryciem w celu zapewnienia bardziej kompleksowych wyników.
- Ciągły pomiar w celu monitorowania jakiejkolwiek regresji w miarę zmian w systemie, użyciu i środkach zaradczych.
Wybór modelu: Wybierz model, który jest odpowiedni dla Twojego celu i wykształć się, aby zrozumieć jego możliwości, ograniczenia i potencjalne wyzwania bezpieczeństwa. Podczas testowania modelu upewnij się, że generuje wyniki odpowiednie do użycia. Aby rozpocząć pracę, docelowe miejsca dla źródeł modeli Microsoft (oraz innych niż Microsoft/open source) obejmują:
- przytulanie twarzy
- zoo modeli ONNX
- Qualcomm AI Hub
- Pakiet Foundry dla VS Code
- Centrum PyTorch
- TensorFlow Hub

Miara — ocena ryzyka i środki zaradcze

Zalecane rozwiązania obejmują:

Assign a Content Moderator: Content Moderator sprawdza tekst, obraz i zawartość wideo pod kątem materiałów potencjalnie obraźliwych, ryzykownych lub w inny sposób niepożądanych w zawartości. Dowiedz się więcej: Introduction to Content Moderator (Microsoft Learn Training).
- Użyj filtrów bezpieczeństwa zawartości: ten zespół wieloklasowych modeli klasyfikacji wykrywa cztery kategorie szkodliwych treści (przemoc, nienawiść, seksualna i samookaleczenia) na różnych poziomach ważności (niski, średni i wysoki). Dowiedz się więcej: Jak skonfigurować filtry zawartości przy użyciu Azure OpenAI Service.
- Zastosuj metakomunikat: Meta-prompt jest komunikatem systemowym zawartym na początku monitu i służy do przygotowania modelu z kontekstem, instrukcjami lub innymi informacjami istotnymi dla danego przypadku użycia. Te instrukcje służą do kierowania zachowaniem modelu. Dowiedz się więcej: Tworzenie skutecznych barier zabezpieczających za pomocą metaprompt / inżynierii komunikatów systemowych.
- Korzystanie z list zablokowanych: Blokuje użycie określonych terminów lub wzorców w wierszu polecenia. Dowiedz się więcej: Użyj listy zablokowanych w programie Azure OpenAI.
- Zapoznaj się z pochodzeniem modelu: Pochodzenie to historia własności modelu, czyli kto-co-gdzie-kiedy, i jest bardzo ważna do zrozumienia. Kto zebrał dane w modelu? Kogo dotyczą dane? Jakiego rodzaju dane są używane? Gdzie zebrano dane? Kiedy zebrano dane? Poznanie, skąd pochodzą dane modelu, może pomóc ocenić jego jakość, niezawodność i uniknąć nieetycznego, niesprawiedliwego, stronniczego lub niedokładnego użycia danych.
- Użyj standardowego potoku: zastosuj jeden potok moderowania treści zamiast składania części z fragmentów. Dowiedz się więcej: Co to są potoki Azure Machine Learning?.
Zastosujinterfejsu użytkownikaśrodki zaradcze: Zapewniają one użytkownikowi ważną jasność co do możliwości i ograniczeń funkcji opartej na sztucznej inteligencji. Aby ułatwić użytkownikom i zapewnić przejrzystość funkcji, możesz:
- Zachęcanie użytkowników do edytowania danych wyjściowych przed ich zaakceptowaniem
- Wyróżnianie potencjalnych niedokładności w danych wyjściowych sztucznej inteligencji
- Ujawnianie roli sztucznej inteligencji w interakcji
- Przytaczaj odwołania i źródła
- Ogranicz długość danych wejściowych i wyjściowych tam, gdzie jest to konieczne
- Zdefiniuj strukturę danych wejściowych i wyjściowych — polecenia muszą być zgodne z standardowym formatem
- Przygotuj wstępnie określone odpowiedzi na kontrowersyjne pytania.
Implementowanie pętli opinii klientów: Zachęcaj użytkowników do aktywnego angażowania się w pętle opinii:
- Poproś o opinię bezpośrednio w aplikacji/produkcie, używając prostego mechanizmu zbierającego opinie, który jest dostępny w kontekście jako część doświadczenia użytkownika.
- Zastosuj techniki słuchania społecznościowego w kanałach używanych przez klientów do wczesnych rozmów dotyczących problemów z funkcjami, obaw i możliwych szkód.

Zarządzanie — ograniczanie ryzyka związanego ze sztuczną inteligencją

Zalecenia dotyczące ograniczania ryzyka związanego ze sztuczną inteligencją obejmują:

monitorowanie nadużyć: Ta metodologia wykrywa i zmniejsza liczbę wystąpień cyklicznej zawartości i/lub zachowań, które sugerują, że usługa została użyta w sposób, który może naruszać Kodeks postępowania lub inne obowiązujące postanowienia dotyczące produktu. Dowiedz się więcej: Monitorowanie nadużyć.
etapowe dostarczanie: stopniowe wdrażanie rozwiązania sztucznej inteligencji w celu zarządzania napływającymi raportami i problemami.
plan reagowania na zdarzenia: w przypadku każdego ryzyka o wysokim priorytecie należy ocenić, co się stanie i jak długo potrwa reagowanie na zdarzenie i jak będzie wyglądać proces reagowania.
możliwość wyłączania funkcji lub systemu: zapewnij możliwość wyłączenia funkcji, jeśli zdarzenie ma lub miało miejsce, co wymaga wstrzymania działania w celu uniknięcia dalszych szkód.
Kontrola dostępu użytkowników/blokowanie: tworzenie sposobu blokowania użytkowników, którzy nieprawidłowo korzystają z systemu.
Opinie użytkowników: korzystanie z mechanizmów wykrywania problemów po stronie użytkownika.
- Poproś o opinię bezpośrednio w produkcie z prostym mechanizmem opinii dostępnym w kontekście typowego przepływu pracy.
- Zastosuj techniki słuchania społecznościowego w kanałach używanych przez klientów do wczesnych rozmów dotyczących problemów z funkcjami, obaw i możliwych szkód.
Odpowiedzialne wdrażanie danych telemetrycznych: identyfikowanie, zbieranie i monitorowanie sygnałów wskazujących zadowolenie użytkowników lub możliwość korzystania z systemu zgodnie z oczekiwaniami, zapewniając przestrzeganie odpowiednich przepisów dotyczących prywatności, zasad i zobowiązań. Użyj danych telemetrycznych, aby zidentyfikować luki i poprawić system.

Narzędzia i zasoby

AI Application and Platform Cards: Dowiedz się, jak aplikacje Microsoft Windows oparte na sztucznej inteligencji są projektowane i wdrażane w sposób odpowiedzialny. Karty aplikacji zapewniają przejrzystość funkcji sztucznej inteligencji, zamierzonych zastosowań, ograniczeń i środków bezpieczeństwa dla funkcji, takich jak Microsoft Paint, Click to Do i Windows Studio Effects. Te zasoby mogą służyć jako przykłady dla własnej dokumentacji aplikacji.
Microsoft Foundry na Windows: ujednolicona, niezawodna i bezpieczna platforma wspierająca cykl życia twórcy aplikacji AI od wyboru modelu, strojenia, optymalizacji i wdrażania na CPU, GPU, NPU i w chmurze.
Przybornik odpowiedzialnej sztucznej inteligencji: Odpowiedzialne używanie sztucznej inteligencji to podejście do oceny, opracowywania i wdrażania systemów sztucznej inteligencji w bezpieczny, godny zaufania i etyczny sposób. Przybornik odpowiedzialnej sztucznej inteligencji to zestaw narzędzi zawierających kolekcję bibliotek i interfejsów użytkownika do eksploracji i oceny modeli oraz danych, które umożliwiają lepsze zrozumienie systemów sztucznej inteligencji. Te interfejsy i biblioteki umożliwiają deweloperom i uczestnikom projektu systemów sztucznej inteligencji tworzenie i monitorowanie sztucznej inteligencji w sposób bardziej odpowiedzialny i podejmować lepsze działania oparte na danych.
Debugowanie modelu dla pulpitu nawigacyjnego odpowiedzialnej AI: Ten pulpit nawigacyjny może ułatwić identyfikowanie, diagnozowanie i łagodzenie problemów przy wykorzystaniu danych do podejmowania poinformowanych decyzji. To dostosowywalne doświadczenie można skierować w wielu kierunkach, od całościowej analizy modelu lub danych, przez dogłębną analizę lub porównanie interesujących kohort, po wyjaśnianie i modyfikację prognoz modelu dla poszczególnych przypadków, informując użytkowników o decyzjach i działaniach biznesowych. Rozwiąż quiz z zakresu podejmowania decyzji w kontekście odpowiedzialnej sztucznej inteligencji.
Przejrzyj podsumowanie Azure Machine Learning Czym jest odpowiedzialna sztuczna inteligencja?
Przeczytaj artykuł Brada Smitha na temat zwalczania obraźliwych treści generowanych przez sztuczną inteligencję: kompleksowe podejście od 13 lutego 2024 r.
Przeczytaj blog rozwiązania zabezpieczające firmy Microsoft.
Przegląd praktyk odpowiedzialnego używania sztucznej inteligencji dla modeli Azure OpenAI — Azure AI services
Jak używać filtrów zawartości (wersja zapoznawcza) z Azure OpenAI Service
Jak używać list blokowych z Azure OpenAI Service
Planowanie działań czerwonego zespołu dla dużych modeli językowych (LLMs) i ich zastosowań
Monitorowanie nadużyć w usłudze Azure OpenAI
Modelowanie zagrożeń systemów sztucznej inteligencji/uczenia maszynowego i zależności
Sztuczna inteligencja/uczenie maszynowe koncentrują się na bezpieczeństwie. Pasek usterek cyklu życia programowania
tryby awarii w uczenia maszynowego
Narzędzia do Zarządzania i Tworzenia Odpowiedzialnych Środków AI - Microsoft Research
Planowanie błędów języka naturalnego przy użyciu podręcznika sztucznej inteligencji
Inżynieria oprogramowania dla uczenia maszynowego: analiza przypadku
Zabezpieczenia i uczenie maszynowe w świecie rzeczywistym
nadmierne poleganie na sztucznej inteligencji: przegląd literatury
analiza błędów i tworzenie odpowiedzialnej sztucznej inteligencji przy użyciu zestawu narzędzi do analizy błędów (youtube.com)
InterpretML oraz Jak Wyjaśniać Modele przy użyciu InterpretML - Dokładne Omówienie (youtube.com)
Wyjaśnienie „Black-Box” i „Glass-Box” w uczeniu maszynowym (youtube.com)

Opinia

Czy ta strona była pomocna?

Last updated on 2026-04-21