Udostępnij za pośrednictwem


Co to jest wykrywanie danych osobowych (PII) w języku sztucznej inteligencji platformy Azure?

Wykrywanie danych osobowych (PII) w Azure AI Language to funkcja oferowana przez Azure AI Language. Usługa wykrywania PII to oparty na chmurze interfejs API, który wykorzystuje algorytmy uczenia maszynowego i sztucznej inteligencji, aby pomóc w opracowywaniu inteligentnych aplikacji z zaawansowanym zrozumieniem języka naturalnego. Wykrywanie danych osobowych w języku AI platformy Azure używa rozpoznawania nazwanych encji (NER) do identyfikacji i redakcji poufnych informacji z danych wejściowych. Usługa klasyfikuje poufne dane osobowe do wstępnie zdefiniowanych kategorii. Te kategorie obejmują numery telefonów, adresy e-mail i dokumenty identyfikacyjne. Ta klasyfikacja pomaga skutecznie wykrywać i wyeliminować takie informacje.

Co nowego

Interfejs API wykrywający tekstowe i konwersacyjne dane PII w wersji zapoznawczej (wersja 2024-11-15-preview) teraz obsługuje opcję maskowania wykrytych poufnych jednostek za pomocą etykiety, a nie tylko znaków redakcyjnych. Klienci mogą określić, czy dane osobowe, takie jak imiona i numery telefonów, czyli "John Doe received a call from 424-878-9192", są maskowane znakiem redakcyjnym, czyli "******** received a call from ************", lub maskowane etykietą typu danych, czyli "[PERSON_1] received a call from [PHONENUMBER_1]". Więcej informacji na temat określania stylu zasad redakcji dla danych wyjściowych można znaleźć w naszych przewodnikach.

Modele wykrywania konwersacyjnych danych osobowych (wersja 2024-11-01-preview i GA) są aktualizowane, aby zapewnić lepszą jakość i dokładność sztucznej inteligencji. Typ jednostki identyfikatora liczbowego obejmuje również licencję kierowców i identyfikator beneficjenta Medicare.

Od czerwca 2024 r. zapewniamy wsparcie w zakresie powszechnej dostępności dla usługi konwersacyjnej PII (tylko w języku angielskim). Klienci mogą teraz redagować transkrypcje, czaty i inny tekst napisany w stylu konwersacyjnym (czyli tekst z ums, ahs, wieloma osobami mówiącymi oraz pisownią wyrazów dla większej jasności) z większą pewnością co do jakości sztucznej inteligencji, wsparcia Azure SLA, obsługi w środowiskach produkcyjnych oraz zabezpieczeń na poziomie korporacyjnym.

Możliwości

Obecnie wsparcie dla PII jest dostępne dla następujących funkcji:

Azure AI Language to oparta na chmurze usługa, która stosuje funkcje przetwarzania języka naturalnego (NLP) do wykrywania kategorii danych osobowych (PII) w danych tekstowych. Ta dokumentacja zawiera następujące typy:

  • Quickstarts to instrukcje umożliwiające szybkie rozpoczęcie, które poprowadzą Cię przez składanie żądań do usługi.
  • Przewodniki z instrukcjami zawierają instrukcje dotyczące korzystania z usługi w bardziej szczegółowy lub dostosowany sposób.

Typowy przepływ pracy

Aby użyć tej funkcji, przesyłasz dane do analizy i obsługujesz dane wyjściowe interfejsu API w aplikacji. Analiza jest wykonywana tak jak jest, bez dodatkowego dostosowania do modelu zastosowanego na danych.

  1. Utwórz zasób języka sztucznej inteligencji platformy Azure, który zapewnia dostęp do funkcji oferowanych przez język azure AI. Generuje hasło (nazywane kluczem) i adres URL punktu końcowego używany do uwierzytelniania żądań interfejsu API.

  2. Utwórz żądanie przy użyciu interfejsu API REST lub biblioteki klienta dla języków C#, Java, JavaScript i Python. Możesz również wysyłać wywołania asynchroniczne z żądaniem wsadowym, aby połączyć żądania interfejsu API dla wielu funkcji w jedno wywołanie.

  3. Wyślij żądanie zawierające dane tekstowe. Twój klucz i punkt końcowy służą do uwierzytelniania.

  4. Prześlij odpowiedź strumieniowo lub przechowaj ją lokalnie.

Kluczowe funkcje tekstu PII

Język AI platformy Azure oferuje rozpoznawanie nazwanych jednostek w celu identyfikowania i kategoryzowania informacji w tekście. Funkcja wykrywa kategorie pii, w tym nazwy, organizacje, adresy, numery telefonów, numery kont finansowych lub kody oraz numery identyfikacyjne instytucji rządowych. Podzbiorem tych danych osobowych są chronione informacje zdrowotne (PHI). Określając domain=phi w żądaniu, zwracane są tylko jednostki PHI.

Wprowadzenie do wykrywania danych PII

Aby użyć wykrywania PII, przesyłasz tekst do analizy i obsługujesz wynik API w swojej aplikacji. Analiza jest wykonywana w stanie niezmienionym, bez dostosowywania modelu używanego na twoich danych. Istnieją dwa sposoby wykorzystania wykrywania PII (danych osobowych):

Opcja programowania Opis
Azure AI Foundry Usługa Azure AI Foundry to platforma internetowa, która umożliwia korzystanie z funkcji wykrywania informacji osobistych przy użyciu przykładów tekstu z własnymi danymi podczas tworzenia konta. Aby uzyskać więcej informacji, zobacz witrynę internetową usługi Azure AI Foundry lub dokumentację usługi Azure AI Foundry.
Interfejs REST API lub biblioteka klienta (Azure SDK) Integruj wykrywanie PII w swoich aplikacjach przy użyciu interfejsu API REST lub biblioteki klienta dostępnej w różnych językach. Aby uzyskać więcej informacji, zobacz przewodnik Szybki start wykrywania danych osobowych.

Dokumentacja referencyjna i przykłady kodu

Jeśli używasz tej funkcji w aplikacjach, zapoznaj się z następującą dokumentacją referencyjną i przykładami dotyczącymi języka AI platformy Azure:

Opcja/język programowania Dokumentacja referencyjna Przykłady
Interfejs programistyczny REST Dokumentacja interfejsu API REST
C# Dokumentacja języka C# Przykłady języka C#
Jawa Dokumentacja języka Java Przykłady języka Java
JavaScript Dokumentacja języka JavaScript Przykłady języka JavaScript
Pyton Dokumentacja języka Python Przykłady w języku Python

Wymagania dotyczące danych wejściowych i limity usług

Odpowiedzialne AI

System sztucznej inteligencji obejmuje nie tylko technologię, ale także osoby, które go używają, osoby, których to dotyczy, oraz środowisko wdrażania. Przeczytaj notatkę dotyczącą przejrzystości dla danych PII, aby dowiedzieć się więcej na temat odpowiedzialnego stosowania i wdrażania sztucznej inteligencji w systemach. Aby uzyskać więcej informacji, zobacz następujące artykuły:

Przykładowe scenariusze

  • Stosuj etykiety poufności - Na przykład, w oparciu o wyniki usługi PII, publiczna etykieta poufności może być zastosowana do dokumentów, w których nie wykryto żadnych podmiotów PII. W przypadku dokumentów, w których są rozpoznawane adresy USA i numery telefonów, można zastosować etykietę poufne. Etykieta o wysokim stopniu poufności może być używana w przypadku dokumentów, w których są rozpoznawane numery routingu bankowego.
  • Zredaguj niektóre kategorie danych osobowych z dokumentów, które są szerzej rozpowszechniane — na przykład, jeśli dane kontaktowe klientów są dostępne dla przedstawicieli pomocy technicznej pierwszej linii, firma może usunąć dane osobowe klienta z historii klienta, z wyjątkiem imienia i nazwiska, aby zachować prywatność klienta.
  • Usuwanie danych osobowych w celu zmniejszenia nieświadomej stronniczości — na przykład podczas procesu przeglądu życiorysów w firmie mogą blokować imię, adres i numer telefonu, aby pomóc zmniejszyć nieświadomą stronniczość dotyczącą płci lub inne uprzedzenia.
  • Zastąp dane osobowe w danych źródłowych uczenia maszynowego, aby zmniejszyć niesprawiedliwość — na przykład jeśli chcesz usunąć nazwy, które mogą ujawnić płeć podczas trenowania modelu uczenia maszynowego, możesz użyć usługi do zidentyfikowania ich i zastąpić je ogólnymi symbolami zastępczymi na potrzeby trenowania modelu.
  • Usuń dane osobowe z transkrypcji w centrum telefonicznym — na przykład, jeśli chcesz usunąć imiona lub inne dane osobowe, które pojawiają się między agentem a klientem w sytuacjach w centrum telefonicznym. Możesz użyć usługi, aby je zidentyfikować i usunąć.
  • Czyszczenie danych dla nauki o danych — PII mogą być używane do przygotowania danych dla naukowców zajmujących się danymi i inżynierów, aby mogli używać tych danych do trenowania swoich modeli uczenia maszynowego. Redagowanie danych w celu upewnienia się, że dane klientów nie są ujawnione.

Następne kroki

Istnieją dwa sposoby rozpoczynania pracy z funkcją łączenia jednostek:

  • Azure AI Foundry to platforma internetowa, która umożliwia korzystanie z kilku funkcji usługi językowej bez konieczności pisania kodu.
  • Artykuł szybkiego startu z instrukcjami dotyczącymi składania żądań do usługi za pomocą API Rest i klienta biblioteki SDK.