Kişisel olarak tanımlanabilir bilgiler (PII) varlıklarını tanıma

Tamamlandı

PII (kişisel bilgiler) algılama, Azure Dil tarafından sunulan bir özelliktir. Yapılandırılmamış metindeki kişisel bilgileri (PII) tanımlar, kategorilere ayırır ve yeniden oluşturur. PII e-posta adreslerini, telefon numaralarını, ödeme bilgilerini vb. içerir.

PII algılama API'sini çağırmanın çeşitli yolları vardır. Burada, SQL sorgularındaki metinden PII'yi işlemek için uzantıyı kullanırsınız azure_ai .

Önkoşullar

azure_ai postgreSQL için Azure Veritabanı esnek sunucusuna ihtiyacınız vardır. Dil kaynağının anahtarını ve uç noktasını ayarlayarak Azure Bilişsel Hizmetler ile yetkilendirmeniz de gerekir.

Senaryo

PiI algılamayı aşağıdakiler de dahil olmak üzere çeşitli uygulamalar için kullanın:

  • Duyarlılık etiketleri: Belgeleri veya e-postaları PII türlerine göre hassaslığa göre kategorilere ayırın. Telefon numarası içeren metin gizli olarak işaretlenebilirken, kredi kartı veya banka hesabı numaraları çok gizli olarak etiketlenebilir.
  • Destek ve işlemler için yeniden düzenleme: Olay önceliklendirme veya destek yönlendirmesi gibi birçok işlem görevi kişisel bilgi gerektirmez. Şirketler, bir çalışanın görevine gereksiz olan müşteri bilgilerini filtrelemek için PII redaction'ı kullanabilir.
  • Bilinçsiz önyargıyı azaltmak için kişisel bilgileri azaltma: Bir şirket, bilinçsiz cinsiyeti veya diğer önyargıları azaltmaya yardımcı olmak için adları, adresleri ve diğer bilgileri kaldırabilir.

Azure Bilişsel Hizmetler ile SQL'de PII algılama

PostgreSQL için Azure Veritabanı esnek sunucusu azure_ai uzantısı , doğrudan SQL'in içinden yapay zeka özelliklerine erişmek için kullanıcı tanımlı işlevler (UDF) sağlar. PII algılama API'sine azure_cognitive.recognize_pii_entities tarafından azure_aisağlanan işlevle erişilir:

azure_cognitive.recognize_pii_entities(
 text text,
 language text,
 timeout_ms integer DEFAULT 3600000,
 throw_on_error boolean DEFAULT true,
 domain text DEFAULT 'none'::text,
 disable_service_logs boolean DEFAULT false
)

Gerekli parametreler text, giriş ve language'nin yazıldığı text dilidir. Örneğin, en-us ABD İngilizcesi ve fr Fransızcadır. Kullanılabilir dillerin tam listesi için bkz. dil desteği.

Varsayılan olarak, varlık tanıma 3.600.000 ms = 1 saat içinde tamamlanmazsa durdurulur. Bu gecikmeyi timeout_ms değiştirerek özelleştirebilirsiniz.

Hata oluşursa, varsayılan davranış bir özel durum oluşturarak işlem geri alma işlemiyle sonuçlanır. False olarak ayarlayarak throw_on_error bu davranışı devre dışı bırakabilirsiniz.

parametresi, domain tanımlanan kişisel veri türlerini özelleştirmek için kullanılabilir. Şu anda varsayılan olarak none genel Kişisel Tanımlayıcı Bilgiler (PII) kullanılır ve etki alanı phi Kişisel Sağlık Bilgilerini tanımlar.

Tam parametre belgeleri için Bkz. Azure Bilişsel Hizmetler uzantısı belgeleri .

Örneğin, bu sorguyu çalıştırmak:

SELECT azure_cognitive.recognize_pii_entities('My phone number is +1555555555, and the address of my office is 16255 NE 36th Way, Redmond, WA 98052.', 'en-us');

Şu sonucu verir:

("My phone number is ***********, and the address of my office is ************************************.","{""(+1555555555,PhoneNumber,\\""\\"",0.8)"",""(\\""16255 NE 36th Way, Redmond, WA 98052\\"",Address,\\""\\"",1)""}")

PII hizmeti, güvenilirlik puanı 0,8 olan telefon numarasını ve güvenilirlik puanı 1 olan adresi algılamıştı. Ayrıca, girişi geri verdi ve iki PII veri noktası sansürlendi.

Giriş metni için tablo sütunlarını kullanabilirsiniz:

SELECT description, azure_cognitive.recognize_pii_entities(description, 'en-us')
FROM listings LIMIT 1;

Bu, genişletilmiş görüntü için \x etkinken şunları döndürür:

recognize_pii_entities | ("New modern house built in 2013. Spectacular sunset/water views, light, rooftop deck and lounge area, hot tub, 5 bedrooms, gourmet kitchen. Perfect for 2-3 families, walk to downtown. Located in highly desirable Queen Anne neighborhood. Our house is modern, light and fresh with a warm simple palette accented with barnwood, steel and concrete. Open living spaces for entertaining, gourmet kitchen, deck off the kitchen, reading nook, half bath and smaller tv room off kitchen. Fireplace with sofa and sitting area. Basement room is great for ****...this room has patio access and a garage door that opens into the space with basketball hoop right outside. A queen bedroom and full bath are in the basement with concrete heated floors. A queen sleeper sofa is in the tv area in the basement. This room has a door if privacy is needed. Great for a second ****** with ****. The 2nd floor has 4 bedrooms (one queen in master, one twin bedroom, another bedroom has twin bunk beds and the last","{""(kids,PersonType,\\""\\"",0.73)"",""(family,PersonType,\\""\\"",0.71)"",""(kids,PersonType,\\""\\"",0.65)""}")

Özet

PII algılama, yapılandırılmamış giriş metnindeki kişisel bilgileri tanımlar ve kategorilere ayırır. Azure Bilişsel Hizmetler dil modeli esas işleri yapar ve PostgreSQL için Azure Veritabanı uzantısı, SQL sorgularının içinden doğrudan PII'yi algılamak ve gizlemek için API sağlar.