Személyazonosításra alkalmas adatok (PII)-entitások felismerése
A PII (személyazonosításra alkalmas adatok) észlelése az Azure Language által kínált szolgáltatás. Strukturálatlan szövegekben azonosítja, kategorizálja és újrakiosztja a személyazonosításra alkalmas adatokat (PII). A PII tartalmazza az e-mail-címeket, telefonszámokat, fizetési adatokat stb.
A PII-észlelési API többféleképpen hívható meg. Itt a bővítmény használatával dolgozza fel a azure_ai PII-t az SQL-lekérdezések szövegéből.
Előfeltételek
Rugalmas Azure Database for PostgreSQL-kiszolgálóra van szüksége, amelyen azure_ai van a bővítmény. Egy nyelvi erőforrás kulcsának és végpontjának beállításával is engedélyeznie kell azt az Azure Cognitive Servicesben.
Scenarios
A PII-észlelés több alkalmazáshoz is használható, például:
- Bizalmassági címkék: Dokumentumok vagy e-mailek besorolása bizalmasság szerint a PII típusai szerint. A telefonszámokat tartalmazó szöveg lehet bizalmas, míg a hitelkártya- vagy bankszámlaszámok szigorúan titkosnak minősülnek.
- A támogatás és a műveletek újrakontálása: Számos operatív feladat, például az incidensek osztályozása vagy a támogatási útválasztás nem igényel személyes adatokat. A vállalatok a PII-anonimizálás segítségével kiszűrhetik azokat az ügyféladatokat, amelyek nem szükségesek az alkalmazottak feladatának elvégzéséhez.
- Személyes adatok csökkentése a tudattalan elfogultság csökkentése érdekében: A vállalat eltávolíthatja a neveket, címeket és egyéb információkat, hogy segítsen csökkenteni a nemi vagy egyéb torzításokat.
PII észlelése AZ SQL-ben az Azure Cognitive Services használatával
A rugalmas Azure Database for PostgreSQL-kiszolgáló azure_ai bővítmény felhasználó által definiált függvényeket (UDF-eket) biztosít, amelyek közvetlenül az SQL-en belülről érik el az AI-képességeket. A PII-észlelési API a azure_cognitive.recognize_pii_entities által biztosított azure_ai függvénnyel érhető el.
azure_cognitive.recognize_pii_entities(
text text,
language text,
timeout_ms integer DEFAULT 3600000,
throw_on_error boolean DEFAULT true,
domain text DEFAULT 'none'::text,
disable_service_logs boolean DEFAULT false
)
A szükséges paraméterek a text bemenet, és language a nyelv, amelyben a text meg van írva. Például en-us amerikai angol, francia fr . Az elérhető nyelvek teljes listáját a nyelvi támogatásban találja.
Alapértelmezés szerint az entitásfelismerés leáll, ha nem fejeződik be 3 600 000 ms = 1 óra alatt. A késleltetést úgy szabhatja testre, hogy megváltoztatja timeout_ms.
Hiba esetén az alapértelmezett viselkedés a kivétel dobása, ami tranzakció-visszaállítást eredményez. Ezt a viselkedést letilthatja hamis értékre állítással throw_on_error .
A domain paraméter az azonosított személyes adatok típusának testreszabására használható. Az alapértelmezett érték none jelenleg általános PII-t használ, és a tartomány phi azonosítja a személyes egészségügyi adatokat.
A paraméterek teljes dokumentációját az Azure Cognitive Services bővítmény dokumentációjában találja.
A példa kedvéért, a lekérdezés lefuttatása:
SELECT azure_cognitive.recognize_pii_entities('My phone number is +1555555555, and the address of my office is 16255 NE 36th Way, Redmond, WA 98052.', 'en-us');
A következő eredményt adja:
("My phone number is ***********, and the address of my office is ************************************.","{""(+1555555555,PhoneNumber,\\""\\"",0.8)"",""(\\""16255 NE 36th Way, Redmond, WA 98052\\"",Address,\\""\\"",1)""}")
A PII szolgáltatás 0,8 megbízhatósági pontszámmal érzékelte a telefonszámot, és 1 megbízhatósági pontszámmal azonosította a címet. A bemenetet is visszaadta, amelyből a két személyes adatot eltávolították.
A beviteli szöveghez táblázatoszlopokat használhat:
SELECT description, azure_cognitive.recognize_pii_entities(description, 'en-us')
FROM listings LIMIT 1;
Amely visszaadja (ha a \x engedélyezve van a kiterjesztett megjelenítéshez):
recognize_pii_entities | ("New modern house built in 2013. Spectacular sunset/water views, light, rooftop deck and lounge area, hot tub, 5 bedrooms, gourmet kitchen. Perfect for 2-3 families, walk to downtown. Located in highly desirable Queen Anne neighborhood. Our house is modern, light and fresh with a warm simple palette accented with barnwood, steel and concrete. Open living spaces for entertaining, gourmet kitchen, deck off the kitchen, reading nook, half bath and smaller tv room off kitchen. Fireplace with sofa and sitting area. Basement room is great for ****...this room has patio access and a garage door that opens into the space with basketball hoop right outside. A queen bedroom and full bath are in the basement with concrete heated floors. A queen sleeper sofa is in the tv area in the basement. This room has a door if privacy is needed. Great for a second ****** with ****. The 2nd floor has 4 bedrooms (one queen in master, one twin bedroom, another bedroom has twin bunk beds and the last","{""(kids,PersonType,\\""\\"",0.73)"",""(family,PersonType,\\""\\"",0.71)"",""(kids,PersonType,\\""\\"",0.65)""}")
Összefoglalás
A PII-észlelés strukturálatlan bemeneti szövegben azonosítja és kategorizálja a személyazonosításra alkalmas adatokat. Az Azure Cognitive Services nyelvi modellje elvégzi a nehéz munkát, és az azure_ai Azure Database for PostgreSQL bővítménye biztosítja az azure_cognitive.recognize_pii_entities API-t, hogy közvetlenül az SQL-lekérdezésekben észlelje és eltávolítsa a PII-t.