Bagikan melalui


Cara mendeteksi dan menghapus Informasi Pengidentifikasi Pribadi (PII)

Fitur PII dapat mengevaluasi teks yang tidak terstruktur, mengekstrak, dan menyusun informasi sensitif (PII) dan informasi kesehatan (PHI) dalam teks di seluruh kategori yang telah ditentukan sebelumnya.

Opsi pengembangan

Untuk menggunakan deteksi PII, Anda mengirimkan teks untuk analisis dan menangani output API di aplikasi Anda. Analisis dilakukan apa adanya, tanpa penyesuaian pada model yang digunakan pada data Anda. Ada dua cara untuk menggunakan deteksi PII:

Opsi pengembangan Deskripsi
Studio bahasa Language Studio adalah platform berbasis web yang memungkinkan Anda mencoba penautan entitas dengan contoh teks tanpa akun Azure, dan data Anda sendiri saat mendaftar. Untuk informasi selengkapnya, lihat mulai cepat situs web Language Studio atau studio bahasa.
REST API atau Pustaka Klien (Azure SDK) Integrasikan deteksi PII ke dalam aplikasi Anda menggunakan REST API, atau pustaka klien yang tersedia dalam berbagai bahasa. Untuk informasi selengkapnya, lihat mulai cepat deteksi PII.

Menentukan cara memproses data (opsional)

Menentukan model deteksi PII

Secara default, fitur ini akan menggunakan model AI terbaru yang tersedia pada teks Anda. Anda juga dapat mengonfigurasikan permintaan API untuk menggunakan versi model tertentu.

Bahasa input

Saat Anda mengirimkan dokumen untuk diproses, Anda dapat menentukan dukungan bahasa mana yang digunakan. Jika Anda tidak menentukan sebuah bahasa, ekstraksi akan diatur ke default, yaitu bahasa Inggris. API dapat menampilkan offset dalam respons untuk mendukung pengodean multibahasa dan emoji yang berbeda.

Mengirimkan data

Analisis dilakukan setelah permintaan diterima. Menggunakan fitur deteksi PII secara sinkron tidak memiliki kewarganegaraan. Tidak ada data yang disimpan di akun Anda, dan hasilnya segera dikembalikan sebagai respons.

Saat menggunakan fitur ini secara asinkron, hasil API tersedia selama 24 jam sejak permintaan diterima, dan ditunjukkan dalam respons. Setelah jangka waktu ini, hasilnya akan dihapus menyeluruh dan tidak lagi tersedia untuk diambil.

Pilih entitas mana yang akan dikembalikan

API akan mencoba mendeteksi kategori entitas yang ditentukan untuk bahasa dokumen tertentu. Jika Anda ingin menentukan entitas yang akan dideteksi dan ditampilkan, gunakan parameter piiCategories opsional dengan kategori entitas yang sesuai. Parameter ini juga dapat memungkinkan Anda mendeteksi entitas yang tidak diaktifkan secara default untuk bahasa dokumen Anda. Contoh berikut ini hanya akan mendeteksi Person. Anda dapat menentukan satu atau beberapa jenis entitas yang akan dikembalikan.

Tip

Jika Anda tidak menyertakan default saat menentukan kategori entitas, API hanya akan menampilkan kategori entitas yang Anda tentukan.

Input:

Catatan

Dalam contoh ini, ia hanya akan mengembalikan jenis entitas orang:

https://<your-language-resource-endpoint>/language/:analyze-text?api-version=2022-05-01

{
    "kind": "PiiEntityRecognition",
    "parameters": 
    {
        "modelVersion": "latest",
        "piiCategories" :
        [
            "Person"
        ]
    },
    "analysisInput":
    {
        "documents":
        [
            {
                "id":"1",
                "language": "en",
                "text": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is John Doe) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!"
            }
        ]
    }
}

Output:


{
    "kind": "PiiEntityRecognitionResults",
    "results": {
        "documents": [
            {
                "redactedText": "We went to Contoso foodplace located at downtown Seattle last week for a dinner party, and we adore the spot! They provide marvelous food and they have a great menu. The chief cook happens to be the owner (I think his name is ********) and he is super nice, coming out of the kitchen and greeted us all. We enjoyed very much dining in the place! The pasta I ordered was tender and juicy, and the place was impeccably clean. You can even pre-order from their online menu at www.contosofoodplace.com, call 112-555-0176 or send email to order@contosofoodplace.com! The only complaint I have is the food didn't come fast enough. Overall I highly recommend it!",
                "id": "1",
                "entities": [
                    {
                        "text": "John Doe",
                        "category": "Person",
                        "offset": 226,
                        "length": 8,
                        "confidenceScore": 0.98
                    }
                ],
                "warnings": []
            }
        ],
        "errors": [],
        "modelVersion": "2021-01-15"
    }
}

Mendapatkan hasil PII

Ketika Anda mendapatkan hasil dari deteksi PII, Anda dapat melakukan streaming hasil ke aplikasi atau menyimpan output ke file pada sistem lokal. Tanggapan API akan mencakup entitas yang dikenali, termasuk kategori dan subkategorinya, serta skor kepercayaan. Untai (karakter) teks dengan entitas PII yang diredaksi juga akan dikembalikan.

Batas layanan dan data

Untuk informasi tentang ukuran dan jumlah permintaan yang dapat Anda kirim per menit dan detik, lihat artikel batas layanan.

Langkah berikutnya

Ringkasan Pengenalan Entitas Karakter