Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Deteksi Informasi Identifikasi Pribadi (PII) Bahasa Azure AI adalah fitur yang ditawarkan oleh Bahasa Azure AI. Layanan deteksi PII adalah API berbasis cloud yang menggunakan pembelajaran mesin dan algoritma AI untuk membantu Anda mengembangkan aplikasi cerdas dengan pemahaman bahasa alami tingkat lanjut. Deteksi AZURE AI Language PII menggunakan Named Entity Recognition (NER) untuk mengidentifikasi dan meredaksi informasi sensitif dari data input. Layanan ini mengklasifikasikan data pribadi sensitif ke dalam kategori yang telah ditentukan sebelumnya. Kategori ini mencakup nomor telepon, alamat email, dan dokumen identifikasi. Klasifikasi ini membantu mendeteksi dan menghilangkan informasi tersebut secara efisien.
Kiat
Cobalah deteksi PII di portal Azure AI Foundry. Di sana Anda dapat menggunakan sumber daya Language Studio yang saat ini ada atau membuat sumber daya Azure AI Foundry baru.
Yang baru
API pratinjau deteksi PII Teks dan PII Percakapan (versi 2024-11-15-preview
) sekarang mendukung opsi untuk menutupi entitas sensitif yang terdeteksi dengan label di luar hanya karakter redaksi. Pelanggan dapat menentukan apakah konten data pribadi seperti nama dan nomor telepon, yaitu, "John Doe received a call from 424-878-9192"
, diselubungi dengan karakter redaksi, yaitu, "******** received a call from ************"
, atau ditutupi dengan label entitas, yaitu, "[PERSON_1] received a call from [PHONENUMBER_1]"
. Anda dapat menemukan lebih lanjut tentang cara menentukan gaya kebijakan penyuntingan untuk output Anda di panduan serbaguna kami.
Model deteksi PII Percakapan (baik versi 2024-11-01-preview
maupun GA
) diperbarui untuk memberikan kualitas dan akurasi AI yang ditingkatkan. Jenis entitas pengidentifikasi numerik sekarang juga mencakup SIM dan Identifikator Penerima Manfaat Medicare.
Mulai Juni 2024, kami memberikan dukungan Ketersediaan Umum untuk layanan PII Percakapan (hanya berbahasa Inggris). Pelanggan sekarang dapat meredaksi transkrip, obrolan, dan teks lain yang ditulis dengan gaya percakapan (yaitu, teks dengan um
, ah
, beberapa pembicara, dan ejaan kata-kata untuk lebih jelas) dengan keyakinan lebih baik terhadap kualitas AI, dukungan Azure SLA
serta lingkungan produksi, sambil memprioritaskan keamanan tingkat perusahaan.
Kemampuan
Saat ini, dukungan PII tersedia untuk kemampuan berikut:
- Deteksi PII teks umum untuk memproses informasi sensitif (PII) dan informasi kesehatan (PHI) dalam teks yang tidak terstruktur di beberapa kategori yang telah ditentukan sebelumnya .
- deteksi PII Percakapanmerupakan model khusus yang dirancang untuk menangani transkripsi ucapan serta nada percakapan informal yang ditemukan dalam rapat dan transkrip panggilan.
- Deteksi PII Dokumen Asli untuk memproses file dokumen terstruktur.
Bahasa Azure AI adalah layanan berbasis cloud yang menerapkan fitur Natural Language Processing (NLP) untuk mendeteksi kategori informasi pribadi (PII) dalam data berbasis teks. Dokumentasi ini berisi jenis berikut:
- Panduan Memulai Cepat adalah petunjuk langkah awal untuk memandu Anda dalam membuat permintaan ke layanan tersebut.
- Panduan berisi instruksi untuk menggunakan layanan dengan cara yang lebih spesifik atau disesuaikan.
Alur kerja umum
Untuk menggunakan fitur ini, Anda perlu mengirimkan data untuk analisis dan menangani output API dalam aplikasi Anda. Analisis dilakukan apa adanya, tanpa penyesuaian tambahan ke model yang digunakan pada data Anda.
Buat sumber daya Bahasa Azure AI, yang memberi Anda akses ke fitur yang ditawarkan oleh Bahasa Azure AI. Ini menghasilkan kata sandi (disebut kunci) dan URL titik akhir yang Anda gunakan untuk mengautentikasi permintaan API.
Buat permintaan menggunakan REST API atau pustaka klien untuk C#, Java, JavaScript, dan Python. Anda juga dapat mengirim panggilan asinkron dengan permintaan batch untuk menggabungkan permintaan API untuk beberapa fitur ke dalam satu panggilan.
Kirim permintaan yang berisi data teks Anda. Kunci dan titik akhir Anda digunakan untuk autentikasi.
Alirkan atau simpan respons secara lokal.
Fitur utama untuk PII teks
Bahasa Azure AI menawarkan pengenalan entitas bernama untuk mengidentifikasi dan mengategorikan informasi dalam teks Anda. Fitur ini mendeteksi kategori PII termasuk nama, organisasi, alamat, nomor telepon, nomor atau kode akun keuangan, dan nomor identifikasi pemerintah. Sebagian dari PII ini adalah informasi kesehatan yang dilindungi (PHI). Dengan menentukan domain=phi dalam permintaan Anda, hanya entitas PHI yang dikembalikan.
Mulai menggunakan deteksi PII
Untuk menggunakan deteksi PII, Anda mengirimkan teks untuk analisis dan menangani output API di aplikasi Anda. Analisis dilakukan apa adanya, tanpa penyesuaian pada model yang digunakan pada data Anda. Ada dua cara untuk menggunakan deteksi PII:
Opsi pengembangan | Deskripsi |
---|---|
Azure AI Foundry | Azure AI Foundry adalah platform berbasis web yang memungkinkan Anda menggunakan deteksi informasi identifikasi pribadi dengan contoh teks dengan data Anda sendiri saat mendaftar. Untuk informasi selengkapnya, lihat situs web Azure AI Foundry atau dokumentasi Azure AI Foundry. |
REST API atau Pustaka Klien (Azure SDK) | Integrasikan deteksi PII ke dalam aplikasi Anda menggunakan REST API, atau pustaka klien yang tersedia dalam berbagai bahasa. Untuk informasi selengkapnya, lihat panduan memulai cepat deteksi PII. |
Dokumentasi referensi dan sampel kode
Saat Anda menggunakan fitur ini di aplikasi Anda, lihat dokumentasi referensi dan sampel berikut untuk Bahasa Azure AI:
Opsi pengembangan/bahasa | Dokumentasi rujukan | Sampel |
---|---|---|
REST API | Dokumentasi REST API | |
C# | Dokumentasi C# | Sampel C++ |
Jawa | Dokumentasi Java | Sampel Java |
JavaScript | Dokumentasi JavaScript | Sampel JavaScript |
Phyton | Dokumentasi Python | Sampel Python |
Persyaratan input dan batas layanan
- Teks PII mengambil teks untuk dianalisis. Untuk informasi selengkapnya, lihat Batas data dan layanan dalam panduan cara penggunaan.
- PII bekerja dengan berbagai bahasa tertulis. Untuk informasi selengkapnya, lihat dukungan bahasa. Anda dapat menentukan dalam bahasa yang didukung di mana teks sumber Anda ditulis. Jika Anda tidak menentukan bahasa, ekstraksi akan default ke bahasa Inggris. API dapat menampilkan offset dalam respons untuk mendukung pengodean multibahasa dan emoji yang berbeda.
AI yang Bertanggung Jawab
Sistem AI tidak hanya mencakup teknologi, tetapi juga orang-orang yang menggunakannya, orang-orang yang terkena dampaknya, dan lingkungan penyebaran. Baca catatan transparansi untuk PII untuk mempelajari tentang penggunaan dan penyebaran AI yang bertanggung jawab di sistem Anda. Untuk informasi lebih lanjut, baca artikel berikut:
- Catatan transparansi untuk Bahasa Azure AI
- Integrasi dan penggunaan yang bertanggung jawab
- Data, privasi, dan keamanan
Skenario contoh
- Menerapkan label sensitivitas - Misalnya, berdasarkan hasil dari layanan PII, label sensitivitas publik mungkin diterapkan ke dokumen yang tidak terdeteksi berisi entitas PII. Untuk dokumen yang alamat dan nomor telepon AS-nya dikenali, label rahasia mungkin diterapkan. Label yang sangat rahasia dapat digunakan untuk dokumen yang nomor perutean banknya dikenali.
- Redact beberapa kategori informasi pribadi dari dokumen yang mendapatkan edaran lebih luas - Misalnya, jika catatan kontak pelanggan dapat diakses oleh perwakilan dukungan lini depan, perusahaan dapat meredaksi informasi pribadi pelanggan, kecuali namanya, dari versi riwayat pelanggan untuk menjaga privasi pelanggan.
- Redact informasi pribadi untuk mengurangi bias tidak sadar - Misalnya, selama proses peninjauan lamaran kerja perusahaan, mereka dapat memblokir nama, alamat, dan nomor telepon untuk membantu mengurangi bias tidak sadar terhadap jenis kelamin atau lainnya.
- Mengganti informasi pribadi dalam data sumber untuk pembelajaran mesin guna mengurangi ketidakadilan – Misalnya, jika Anda ingin menghapus nama yang mungkin mengungkapkan jenis kelamin saat melatih model pembelajaran mesin, Anda dapat menggunakan layanan untuk mengidentifikasi mereka dan menggantinya dengan tempat penampung generik untuk pelatihan model.
- Menghapus informasi pribadi dari transkripsi pusat panggilan – Misalnya, jika Anda ingin menghapus nama atau data PII lain yang ada di antara agen dan pelanggan dalam skenario pusat panggilan. Anda dapat menggunakan layanan untuk mengidentifikasi dan menghapusnya.
- Pembersihan data untuk ilmu data - PII dapat digunakan untuk membuat data siap bagi ilmuwan dan insinyur data agar dapat menggunakan data ini untuk melatih model pembelajaran mesin mereka. Menyamarkan data untuk memastikan bahwa data pelanggan tidak terekspos.
Langkah berikutnya
Ada dua cara untuk memulai menggunakan fitur penautan entitas:
- Azure AI Foundry adalah platform berbasis web yang memungkinkan Anda menggunakan beberapa fitur layanan Bahasa tanpa perlu menulis kode.
- Artikel panduan cepat yang membahas petunjuk tentang cara membuat permintaan ke layanan menggunakan REST API dan SDK pustaka klien.