Che cos'è il servizio di de-identificazione (anteprima)?
Il servizio di de-identificazione (anteprima) in Servizi dati sanitari di Azure consente alle organizzazioni sanitarie di rendere anonimi i dati clinici in modo che i dati risultanti mantengano la rilevanza clinica e la distribuzione, rispettando al contempo la regola sulla portabilità e la responsabilità dell'assicurazione sanitaria del 1996 (HIPAA). Il servizio usa modelli di Machine Learning all'avanguardia per estrarre, redact o surrogati automaticamente 28 entità, inclusi gli identificatori HIPAA 18 Protected Health Information (PHI), da testo non strutturato, ad esempio note cliniche, trascrizioni, messaggi o studi clinici.
Usare i dati de-identificati nella ricerca, nella analitica e nell'apprendimento automatico
Il servizio di de-identificazione (anteprima) sblocca i dati che in precedenza erano difficili da de-identificare in modo che le organizzazioni possano condurre ricerche e ricavare informazioni dettagliate da analitica. Il servizio di de-identificazione supporta tre operazioni: tag, redact o surrogati PHI. Il servizio di de-identificazione offre molti vantaggi, tra cui:
Surrogazione: surrogazione, o sostituzione, è una procedura consigliata per la protezione PHI. Il servizio può sostituire gli elementi PHI con valori di sostituzione plausibili, generando dati più rappresentativi dei dati di origine. La surrogazione rafforza la protezione della privacy perché qualsiasi valore PHI falso negativo è nascosto all'interno di un documento.
Sostituzione coerente: i risultati di surrogazione coerenti consentono alle organizzazioni di mantenere le relazioni che si verificano nel set di dati sottostante, che è fondamentale per la ricerca, l'analitica e l'apprendimento automatico. Inviando i dati nello stesso batch, il servizio consente una sostituzione coerente tra entità e mantiene le relazioni temporali relative tra gli eventi.
Copertura PHI espansa: il servizio si espande oltre i 18 identificatori HIPAA per fornire protezioni della privacy più avanzate e distinzioni più granulari tra i tipi di entità, ad esempio la distinzione tra Medico e Paziente.
De-identificare i dati clinici in modo sicuro ed efficiente
Il servizio di de-identificazione (anteprima) offre molti vantaggi, tra cui:
Conformità PHI: il servizio di de-identificazione è progettato per le informazioni sanitarie protette (PHI). Il servizio usa l'apprendimento automatico per identificare le entità PHI, inclusi gli identificatori HIPAA 18, usando l'operazione "TAG". Le operazioni di redazione e surrogazione sostituiscono questi valori PHI identificati con un tag del tipo di entità o un surrogato o uno pseudonimo. Il servizio soddisfa anche tutti i requisiti di conformità a livello di area, tra cui HIPAA, GDPR e California Consumer Privacy Act (CCPA).
Sicurezza: il servizio di de-identificazione è un servizio senza stato. I dati dei clienti rimangono all'interno del tenant del cliente.
Controllo degli Controllo di accesso accessi in base al ruolo (RBAC): il controllo degli accessi in base al ruolo di Azure consente di gestire la modalità di elaborazione, archiviazione e accesso dei dati dell'organizzazione. Si determina chi può accedere ai set di dati di de-identificazione in base ai ruoli definiti per l'ambiente.
Endpoint sincroni o asincroni
Il servizio di de-identificazione (anteprima) offre due modi per interagire con l'API REST o la libreria client (Azure SDK).
- Inviare direttamente testo non strutturato non elaborato per l'analisi. L'output dell'API viene restituito nell'applicazione.
- Inviare un processo a file di processo endpoint in modo asincrono in blocco da Archiviazione BLOB di Azure usando tag, redact o surrogation con coerenza all'interno di un processo.
Requisiti di input e limiti del servizio
Il servizio di de-identificazione (anteprima) è progettato per ricevere testo non strutturato. Per de-identificare i dati archiviati nel servizio FHIR®, vedere Esportare i dati non identificati.
Durante l'anteprima sono applicabili i limiti del servizio seguenti:
- Le richieste non possono superare i 50 KB.
- I processi non possono elaborare più di 1.000 documenti.
- Ogni documento elaborato da un processo non può superare 2 MB.
Prezzi
Come con altri servizi dati di Integrità di Azure, si paga solo per ciò che si usa. L'allocazione mensile consente di provare gratuitamente il prodotto.
Operazione di trasformazione (per MB) | Fino a 50 MB | Oltre 50 MB |
---|---|---|
De-identificazione del testo non strutturato | $0 | $ 0,05 |
Quando si sceglie di archiviare i documenti in Archiviazione BLOB di Azure, vengono addebitati i costi in base ai prezzi Archiviazione di Azure.
Uso responsabile dell'IA
Un sistema di intelligenza artificiale include la tecnologia, le persone che lo usano, le persone interessate da esso e l'ambiente in cui viene distribuito. Leggere la nota sulla trasparenza per il servizio di de-identificazione (anteprima) per informazioni sull'uso e la distribuzione di intelligenza artificiale responsabili nei sistemi.
Contenuto correlato
Guida introduttiva alla de-identificazione