Che cos'è il riconoscimento delle entità denominato personalizzato?

Il NER personalizzato è una delle funzionalità personalizzate offerte dal servizio cognitivo di Azure per il linguaggio. Si tratta di un servizio API basato sul cloud che applica l'intelligence di Machine Learning per consentire di creare modelli personalizzati per attività di riconoscimento delle entità denominate personalizzate.

Il NER personalizzato consente agli utenti di creare modelli di intelligenza artificiale personalizzati per estrarre entità specifiche del dominio dal testo non strutturato, ad esempio contratti o documenti finanziari. Creando un progetto NER personalizzato, gli sviluppatori possono etichettare in modo iterativo i dati, eseguire il training, valutare e migliorare le prestazioni del modello prima di renderlo disponibile per l'utilizzo. La qualità dei dati etichettati influisce notevolmente sulle prestazioni del modello. Per semplificare la compilazione e la personalizzazione del modello, il servizio offre un portale Web personalizzato accessibile tramite Language Studio. È possibile iniziare facilmente con il servizio seguendo i passaggi descritti in questa guida introduttiva.

Questa documentazione contiene i tipi di articolo seguenti:

  • Le guide introduttive sono istruzioni introduttive per guidare le richieste al servizio.
  • I concetti forniscono spiegazioni delle funzionalità e delle funzionalità del servizio.
  • Le guide su come contengono istruzioni per l'uso del servizio in modi più specifici o personalizzati.

Esempi di scenari d'uso

Il riconoscimento personalizzato delle entità denominato può essere usato in più scenari in diversi settori:

Estrazione di informazioni

Molte organizzazioni finanziarie e legali estraggono e normalizzano i dati da migliaia di origini di testo complesse e non strutturate su base giornaliera. Tali fonti includono dichiarazioni bancarie, contratti legali o moduli bancari. Ad esempio, l'estrazione dei dati dell'applicazione ipoteca eseguita manualmente dai revisori umani può richiedere diversi giorni per estrarre. L'automazione di questi passaggi creando un modello NER personalizzato semplifica il processo e consente di risparmiare costi, tempo e sforzo.

La ricerca è fondamentale per qualsiasi app che superfici il contenuto di testo agli utenti. Gli scenari comuni includono la ricerca di cataloghi o documenti, la ricerca di prodotti al dettaglio o il data mining per la data science. Molte aziende in vari settori vogliono creare un'esperienza di ricerca avanzata su contenuti privati, eterogenei, che includono documenti strutturati e non strutturati. Come parte della pipeline, gli sviluppatori possono usare il NER personalizzato per estrarre entità dal testo pertinente al proprio settore. Queste entità possono essere usate per arricchire l'indicizzazione del file per un'esperienza di ricerca più personalizzata.

Controllo e conformità

Anziché esaminare manualmente i file di testo significativamente lunghi per controllare e applicare criteri, i reparti IT nelle aziende finanziarie o legali possono usare il NER personalizzato per creare soluzioni automatizzate. Queste soluzioni possono essere utili per applicare i criteri di conformità e configurare regole aziendali necessarie in base alle pipeline di knowledge mining che elaborano contenuti strutturati e non strutturati.

Ciclo di vita dello sviluppo del progetto

L'uso di NER personalizzato prevede in genere diversi passaggi.

Ciclo di vita dello sviluppo

  1. Definire lo schema: conoscere i dati e identificare le entità da estrarre. Evitare ambiguità.

  2. Etichettare i dati: l'etichettatura dei dati è un fattore chiave per determinare le prestazioni del modello. Etichettare esattamente, coerentemente e completamente.

    1. Etichettare esattamente: etichettare ogni entità nel tipo corretto sempre. Includere solo gli elementi da estrarre, evitando dati non necessari nelle etichette.
    2. Etichetta in modo coerente: la stessa entità deve avere la stessa etichetta in tutti i file.
    3. Etichetta completamente: etichettare tutte le istanze dell'entità in tutti i file.
  3. Eseguire il training del modello: il modello inizia a imparare dai dati etichettati.

  4. Visualizzare le prestazioni del modello: dopo aver completato il training, visualizzare i dettagli di valutazione del modello, le relative prestazioni e indicazioni su come migliorarlo.

  5. Distribuire il modello: la distribuzione di un modello lo rende disponibile per l'uso tramite l'API Analizza.

  6. Estrarre entità: usare i modelli personalizzati per le attività di estrazione delle entità.

Documentazione di riferimento e esempi di codice

Quando si usa NER personalizzato, vedere la documentazione di riferimento e gli esempi seguenti per Servizi cognitivi di Azure per il linguaggio:

Opzione di sviluppo/linguaggio Documentazione di riferimento Esempi
API REST (creazione) Documentazione dell'API REST
API REST (Runtime) Documentazione dell'API REST
C# (runtime) Documentazione di C# Esempi per C#
Java (Runtime) Documentazione java Esempi di Java
JavaScript (Runtime) Documentazione di JavaScript Esempi JavaScript
Python (runtime) Documentazione di Python Esempi per Python

IA responsabile

Un sistema di intelligenza artificiale include non solo la tecnologia, ma anche le persone che lo useranno, le persone che saranno interessate da esso e l'ambiente in cui viene distribuito. Leggere la nota sulla trasparenza per il NER personalizzato per informazioni sull'uso e la distribuzione dell'intelligenza artificiale responsabile nei sistemi. Per altre informazioni, vedere anche gli articoli seguenti:

Passaggi successivi