Condividi tramite


Che cos’è il riconoscimento di entità denominate personalizzato?

Il riconoscimento personalizzato delle entità denominate (NER) è un servizio API basato sul cloud che usa Machine Learning per creare modelli progettati per i requisiti univoci di riconoscimento delle entità. Si tratta di una delle funzionalità specializzate disponibili tramite il linguaggio di Azure negli strumenti foundry. Con NER personalizzato, è possibile creare modelli di intelligenza artificiale che estraggono entità specifiche del dominio da testo non strutturato, ad esempio contratti o documenti finanziari. Quando si avvia un progetto NER personalizzato, è possibile etichettare ripetutamente i dati, eseguire il training e valutare il modello e migliorarne le prestazioni prima di distribuirlo. La qualità dei dati etichettati è essenziale, perché influisce direttamente sull'accuratezza del modello.

Per semplificare la compilazione e la personalizzazione del modello, il servizio offre una piattaforma Web personalizzata accessibile tramite Microsoft Foundry. È possibile iniziare facilmente a usare il servizio seguendo i passaggi descritti in questo avvio rapido.

Questa documentazione contiene i tipi di articoli seguenti:

  • Le guide introduttive sono istruzioni introduttive che consentono di eseguire richieste al servizio.
  • I concetti forniscono spiegazioni sulle funzionalità e sulle caratteristiche del servizio.
  • Le guide pratiche contengono istruzioni per usare il servizio con modalità più specifiche o personalizzate.

Esempi di scenari d'uso

Il riconoscimento personalizzato delle entità denominate può essere usato in più scenari in diversi settori:

Estrazione di informazioni

Molte organizzazioni finanziarie e legali estraggono e normalizzano quotidianamente i dati da migliaia di origini di testo complesse e non strutturate. Tali origini includono rendiconti bancari, contratti legali o moduli bancari. Ad esempio, l'estrazione dei dati da un'applicazione ipotecaria eseguita manualmente da revisori umani può richiedere diversi giorni. L'automazione di questi passaggi con la generazione di un modello di riconoscimento di entità denominate (NER) personalizzato semplifica il processo e consente di risparmiare costi, tempo e lavoro.

La ricerca è fondamentale per qualunque app che espone contenuto di testo agli utenti. Scenari comuni includono la ricerca di cataloghi o documenti, la ricerca di prodotti al dettaglio o il knowledge mining per il data science dei dati. Molte aziende in vari settori desiderano creare un'esperienza di ricerca avanzata per contenuti privati ed eterogenei che include documenti strutturati e non strutturati. Come parte della pipeline, gli sviluppatori possono usare il riconoscimento di entità denominate (NER) personalizzato per estrarre entità dal testo pertinente al proprio settore. Tali entità possono essere usate per arricchire l'indicizzazione del file per un'esperienza di ricerca più personalizzata.

Controllo e conformità

Invece di esaminare manualmente file di testo lunghi per controllare e applicare criteri, i reparti IT nelle aziende finanziarie o legali possono usare NER personalizzato per creare soluzioni automatizzate. Queste soluzioni possono essere utili per l’applicazione di criteri di conformità e la configurazione delle regole business necessarie in base alle pipeline di knowledge mining che elaborano contenuti strutturati e non strutturati.

Ciclo di vita di sviluppo di un progetto

L'uso del riconoscimento di entità denominate (NER) personalizzato generalmente implica diversi passaggi.

Ciclo di vita dello sviluppo

  1. Definire uno schema: conoscere i dati e identificare le entità da estrarre. Evitare ambiguità.

  2. Etichettare i dati: l'etichettatura dei dati è un fattore chiave per determinare le prestazioni del modello. Etichettare con precisione, in modo coerente ed esauriente.

    • Etichettare con precisione: etichettare sempre ogni entità con il tipo corretto. Includere solo ciò che si desidera estrarre ed evitare dati non necessari nelle etichette.
    • Etichettare con coerenza: la stessa entità deve avere la stessa etichetta in tutti i file. Etichetta in maniera completa: etichettare tutte le istanze dell'entità in tutti i file.
  3. Eseguire il training del modello: il modello inizia ad apprendere dai dati etichettati.

  4. Visualizzare le prestazioni del modello: dopo il training, esaminare i risultati della valutazione e analizzare le prestazioni per ottenere miglioramenti.

  5. Distribuire il modello: la distribuzione di un modello lo rende disponibile all’uso tramite l’API di analisi.

  6. Estrarre entità: usare modelli personalizzati per attività di estrazione di entità.

Documentazione di riferimento ed esempi di codice

Quando si usa il Riconoscimento entità denominata personalizzato, consultare la documentazione di riferimento e gli esempi seguenti per Lingua di Azure in Foundry Tools:

Lingua / opzione di sviluppo Documentazione di riferimento Esempi
API REST (creazione) Documentazione relativa all'API REST
API REST (runtime) Documentazione relativa all'API REST
C# (runtime) Documentazione di C# Esempi per C#
Java (ambiente di esecuzione) Documentazione di Java Esempi di Java
JavaScript (runtime) Documentazione di JavaScript Esempi JavaScript
Python (runtime) Documentazione di Python Esempi per Python

IA responsabile

Un sistema di intelligenza artificiale include non solo la tecnologia, ma anche le persone che lo usano, le persone interessate e l'ambiente di distribuzione. Leggere la nota sulla trasparenza per informazioni sull'uso e la distribuzione responsabili dell'intelligenza artificiale nei sistemi. Per altre informazioni, vedere gli articoli seguenti:

Passaggi successivi