Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Il riconoscimento personalizzato delle entità denominate (NER) è un servizio API basato sul cloud che usa Machine Learning per creare modelli progettati per i requisiti univoci di riconoscimento delle entità. Si tratta di una delle funzionalità specializzate disponibili tramite il linguaggio di Azure negli strumenti foundry. Con NER personalizzato, è possibile creare modelli di intelligenza artificiale che estraggono entità specifiche del dominio da testo non strutturato, ad esempio contratti o documenti finanziari. Quando si avvia un progetto NER personalizzato, è possibile etichettare ripetutamente i dati, eseguire il training e valutare il modello e migliorarne le prestazioni prima di distribuirlo. La qualità dei dati etichettati è essenziale, perché influisce direttamente sull'accuratezza del modello.
Per semplificare la compilazione e la personalizzazione del modello, il servizio offre una piattaforma Web personalizzata accessibile tramite Microsoft Foundry. È possibile iniziare facilmente a usare il servizio seguendo i passaggi descritti in questo avvio rapido.
Questa documentazione contiene i tipi di articoli seguenti:
- Le guide introduttive sono istruzioni introduttive che consentono di eseguire richieste al servizio.
- I concetti forniscono spiegazioni sulle funzionalità e sulle caratteristiche del servizio.
- Le guide pratiche contengono istruzioni per usare il servizio con modalità più specifiche o personalizzate.
Esempi di scenari d'uso
Il riconoscimento personalizzato delle entità denominate può essere usato in più scenari in diversi settori:
Estrazione di informazioni
Molte organizzazioni finanziarie e legali estraggono e normalizzano quotidianamente i dati da migliaia di origini di testo complesse e non strutturate. Tali origini includono rendiconti bancari, contratti legali o moduli bancari. Ad esempio, l'estrazione dei dati da un'applicazione ipotecaria eseguita manualmente da revisori umani può richiedere diversi giorni. L'automazione di questi passaggi con la generazione di un modello di riconoscimento di entità denominate (NER) personalizzato semplifica il processo e consente di risparmiare costi, tempo e lavoro.
Knowledge mining per migliorare/arricchire la ricerca semantica
La ricerca è fondamentale per qualunque app che espone contenuto di testo agli utenti. Scenari comuni includono la ricerca di cataloghi o documenti, la ricerca di prodotti al dettaglio o il knowledge mining per il data science dei dati. Molte aziende in vari settori desiderano creare un'esperienza di ricerca avanzata per contenuti privati ed eterogenei che include documenti strutturati e non strutturati. Come parte della pipeline, gli sviluppatori possono usare il riconoscimento di entità denominate (NER) personalizzato per estrarre entità dal testo pertinente al proprio settore. Tali entità possono essere usate per arricchire l'indicizzazione del file per un'esperienza di ricerca più personalizzata.
Controllo e conformità
Invece di esaminare manualmente file di testo lunghi per controllare e applicare criteri, i reparti IT nelle aziende finanziarie o legali possono usare NER personalizzato per creare soluzioni automatizzate. Queste soluzioni possono essere utili per l’applicazione di criteri di conformità e la configurazione delle regole business necessarie in base alle pipeline di knowledge mining che elaborano contenuti strutturati e non strutturati.
Ciclo di vita di sviluppo di un progetto
L'uso del riconoscimento di entità denominate (NER) personalizzato generalmente implica diversi passaggi.
Definire uno schema: conoscere i dati e identificare le entità da estrarre. Evitare ambiguità.
Etichettare i dati: l'etichettatura dei dati è un fattore chiave per determinare le prestazioni del modello. Etichettare con precisione, in modo coerente ed esauriente.
- Etichettare con precisione: etichettare sempre ogni entità con il tipo corretto. Includere solo ciò che si desidera estrarre ed evitare dati non necessari nelle etichette.
- Etichettare con coerenza: la stessa entità deve avere la stessa etichetta in tutti i file. Etichetta in maniera completa: etichettare tutte le istanze dell'entità in tutti i file.
Eseguire il training del modello: il modello inizia ad apprendere dai dati etichettati.
Visualizzare le prestazioni del modello: dopo il training, esaminare i risultati della valutazione e analizzare le prestazioni per ottenere miglioramenti.
Distribuire il modello: la distribuzione di un modello lo rende disponibile all’uso tramite l’API di analisi.
Estrarre entità: usare modelli personalizzati per attività di estrazione di entità.
Documentazione di riferimento ed esempi di codice
Quando si usa il Riconoscimento entità denominata personalizzato, consultare la documentazione di riferimento e gli esempi seguenti per Lingua di Azure in Foundry Tools:
| Lingua / opzione di sviluppo | Documentazione di riferimento | Esempi |
|---|---|---|
| API REST (creazione) | Documentazione relativa all'API REST | |
| API REST (runtime) | Documentazione relativa all'API REST | |
| C# (runtime) | Documentazione di C# | Esempi per C# |
| Java (ambiente di esecuzione) | Documentazione di Java | Esempi di Java |
| JavaScript (runtime) | Documentazione di JavaScript | Esempi JavaScript |
| Python (runtime) | Documentazione di Python | Esempi per Python |
IA responsabile
Un sistema di intelligenza artificiale include non solo la tecnologia, ma anche le persone che lo usano, le persone interessate e l'ambiente di distribuzione. Leggere la nota sulla trasparenza per informazioni sull'uso e la distribuzione responsabili dell'intelligenza artificiale nei sistemi. Per altre informazioni, vedere gli articoli seguenti:
- Nota sulla trasparenza per Azure Language negli strumenti di fonderia
- Integrazione e uso responsabile
- Dati, privacy e sicurezza
Passaggi successivi
Usare l'articolo di avvio rapido per iniziare a usare il riconoscimento di entità denominate personalizzato.
Durante il ciclo di vita di sviluppo di un progetto, esaminare il glossario per altre informazioni sui termini usati in tutta la documentazione per questa funzionalità.
Non dimenticare di visualizzare i limiti del servizio per ottenere informazioni come la disponibilità a livello di area.