Guida introduttiva: Analisi del testo personalizzati per l'integrità

Articolo
01/10/2024

Usare questo articolo per iniziare a creare un Analisi del testo personalizzato per il progetto di integrità, in cui è possibile eseguire il training di modelli personalizzati oltre a Analisi del testo per l'integrità per il riconoscimento di entità personalizzate. Un modello è un software di intelligenza artificiale sottoposto a training per eseguire una determinata attività. Per questo sistema, i modelli estraggono le entità denominate correlate al settore sanitario e vengono sottoposti a training tramite l'apprendimento dai dati etichettati.

In questo articolo si usa Language Studio per illustrare i concetti chiave delle Analisi del testo personalizzate per l'integrità. Ad esempio, si creerà un Analisi del testo personalizzato per il modello sanitario per estrarre la posizione della struttura o del trattamento da brevi note di scaricamento.

Nome	Descrizione
Abbonamento	La sottoscrizione di Azure.
Gruppo di risorse	Gruppo di risorse che conterrà la risorsa. È possibile usare uno esistente o crearne uno nuovo.
Area	Area per la risorsa lingua. Ad esempio, "Stati Uniti occidentali 2".
Nome	Nome della risorsa.
Piano tariffario	Piano tariffario per la risorsa Lingua. È possibile usare il livello Gratuito (F0) per provare il servizio.

Archiviazione valore dell'account	Valore consigliato
Nome account di archiviazione	Qualsiasi nome
Storage account type	LRS Standard

Segnaposto	Valore	Esempio
`{ENDPOINT}`	Endpoint per l'autenticazione della richiesta API.	`https://<your-custom-subdomain>.cognitiveservices.azure.com`
`{PROJECT-NAME}`	Nome del progetto. Per questo valore viene applicata la distinzione tra maiuscole e minuscole.	`myProject`
`{API-VERSION}`	Versione dell'API che si sta chiamando. Il valore a cui viene fatto riferimento è relativo alla versione più recente rilasciata. Per altre informazioni sulle altre versioni dell'API disponibili, vedere Ciclo di vita del modello.	`2022-05-01`

Key	Segnaposto	Valore	Esempio
`multilingual`	`true`	Valore booleano che consente di avere documenti in più lingue nel set di dati e quando il modello viene distribuito, è possibile eseguire query sul modello in qualsiasi linguaggio supportato (non necessariamente incluso nei documenti di training). Per altre informazioni sul supporto multilingue, vedere Supporto linguistico.	`true`
`projectName`	`{PROJECT-NAME}`	Nome progetto	`myproject`
`storageInputContainerName`	`{CONTAINER-NAME}`	Nome contenitore	`mycontainer`
`entities`		Matrice contenente tutti i tipi di entità presenti nel progetto. Questi sono i tipi di entità che verranno estratti dai documenti in.
`category`		Nome del tipo di entità, che può essere definito dall'utente per le nuove definizioni di entità o predefinito per le entità predefinite.
`compositionSetting`	`{COMPOSITION-SETTING}`	Regola che definisce come gestire più componenti nell'entità. Le opzioni sono `combineComponents` o `separateComponents`.	`combineComponents`
`list`		Matrice contenente tutti gli elenchi secondari presenti nel progetto per un'entità specifica. Gli elenchi possono essere aggiunti alle entità predefinite o alle nuove entità con componenti appresi.
`sublists`	`[]`	Matrice contenente sottoliste. Ogni sottolista è una chiave e i relativi valori associati.	`[]`
`listKey`	`One`	Valore normalizzato per l'elenco di sinonimi a cui eseguire il mapping nella stima.	`One`
`synonyms`	`[]`	Matrice contenente tutti i sinonimi	sinonimo
`language`	`{LANGUAGE-CODE}`	Stringa che specifica il codice della lingua per il sinonimo nell'elenco secondario. Se il progetto è un progetto multilingue e si vuole supportare l'elenco di sinonimi per tutte le lingue del progetto, è necessario aggiungere in modo esplicito i sinonimi a ogni lingua. Per altre informazioni sui codici linguistici supportati, vedere Supporto della lingua.	`en`
`values`	`"EntityNumberone"`, `"FirstEntity"`	Elenco di stringhe separate da virgole corrispondenti esattamente per l'estrazione e il mapping alla chiave di elenco.	`"EntityNumberone"`, `"FirstEntity"`
`prebuilts`	`MedicationName`	Nome del componente predefinito che popola l'entità predefinita. Le entità predefinite vengono caricate automaticamente nel progetto per impostazione predefinita, ma è possibile estenderle con i componenti elenco nel file delle etichette.	`MedicationName`
`documents`		Matrice contenente tutti i documenti nel progetto e l'elenco delle entità etichettate all'interno di ogni documento.	[]
`location`	`{DOCUMENT-NAME}`	Posizione dei documenti nel contenitore di archiviazione. Poiché tutti i documenti si trovano nella radice del contenitore, questo deve essere il nome del documento.	`doc1.txt`
`dataset`	`{DATASET}`	Set di test su cui verrà eseguito il file quando verrà suddiviso prima del training. I valori possibili per questo campo sono `Train` e `Test`.	`Train`
`regionOffset`		Posizione del carattere inclusivo dell'inizio del testo.	`0`
`regionLength`		Lunghezza del rettangolo di selezione in termini di caratteri UTF16. Il training considera solo i dati in questa area.	`500`
`category`		Tipo di entità associata all'intervallo di testo specificato.	`Entity1`
`offset`		Posizione iniziale per il testo dell'entità.	`25`
`length`		Lunghezza dell'entità in termini di caratteri UTF16.	`20`
`language`	`{LANGUAGE-CODE}`	Stringa che specifica il codice della lingua per il documento usato nel progetto. Se il progetto è un progetto multilingue, scegliere il codice linguistico della maggior parte dei documenti. Per altre informazioni sui codici linguistici supportati, vedere Supporto della lingua.	`en`

Key	Segnaposto	Valore	Esempio
modelLabel	`{MODEL-NAME}`	Nome del modello assegnato al modello dopo il training.	`myModel`
trainingConfigVersion	`{CONFIG-VERSION}`	Si tratta della versione del modello usata per eseguire il training del modello.	`2022-05-01`
evaluationOptions		Opzione per suddividere i dati tra set di training e test.	`{}`
kind	`percentage`	Metodi di divisione. I possibili valori sono `percentage` o `manual`. Per altre informazioni, vedere Come eseguire il training di un modello .	`percentage`
trainingSplitPercentage	`80`	Percentuale dei dati con tag da includere nel set di training. Il valore consigliato è `80`.	`80`
testingSplitPercentage	`20`	Percentuale dei dati contrassegnati da includere nel set di test. Il valore consigliato è `20`.	`20`

Key	Segnaposto	Valore	Esempio
`displayName`	`{JOB-NAME}`	Nome del processo.	`MyJobName`
`documents`	[{},{}]	Elenco di documenti in cui eseguire attività.	`[{},{}]`
`id`	`{DOC-ID}`	Nome o ID del documento.	`doc1`
`language`	`{LANGUAGE-CODE}`	Stringa che specifica il codice della lingua per il documento. Se questa chiave non è specificata, il servizio presuppone la lingua predefinita del progetto selezionato durante la creazione del progetto. Per un elenco dei codici linguistici supportati, vedere supporto per la lingua.	`en-us`
`text`	`{DOC-TEXT}`	Attività documento in cui eseguire le attività.	`Lorem ipsum dolor sit amet`
`tasks`		Elenco di attività da eseguire.	`[]`
`taskName`	`Custom Text Analytics for Health Test`	Nome dell'attività	`Custom Text Analytics for Health Test`
`kind`	`CustomHealthcare`	Il tipo di progetto o attività che si sta tentando di eseguire	`CustomHealthcare`
`parameters`		Elenco di parametri da passare all'attività.
`project-name`	`{PROJECT-NAME}`	Nome del progetto. Per questo valore viene applicata la distinzione tra maiuscole e minuscole.	`myProject`
`deployment-name`	`{DEPLOYMENT-NAME}`	Nome della distribuzione. Per questo valore viene applicata la distinzione tra maiuscole e minuscole.	`prod`

Key	Valore di esempio	Descrizione
entities	[]	Matrice contenente tutte le entità estratte.
entityComponentKind	`prebuiltComponent`	Variabile che indica quale componente ha restituito l'entità specifica. Valori possibili: `prebuiltComponent`, `learnedComponent`, `listComponent`
offset	`0`	Numero che indica il punto iniziale dell'entità estratta tramite l'indicizzazione dei caratteri
length	`10`	Numero che indica la lunghezza dell'entità estratta in numero di caratteri.
Testo	`first entity`	Testo estratto per un'entità specifica.
category	`MedicationName`	Nome del tipo di entità o della categoria corrispondente al testo estratto.
confidenceScore	`0.9`	Numero che indica il livello di certezza del modello dell'entità estratta che va da 0 a 1 con un numero maggiore che indica una maggiore certezza.
assertion	`certainty`	Asserzioni associate all'entità estratta. Le asserzioni sono supportate solo per le Analisi del testo predefinite per le entità di integrità.
name	`Ibuprofen`	Nome normalizzato per il collegamento di entità associato all'entità estratta. Il collegamento di entità è supportato solo per le Analisi del testo predefinite per le entità di integrità.
collegamenti	[]	Matrice contenente tutti i risultati del collegamento dell'entità associata all'entità estratta. Il collegamento di entità è supportato solo per le Analisi del testo predefinite per le entità di integrità.
dataSource	`UMLS`	Standard di riferimento risultante dal collegamento di entità associato all'entità estratta. Il collegamento di entità è supportato solo per le Analisi del testo predefinite per le entità di integrità.
ID	`C0020740`	Codice di riferimento risultante dal collegamento dell'entità associata all'entità estratta appartenente all'origine dati estratta. Il collegamento di entità è supportato solo per le Analisi del testo predefinite per le entità di integrità.
Relazioni	[]	Matrice contenente tutte le relazioni estratte. L'estrazione delle relazioni è supportata solo per le Analisi del testo predefinite per le entità di integrità.
relationType	`DosageOfMedication`	Categoria della relazione estratta. L'estrazione delle relazioni è supportata solo per le Analisi del testo predefinite per le entità di integrità.
entities	`"Dosage", "Medication"`	Entità associate alla relazione estratta. L'estrazione delle relazioni è supportata solo per le Analisi del testo predefinite per le entità di integrità.

Guida introduttiva: Analisi del testo personalizzati per l'integrità

Prerequisiti

Creare una nuova risorsa del linguaggio di intelligenza artificiale di Azure e un account di archiviazione di Azure

Creare una nuova risorsa dal portale di Azure

Caricare dati di esempio nel contenitore BLOB

Creare un Analisi del testo personalizzato per il progetto di integrità

Eseguire il training del modello

Distribuire il modello

Testare il modello

Pulire le risorse

Prerequisiti

Creare una nuova risorsa del linguaggio di intelligenza artificiale di Azure e un account di archiviazione di Azure

Creare una nuova risorsa dal portale di Azure

Caricare dati di esempio nel contenitore BLOB

Ottenere le chiavi di risorsa e l'endpoint

Creare un Analisi del testo personalizzato per il progetto di integrità

Attivare il processo di importazione del progetto

Intestazioni

Corpo

Ottenere lo stato del processo di importazione

Richiesta URL

Intestazioni

Eseguire il training del modello

Avviare il processo di training

Intestazioni

Corpo della richiesta

Ottenere lo stato del processo di training

Richiesta URL

Intestazioni

Testo della risposta

Distribuire il modello

Avviare il processo di distribuzione

Intestazioni

Corpo della richiesta

Ottenere lo stato del processo di distribuzione

Intestazioni

Testo della risposta

Eseguire stime con il modello sottoposto a training

Inviare un Analisi del testo personalizzato per l'attività di integrità

Intestazioni

Corpo

Response

Ottenere i risultati dell'attività

Intestazioni

Testo della risposta

Pulire le risorse

Intestazioni

Passaggi successivi

Risorse aggiuntive