Nota
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare ad accedere o modificare le directory.
L'accesso a questa pagina richiede l'autorizzazione. È possibile provare a modificare le directory.
Azure AI Content Understanding è un servizio di intelligenza artificiale generativo innovativo progettato per facilitare l'analisi precisa e accurata di set di dati estesi. Il servizio elabora varie modalità di contenuto, tra cui documenti, immagini, video e audio, trasformandoli in formati di output specificati dall'utente.
Questo documento fornisce indicazioni e procedure consigliate per utilizzare in modo efficace La comprensione dei contenuti per i requisiti di elaborazione e analisi dei dati.
Usare le descrizioni dei campi per guidare l'output
Quando si definisce uno schema, è essenziale fornire descrizioni dettagliate dei campi. Descrizioni chiare e concise guidano il modello per concentrarsi sulle informazioni corrette, migliorando l'accuratezza dell'output.
Esempio 1
Se si vuole estrarre la data da una fattura, oltre a denominare il campo
Date
, specificare una descrizione, ad esempio:The date when the invoice was issued, typically found at the top right corner of the document.
Esempio 2
Si supponga di voler estrarre l'oggetto
Customer Name
da una fattura. La descrizione potrebbe leggere:The name of the customer or client to whom this invoice is addressed, usually located near the billing address. It should be the name of the business or person, but not the entire mailing address.
Correggere gli errori modificando le descrizioni dei campi
Se l'output del sistema non soddisfa le aspettative, il primo passaggio consiste nel provare a perfezionare e aggiornare le descrizioni dei campi. Chiarire il contesto e essere più espliciti su ciò che serve, riduce l'ambiguità e migliora l'accuratezza.
Esempio 3
Se il
Shipping date
campo ha generato un'estrazione incoerente o non corretta, spesso dopo un'etichettaDispatch Date
, aggiornarla in modo più preciso, ad esempio:The date when the products were shipped, typically found below the item list. It may also be labeled something similar like Delivery Date or Dispatch Date. Dates should typically have a format like 1/23/2024 or 01-04-2025.
Questo contesto aggiuntivo guida il modello alla posizione corretta nel documento.
Usare i campi di classificazione per output specifici
Quando è necessario che il sistema scelga tra un set di opzioni predefinite, ad esempio tipo di documento, categoria di prodotti o stato, usare i campi di classificazione. In caso di ambiguità con le opzioni, fornire descrizioni chiare per ogni opzione, consentendo al modello di classificare i dati in modo accurato.
Esempio 4
- Se è necessario classificare i documenti come
Invoice
,Claim
oReport
, creare un campo di classificazione con queste parole come nomi di categoria.
Esempio 5
Durante l'elaborazione delle immagini del prodotto, potrebbe essere necessario assegnarle a categorie come
AlcoholicDrinks
,SoftDrinks
Snacks
, eDairyProducts
. Poiché alcuni elementi possono apparire simili, fornire definizioni precise per i casi di chiusura delle chiamate può essere utile. Per esempio:Alcoholic Drinks
: bevande contenenti alcol, ad esempio birra, vino e liquori. Questa categoria esclude bevande soft drink o altre bevande nonalcotiche.Soft Drinks
: bevande nonalcoholiche carbonate, come soda e acqua frizzante. Questa categoria non include succhi o bevande alcoliche.
Definendo chiaramente ogni categoria, si garantisce che il sistema classifica correttamente i prodotti riducendo al minimo la classificazione errata.
Usare i punteggi di attendibilità per determinare quando è necessaria la revisione umana
I punteggi di attendibilità consentono di decidere quando coinvolgere i revisori umani. I clienti possono interpretare i punteggi di attendibilità usando le soglie per decidere quali risultati necessitano di più revisioni, riducendo al minimo il rischio di errori.
Esempio 6
Per un caso d'uso di revisione della fattura, se un campo estratto con chiave come
TotalInvoiceAmount
ha un punteggio di attendibilità inferiore a 0,80, instradare il documento alla revisione manuale. Ciò consente a un utente di verificare i campi critici, ad esempio i totali delle fatture o le dichiarazioni legali, quando necessario.È possibile impostare soglie di attendibilità diverse in base al tipo di campo. Ad esempio, una soglia inferiore per un
Comments
campo meno critico e un valore superiore perContractTerminationDate
garantire che non si commette alcun errore.
Ridurre gli errori restringendo la selezione della lingua per audio e video
Quando si lavora con contenuti audio e video, la selezione di un set ristretto di lingue per la trascrizione può potenzialmente ridurre gli errori. Più lingue includi, più il sistema deve indovinare la lingua parlata, che può aumentare gli errori di riconoscimento.
Esempio 7
- Se si è certi che il contenuto contenga solo inglese e spagnolo, la configurazione della trascrizione in queste due lingue può migliorare la qualità. Tuttavia, se il contenuto include accidentalmente altre lingue, tale configurazione può effettivamente degradare la qualità complessiva.
Trascrizione, testo del documento e dati voce: campi non necessari
Per impostazione predefinita, è possibile accedere alle informazioni di estrazione contenuto, ad esempio trascrizioni vocali, testo del documento estratto da OCR
e fotogrammi chiave video direttamente dall'output dell'analizzatore per la revisione immediata o l'elaborazione personalizzata. Non è necessario definire un campo nello schema per questi elementi. I campi possono essere usati quando è necessaria un'elaborazione maggiore, ad esempio riepilogando le trascrizioni, identificando le entità o estraendo elementi specifici da OCR
. Ogni campo può indicare al sistema di estrarre o generare il contenuto necessario.
Nomi e descrizioni delle categorie del classificatore
Per migliorare l'accuratezza del classificatore e della suddivisione, è importante assegnare un nome e una descrizione di categoria validi con il contesto.
Esempio 8
Per i nomi delle categorie, assicurarsi di usare i titoli comuni (ad esempio Annual Financial Report, SEC Form 10-K).
Per le descrizioni delle categorie, assicurarsi di assegnare un contesto che distingue una categoria da un'altra.
- Definizione semantica: ad esempio
receipts for expense reporting
- Contenuto chiave: qualsiasi contenuto in grado di identificare in modo univoco una categoria, ad esempio
2025
nei moduli fiscali per distinguere da moduli fiscali meno recenti - Layout comune: layout che è distinguibile da altri, ad esempio
two-column form
o casella di controllo riempita/non riempita
- Definizione semantica: ad esempio