Domande frequenti su Document Intelligence per intelligenza artificiale di Azure

Questo contenuto si applica a:segno di spuntav4.0 (anteprima)segno di spuntav3.1 (GA)segno di spuntav3.0 (GA)segno di spuntav2.1 (GA)

Concetti generali

Che cos'è Intelligence sui documenti di Intelligenza artificiale di Azure e che cosa è successo ad Azure AI Riconoscimento modulo?

Intelligence sui documenti di Intelligenza artificiale di Azure è un servizio basato sul cloud che usa modelli di Machine Learning per estrarre coppie chiave/valore, testo e tabelle dai documenti. Il risultato restituito è un output JSON strutturato. I casi d'uso di Intelligence sui documenti includono l'elaborazione automatica dei dati, le strategie avanzate basate sui dati e le funzionalità di ricerca dei documenti arricchite.

Document Intelligence fa parte dei servizi di intelligenza artificiale di Azure. I servizi di intelligenza artificiale di Azure includono tutti gli elementi precedentemente noti come Servizi cognitivi di Azure e servizi di intelligenza artificiale app Azure lied.

Il nome precedente di Document Intelligence era Riconoscimento modulo di Intelligenza artificiale di Azure. Riconoscimento modulo ufficialmente divenne Document Intelligence nel luglio 2023.

Non ci sono modifiche ai prezzi. I nomi Servizi cognitivi e Servizi di intelligenza artificiale applicati continuano a essere usati nelle API di fatturazione, analisi dei costi, listini prezzi e prezzi di Azure.

Non sono state apportate modifiche di rilievo alle API o alle librerie client (SDK). API REST e SDK versioni 2024-02-29-preview, 2023-10-31-preview e versioni successive vengono rinominate document intelligence.

Alcune piattaforme sono ancora in attesa dell'aggiornamento della ridenominazione. Nella documentazione Microsoft tutte le menzioni di Riconoscimento modulo e Document Intelligence fanno riferimento allo stesso servizio di Azure.

In che modo Document Intelligence è correlato all'intelligenza artificiale generativa dei documenti?

È possibile usare una soluzione di intelligenza artificiale generativa di documenti per chattare con i documenti, generare contenuti accattivanti da tali documenti e accedere ai modelli del servizio Azure OpenAI sui dati. Con Azure AI Document Intelligence e Azure OpenAI combinati, è possibile creare un'applicazione aziendale per interagire facilmente con i documenti usando linguaggi naturali, trovare facilmente risposte e ottenere informazioni dettagliate preziose e generare contenuti nuovi e coinvolgenti dai documenti esistenti. Per altre informazioni, vedere il blog della community tecnica.

In che modo l'intelligence sui documenti è correlata alla generazione aumentata del recupero?

La suddivisione in blocchi semantici è un passaggio chiave nella generazione di recupero con aumento della quantità di dati (RAG) per garantire un'archiviazione e un recupero efficienti. Il modello di layout di Document Intelligence offre una soluzione completa per le funzionalità di estrazione avanzata dei contenuti e analisi della struttura dei documenti.

Con il modello di layout, è possibile estrarre facilmente testo ed elementi strutturali per dividere grandi corpi di testo in blocchi più piccoli e significativi in base al contenuto semantico anziché a divisioni arbitrarie. È quindi possibile restituire facilmente le informazioni estratte nel formato Markdown, in modo da poter definire la strategia di suddivisione in blocchi semantici in base ai blocchi predefiniti forniti. Per altri dettagli, vedere la panoramica di RAG in Document Intelligence.

Quali casi d'uso di Intelligence sui documenti richiedono considerazioni speciali?

Prestare attenzione ai progetti di elaborazione documenti che includono dati finanziari, dati sanitari protetti, dati personali o dati altamente sensibili.

Assicurarsi di rispettare tutti i requisiti nazionali/regionali e specifici del settore.

Quali lingue supporta Document Intelligence?

I modelli universali basati su Deep Learning in Document Intelligence supportano molte lingue in grado di estrarre testo multilingue dalle immagini e dai documenti, incluse le righe di testo con lingue miste.

Il supporto linguistico varia in base alla funzionalità del servizio Document Intelligence. Per un elenco completo del testo scritto a mano e stampato supportato da Document Intelligence, vedere Supporto per la lingua.

Document Intelligence è disponibile nell'area di Azure?

Document Intelligence è disponibile a livello generale in molte delle 60 aree dell'infrastruttura globale di Azure.

Scegliere l'area più adatta a te e ai tuoi clienti.

Document Intelligence si integra con altri servizi Microsoft?

Sì, Document Intelligence si integra con i servizi seguenti:

In che modo l'intelligence sui documenti è correlata al riconoscimento ottico dei caratteri?

Document Intelligence è un servizio basato sul cloud che incorpora il riconoscimento ottico dei caratteri (OCR), l'analisi del testo e la classificazione del testo personalizzata dai servizi di Intelligenza artificiale di Azure.

Document Intelligence usa OCR per rilevare ed estrarre informazioni dal carattere tipografico e dai documenti di testo scritti a mano supportati dall'intelligenza artificiale per fornire maggiore struttura e informazioni all'estrazione del testo.

Quanto tempo è disponibile per l'uso il modello personalizzato?

Un modello ha lo stesso ciclo di vita della versione dell'API usata per eseguirne il training. I modelli personalizzati sottoposti a training con una versione di disponibilità generale (GA) dell'API hanno lo stesso ciclo di vita della versione dell'API. Quando la versione dell'API è deprecata, il modello non è più disponibile per l'inferenza. Anche i modelli sottoposti a training con una versione di anteprima dell'API hanno lo stesso ciclo di vita dell'API di anteprima.

Aspettatevi una deprecazione dell'API di anteprima entro tre mesi da una versione aggiornata dell'API di anteprima o una versione più recente dell'API ga.

Qual è il punteggio di accuratezza e come viene calcolato?

L'output di un'operazione build personalizzata (v3.0 e versioni successive) o train (v2.1) include il punteggio di accuratezza stimato. Questo punteggio rappresenta la capacità del modello di stimare accuratamente il valore etichettato in un documento visivamente simile.

L'accuratezza viene misurata entro un intervallo di valori percentuale compreso tra 0% (basso) e 100% (alto).

Per altre informazioni, vedere Accuratezza e punteggi di attendibilità.

Come è possibile migliorare i punteggi di accuratezza?

Le variazioni nella struttura visiva dei documenti possono influenzare l'accuratezza di un modello. Di seguito sono riportati alcuni suggerimenti:

  • Includere tutte le varianti di un documento nel set di dati di training. Le varianti includono formati diversi; ad esempio, pdf digitali e analizzati.

  • Separare i tipi di documento visivamente distinti ed eseguire il training di modelli diversi.

  • Assicurarsi di non avere etichette estranee.

  • Per l'etichettatura della firma e dell'area, non includere il testo circostante.

Per altre informazioni, vedere Accuratezza e punteggi di attendibilità.

Qual è il punteggio di attendibilità e come viene calcolato?

Un punteggio di attendibilità indica la probabilità misurando il grado di certezza statistica che il risultato estratto viene rilevato correttamente.

L'intervallo di valori di confidenza è una percentuale compresa tra 0% (bassa) e il 100% (alto). È consigliabile assegnare un punteggio dell'80% o superiore. Per casi più sensibili, ad esempio i documenti finanziari o medici, è consigliabile un punteggio di quasi il 100%. È anche possibile richiedere una revisione umana.

Per altre informazioni, vedere Accuratezza e punteggi di attendibilità.

Come è possibile migliorare i punteggi di attendibilità?

Dopo un'operazione di analisi, esaminare l'output JSON. Esaminare i valori di confidence per ogni risultato di chiave-valore nel nodo pageResults. È anche necessario esaminare il punteggio di attendibilità nel readResults nodo, che corrisponde all'operazione di lettura del testo. L'attendibilità dei risultati di lettura non influisce sull'attendibilità dei risultati di estrazione chiave/valore, quindi è consigliabile controllare entrambi. Di seguito sono riportati alcuni suggerimenti:

  • Se il punteggio di attendibilità per l'oggetto readResults è basso, migliorare la qualità dei documenti di input.

  • Se il punteggio di attendibilità per l'oggetto pageResults è basso, assicurarsi che i documenti da analizzare siano dello stesso tipo.

  • Prendere in considerazione l'incorporazione della revisione umana nei flussi di lavoro.

  • Usare moduli con valori diversi in ogni campo.

  • Per i modelli personalizzati, usare un set più ampio di documenti di training. L'assegnazione di tag a più documenti insegna al modello di riconoscere i campi con maggiore accuratezza.

Per altre informazioni, vedere Accuratezza e punteggi di attendibilità.

Che cos'è un rettangolo di selezione?

Un rettangolo delimitatore (polygon in versione 3.0 e versioni successive) è un rettangolo astratto che circonda gli elementi di testo in un documento o in un modulo. Viene usato come punto di riferimento per il rilevamento degli oggetti.

Il rettangolo di selezione specifica la posizione utilizzando un piano di coordinate x e y presentato in una matrice di quattro coppie numeriche. Ogni coppia rappresenta un angolo della casella nell'ordine seguente: in alto a sinistra, in alto a destra, in basso a destra, in basso a sinistra.

Per un'immagine, le coordinate sono in pixel. Per un PDF, le coordinate sono in pollici.

Document Intelligence può essere utile per classificare i documenti?

Document Intelligence fornisce modelli di classificazione personalizzati in grado di analizzare documenti a file singolo o a più file per identificare se un file di input contiene uno dei tipi di documento sottoposti a training. Il servizio supporta gli scenari seguenti:

  • Un singolo file contenente un tipo di documento, ad esempio un modulo di richiesta di prestito.

  • Singolo file che contiene più documenti. Un esempio è un pacchetto di domanda di prestito che contiene un modulo di richiesta di prestito, una busta paga e un estratto conto bancario.

  • Singolo file che contiene più istanze dello stesso documento. Un esempio è una raccolta di fatture analizzate.

Per altre informazioni, vedere la panoramica dei modelli di classificazione personalizzati.

Sviluppo di app

Quali sono le opzioni di sviluppo per Document Intelligence?

Document Intelligence offre le opzioni di sviluppo più recenti all'interno delle piattaforme seguenti:

Dove è possibile trovare la versione dell'API supportata per gli SDK del linguaggio di programmazione più recenti?

Questa tabella fornisce collegamenti alle versioni più recenti dell'SDK e mostra la relazione tra Document Intelligence SDK e versioni API supportate:

Informazioni di riferimento su Azure SDK per il linguaggio supportato Versioni API supportate
• C#/.NET: 4.0.0

• Java: 4.0.0

• JavaScript: 4.0.0

• Python 3.2.0
2023-10-31-preview
v3.0 v2.1
v2.0

Per altre informazioni, vedere Client supportati per i client v4.0 e Supportati per la versione 3.1.

Qual è la differenza tra Document Intelligence v3.0 e v2.1 e come si esegue la migrazione alla versione più recente?

Per migliorare l'usabilità, Document Intelligence v3.0 introduce una libreria client completamente riprogettata. Per usare correttamente le funzionalità più recenti dell'API Document Intelligence, è necessario l'SDK più recente e il codice dell'applicazione deve essere aggiornato per usare i nuovi client.

Questa tabella contiene collegamenti a istruzioni dettagliate per la migrazione alla versione più recente di Document Intelligence:

Lingua/API Guida alla migrazione
REST API v3
C#/.NET 4.0.0
Java 4.0.0
JavaScript 4.0.0
Python 3.2.0

Quali formati di file supporta Document Intelligence? Esistono limitazioni di dimensioni per i documenti di input?

Per ottenere i risultati migliori, vedere i requisiti di input.

Come è possibile specificare un intervallo di pagine da analizzare in un documento?

Usare il pages parametro (supportato in v2.1, v3.0 e versioni successive dell'API REST) per specificare le pagine per documenti PDF e TIFF a più pagine. L'input accettato include gli intervalli seguenti:

  • Pagine singole. Ad esempio, se si specifica 1, 2, vengono elaborate le pagine 1 e 2.
  • Intervalli finiti. Ad esempio, se si specifica 2-5, vengono elaborate le pagine da 2 a 5.
  • Intervalli aperti. Ad esempio, se si specifica 5-, vengono elaborate tutte le pagine della pagina 5. Se si specifica -10, vengono elaborate le pagine da 1 a 10.

È possibile combinare questi parametri e gli intervalli possono sovrapporsi. Ad esempio, se si specifica -5, 1, 3, 5-10, vengono elaborate le pagine da 1 a 10.

Il servizio accetta la richiesta se può elaborare almeno una pagina del documento. Ad esempio, l'uso 5-100 di in un documento a cinque pagine è un input valido che indica che viene elaborata la pagina 5.

Se non si specifica un intervallo di pagine, viene elaborato l'intero documento.

Sono disponibili sia Document Intelligence Studio che lo strumento di etichettatura di esempio FOTT. Quale è più indicato usare?

Nella maggior parte dei casi, è consigliabile Document Intelligence Studio perché può ridurre il tempo necessario per la configurazione delle risorse di Document Intelligence e dei servizi di archiviazione.

Prendere in considerazione l'uso dello strumento di test OCR (FOTT) del modulo per gli scenari seguenti:

  • I dati devono rimanere all'interno di un singolo computer. Usare lo strumento di etichettatura di esempio FOTT e un contenitore di Intelligence per i documenti.

  • Il progetto dipende fortemente da Document Intelligence v2.1 e si vuole continuare a usare le API v2.1.

Limiti e prezzi dei servizi

In che modo Azure calcola il prezzo per l'uso di Document Intelligence?

La fatturazione di Document Intelligence viene calcolata mensilmente in base al tipo di modello e al numero di pagine analizzate. Ecco alcuni dettagli:

  • Quando si invia un documento per l'analisi, il servizio analizza tutte le pagine a meno che non si specifichi un intervallo di pagine usando il pages parametro nella richiesta. Quando il servizio analizza i documenti di Microsoft Excel e PowerPoint tramite il modello di lettura, OCR o layout, conta ogni foglio di lavoro di Excel e diapositiva di PowerPoint come una pagina.

  • Quando il servizio analizza i file PDF e TIFF, conta ogni pagina nel file PDF o ogni immagine nel file TIFF come una pagina senza limiti massimi di caratteri.

  • Quando il servizio analizza i file HTML e Di Microsoft Word supportati dai modelli di lettura e layout, conta le pagine in blocchi di 3.000 caratteri ciascuno. Ad esempio, se il documento contiene 7.000 caratteri, le due pagine con 3.000 caratteri ciascuno e una pagina con 1.000 caratteri sommano fino a un totale di tre pagine.

  • Quando si usa il modello di lettura o layout per analizzare file Microsoft Word, Excel, PowerPoint e HTML, le immagini incorporate o collegate non sono supportate. Quindi il servizio non li conta come immagini aggiunte.

  • Il training di un modello personalizzato è sempre gratuito con Document Intelligence. L'addebito viene addebitato solo quando il servizio usa un modello per analizzare un documento.

  • I prezzi dei contenitori corrispondono ai prezzi dei servizi cloud.

  • Document Intelligence offre un livello gratuito (F0) in cui è possibile testare tutte le funzionalità di Intelligence per i documenti.

  • Document Intelligence ha un modello di determinazione dei prezzi basato sull'impegno per carichi di lavoro di grandi dimensioni.

Altre informazioni sulle opzioni dei prezzi di Document Intelligence per intelligenza artificiale di Azure.

Come è possibile controllare l'utilizzo di Document Intelligence e stimare il prezzo?

È possibile trovare le metriche di utilizzo nel dashboard delle metriche nel portale di Azure. Il dashboard visualizza il numero di pagine elaborate da Azure AI Document Intelligence. È possibile controllare il costo stimato speso per la risorsa usando il calcolatore prezzi di Azure. Per istruzioni dettagliate, vedere Controllare l'utilizzo e stimare i costi.

Quali sono le procedure consigliate per attenuare la limitazione delle richieste?

Intelligence per i documenti usa la scalabilità automatica per fornire le risorse di calcolo necessarie su richiesta, mantenendo al contempo bassi i costi dei clienti. Per ridurre la limitazione della limitazione durante la scalabilità automatica, è consigliabile adottare l'approccio seguente:

  • Implementare la logica di ripetizione dei tentativi nell'applicazione.

  • Se si ritiene di essere limitati al numero di POST richieste, è consigliabile aggiungere un ritardo tra le richieste.

  • Aumentare gradualmente il carico di lavoro. Evitare modifiche nitide.

  • Creare una richiesta di supporto per aumentare il limite di transazioni al secondo (TPS).

Altre informazioni sulle quote e sui limiti del servizio Document Intelligence.

Quanto tempo è necessario per analizzare un documento?

Il tempo necessario per analizzare un documento dipende dalle dimensioni (ad esempio, dal numero di pagine) e dal contenuto associato in ogni pagina.

Document Intelligence è un servizio multi-tenant in cui la latenza per documenti simili è paragonabile ma non sempre identica. La latenza è il tempo necessario per un server API per gestire ed elaborare una richiesta in ingresso e recapitare la risposta in uscita al client. La variabilità occasionale in latenza e prestazioni è intrinseca in qualsiasi servizio asincrono basato su microservizi, senza stato che elabora immagini e documenti di grandi dimensioni su larga scala.

Anche se si aumentano continuamente le funzionalità hardware e di capacità e scalabilità, è possibile che si verifichino ancora problemi di latenza in fase di esecuzione.

Modelli personalizzati

Ricerca per categorie assemblare i dati di training migliori?

Quando si usa il modello personalizzato di Document Intelligence, si forniscono dati di training personalizzati. Ecco alcuni suggerimenti per eseguire il training efficace dei modelli:

  • Usare pdf basati su testo anziché pdf basati su immagini, quando possibile. Un modo per identificare un PDF basato su immagini consiste nel provare a selezionare testo specifico nel documento. Se è possibile selezionare solo l'intera immagine del testo, il documento è basato su immagine, non basato su testo.

  • Organizzare i documenti di training usando una sottocartella per ogni formato (JPEG/JPG, PNG, BMP, PDF o TIFF).

  • Utilizzare moduli con tutti i campi disponibili completati.

  • Usare moduli con valori diversi in ogni campo.

  • Se le immagini sono di bassa qualità, usare un set di dati più grande (più di cinque documenti di training).

Altre informazioni sulla creazione di un set di dati di training.

Quali sono le procedure consigliate per il training di un modello personalizzato altamente accurato?

Il livello di accuratezza per il modello dipende dalla qualità dei materiali di training. Di seguito sono riportati alcuni suggerimenti:

  • Determinare se è necessario usare un singolo modello o più modelli composti in un singolo modello.

  • L'accuratezza del modello può diminuire quando si hanno formati diversi analizzati con un singolo modello. Pianificare la segmentazione del set di dati in cartelle, in cui ogni cartella è un modello univoco. Eseguire il training di un modello per cartella e comporre i modelli risultanti in un singolo endpoint.

  • I moduli personalizzati si basano su un modello di oggetto visivo coerente. Se il modulo presenta variazioni con formati e interruzioni di pagina, valutare la possibilità di segmentare il set di dati per eseguire il training di più modelli.

  • Assicurarsi di disporre di un set di dati bilanciato tenendo conto dei formati, dei tipi di documento e della struttura.

Altre informazioni sui modelli composti.

È possibile ripetere il training di un modello personalizzato?

Document Intelligence non dispone di un'operazione di ripetizione esplicita del training. Ogni operazione di training genera un nuovo modello.

Se si ritiene che il modello debba ripetere il training, aggiungere altri esempi al set di dati di training ed eseguire il training di un nuovo modello.

Quanti modelli personalizzati è possibile comporre in un singolo modello personalizzato?

Con l'operazione Model Compose è possibile assegnare fino a 200 modelli a un singolo ID modello. Quando si effettua la Analyze Document richiesta con un ID modello composto, Document Intelligence classifica il modulo inviato, sceglie il modello migliore e restituisce i risultati. Model Compose è attualmente disponibile solo per i modelli personalizzati sottoposti a training con etichette.

L'analisi di un documento tramite modelli composti è identica all'analisi di un documento tramite un singolo modello. Il Analyze Document risultato restituisce una docType proprietà che indica quale dei modelli di componenti selezionati per l'analisi del documento. Non sono state apportate modifiche ai prezzi per l'analisi di un documento usando un singolo modello personalizzato o un modello personalizzato composto.

Altre informazioni sui modelli composti.

Se il numero di modelli da comporre supera il limite massimo di un modello composto, quali sono le alternative?

È possibile usare una di queste alternative:

  • Classificare i documenti prima di chiamare il modello personalizzato. È possibile usare il modello di lettura e compilare una classificazione in base al testo estratto dai documenti e determinate frasi usando origini come codice, espressioni regolari o ricerca.

  • Se si vogliono estrarre gli stessi campi da vari documenti strutturati, semistrutturati e non strutturati, è consigliabile usare il modello neurale personalizzato di Deep Learning. Altre informazioni sulle differenze tra il modello di modello personalizzato e il modello neurale personalizzato.

Ricerca per categorie perfezionare un modello oltre il training iniziale?

Ogni operazione di training genera un nuovo modello.

  1. Creare un set di dati per il nuovo modello.

  2. Etichettare ed eseguire il training di un nuovo modello.

  3. Verificare che il nuovo modello funzioni correttamente per i tipi di documento specifici.

  4. Comporre il nuovo modello con il modello esistente in un singolo endpoint. Intelligence sui documenti può quindi determinare il modello migliore per ogni documento da analizzare.

Altre informazioni sui modelli composti.

Sto creando un modello personalizzato. Cosa restituisce l'etichetta di rilevamento della firma?

Il rilevamento delle firme cerca la presenza di una firma, non l'identità della persona che firma il documento.

Se il modello restituisce unsigned per il rilevamento delle firme, il modello non ha trovato una firma nel campo definito.

Quali sono le procedure consigliate per estrarre tabelle dai documenti e quali sono le procedure consigliate?

È possibile iniziare con il modello di layout di Document Intelligence per estrarre testi, tabelle, segni di selezione e informazioni sulla struttura da documenti e immagini. È anche possibile considerare i fattori seguenti:

  • I dati da estrarre vengono presentati come tabella e la struttura della tabella è significativa?

  • Se i dati non sono in formato tabella, i dati possono essere inseriti in una griglia bidimensionale?

  • Le tabelle si estendono su più pagine? In tal caso, per evitare di dover etichettare tutte le pagine, dividere il PDF in pagine prima di inviarlo a Document Intelligence. Dopo l'analisi, eseguire la post-elaborazione delle pagine in una singola tabella.

  • Se si creano modelli personalizzati, vedere Etichettatura come tabelle. Le tabelle dinamiche hanno un numero variabile di righe per ogni colonna. Le tabelle fisse hanno un numero costante di righe per ogni colonna.

Come è possibile spostare i modelli sottoposti a training da un ambiente (ad esempio beta) a un altro (ad esempio produzione)?

È possibile usare l'API Copia per copiare modelli personalizzati da un account di Document Intelligence in altri che esistono in qualsiasi area geografica supportata. Per istruzioni dettagliate, vedere Ripristino di emergenza.

L'operazione di copia è limitata alla copia di modelli all'interno dell'ambiente cloud specifico in cui è stato eseguito il training del modello. Ad esempio, la copia di modelli dal cloud pubblico al cloud Azure per enti pubblici non è supportata.

Perché è stato addebitato un costo per il layout durante l'esecuzione del training personalizzato?

Il layout è necessario per generare etichette per il set di dati. Se il set di dati usato per il training personalizzato non dispone di file di etichetta disponibili, il servizio li genera automaticamente.

Account di archiviazione

Sono riuscito ad accedere all'account di archiviazione qualche giorno fa. Perché si verificano problemi di riconnessione?

Quando si crea una firma di accesso condiviso, la durata predefinita è di 48 ore. Dopo 48 ore, è necessario creare un nuovo token.

Valutare la possibilità di impostare un periodo di durata più lungo per il tempo in cui si usa l'account di archiviazione con Document Intelligence.

Se l'account di archiviazione si trova dietro una rete virtuale o un firewall, come si concede l'accesso a Document Intelligence ai dati?

Se si dispone di un account di archiviazione di Azure protetto da una rete virtuale o da un firewall, Document Intelligence non può accedere direttamente all'account di archiviazione. Tuttavia, l'accesso e l'autenticazione dell'account di archiviazione di Azure privato supportano le identità gestite per le risorse di Azure. Quando si usa un'identità gestita, il servizio Document Intelligence può accedere all'account di archiviazione usando una credenziale assegnata.

Se si intende analizzare i dati dell'account di archiviazione privato usando FOTT, è necessario distribuire lo strumento dietro la rete virtuale o il firewall.

Informazioni su come creare e usare un'identità gestita per la risorsa di Document Intelligence.

Document Intelligence Studio

Quali autorizzazioni sono necessarie per accedere a Document Intelligence Studio?

Per accedere a Document Intelligence Studio, è necessario un account e una sottoscrizione di Azure attivi con almeno un ruolo lettore.

Per l'analisi dei documenti e i modelli predefiniti, ecco i requisiti dei ruoli per gli scenari utente:

  • Di base

  • Avanzato

    • Collaboratore: è necessario questo ruolo per creare un gruppo di risorse o una risorsa di Document Intelligence. Il ruolo Collaboratore non consente di elencare le chiavi per Servizi cognitivi. Per usare Document Intelligence Studio, è comunque necessario il ruolo Utente servizi cognitivi.

Per i progetti di modello personalizzati, ecco i requisiti dei ruoli per gli scenari utente:

  • Di base

    • Utente di Servizi cognitivi: questo ruolo è necessario per una risorsa servizi cognitivi o intelligence per documenti o servizi cognitivi per eseguire il training di un modello personalizzato o analizzare i modelli sottoposti a training.

    • Archiviazione Collaboratore ai dati BLOB: è necessario questo ruolo per un account di archiviazione per creare dati di progetto ed etichetta.

  • Avanzato

    • Archiviazione Collaboratore account: è necessario questo ruolo per l'account di archiviazione per configurare le impostazioni CORS (Cross-Origin Resource Sharing). Si tratta di un impegno monouso se si riutilizza lo stesso account di archiviazione.

      Il ruolo Collaboratore non consente di accedere ai dati nel BLOB. Per usare Document Intelligence Studio, è comunque necessario il ruolo Collaboratore dati BLOB Archiviazione.

    • Collaboratore: è necessario questo ruolo per creare un gruppo di risorse e risorse. Il ruolo Collaboratore non consente di accedere all'uso delle risorse o dell'archiviazione create. Per usare Document Intelligence Studio, sono ancora necessari ruoli di base.

Per altre informazioni, vedere Ruoli predefiniti di Microsoft Entra e le sezioni sulle assegnazioni di ruolo di Azure nell'argomento di avvio rapido di Document Intelligence Studio.

Ho più pagine in un documento. Perché vengono analizzate solo due pagine in Document Intelligence Studio?

Per le risorse di livello gratuito (F0), vengono analizzate solo le prime due pagine se si usa Document Intelligence Studio, l'API REST o gli SDK.

In Document Intelligence Studio selezionare il pulsante Impostazioni (ingranaggio), selezionare la scheda Risorse e controllare il piano tariffario usato per analizzare i documenti. Per analizzare tutte le pagine di un documento, passare a una risorsa a pagamento (S0).

Come è possibile modificare directory o sottoscrizioni in Document Intelligence Studio?

Per modificare una directory in Document Intelligence Studio, selezionare il pulsante Impostazioni (ingranaggio). In Directory selezionare la directory dall'elenco e quindi selezionare Cambia directory. Dopo aver cambiato la directory, viene richiesto di eseguire di nuovo l'accesso.

Per modificare una sottoscrizione o una risorsa, passare alla scheda Risorsa in Impostazioni.

Perché viene visualizzato un errore di archiviazione in un'operazione di condivisione del progetto, etichettatura automatica o aggiornamento OCR quando la risorsa dell'account di archiviazione è configurata con un firewall o una rete virtuale?

Perché viene visualizzato l'errore "Accesso negato a causa di Rete virtuale/regole del firewall" in un'operazione di etichettatura automatica o di aggiornamento OCR quando la risorsa di Intelligence documenti è configurata con un firewall o una rete virtuale?

È necessario aggiungere l'indirizzo IP dedicato 20.3.165.95 all'elenco di indirizzi consentiti del firewall per la risorsa di Document Intelligence.

È possibile riutilizzare o personalizzare l'esperienza di etichettatura da Document Intelligence Studio e compilarla nella propria applicazione?

Sì. L'esperienza di etichettatura di Document Intelligence Studio è open source nel repository Toolkit.

Perché viene visualizzato l'errore "Riconoscimento modulo Non trovato" all'apertura del progetto personalizzato?

La risorsa di Document Intelligence associata a questo progetto personalizzato è stata eliminata o spostata in un altro gruppo di risorse. Esistono due modi per risolvere questo problema:

  • Ricreare la risorsa di Document Intelligence nella stessa sottoscrizione e nello stesso gruppo di risorse con lo stesso nome.

  • Ricreare un progetto personalizzato con la risorsa Document Intelligence migrata e specificare lo stesso account di archiviazione.

Contenitori

È necessaria una connessione Internet per usare i contenitori di Document Intelligence?

Sì. I contenitori di Intelligence sui documenti richiedono la connettività Internet per inviare informazioni di fatturazione ad Azure. Altre informazioni sulla sicurezza dei contenitori di Azure.

Qual è la differenza tra contenitori disconnessi e connessi?

Connessione contenitori inviano informazioni di fatturazione ad Azure usando una risorsa di Document Intelligence nell'account Azure. Con i contenitori connessi, la connettività Internet è necessaria per inviare informazioni di fatturazione ad Azure.

I contenitori disconnessi consentono di usare le API disconnesse da Internet. Le informazioni di fatturazione non vengono inviate tramite Internet. Vengono invece addebitati i costi in base a un livello di impegno acquistato. Attualmente, l'utilizzo del contenitore disconnesso è disponibile per i modelli personalizzati e di fatture di Document Intelligence.

Le funzionalità del modello fornite nei contenitori connessi e disconnessi sono le stesse e sono supportate da Document Intelligence v2.1.

Quali dati inviano i contenitori connessi al cloud?

I contenitori connessi di Document Intelligence inviano informazioni di fatturazione ad Azure usando una risorsa di Document Intelligence nell'account Azure. Connessione contenitori non inviano dati dei clienti, ad esempio l'immagine o il testo da analizzare, a Microsoft.

Per un esempio delle informazioni inviate dai contenitori connessi a Microsoft per la fatturazione, vedere domande frequenti sul contenitore di Intelligenza artificiale di Azure.

Perché viene visualizzato l'errore "Il contenitore non è in uno stato valido. La convalida della sottoscrizione non è riuscita con lo stato "OutOfQuota" chiave API non quota"?

I contenitori connessi di Document Intelligence inviano informazioni di fatturazione ad Azure usando una risorsa di Document Intelligence nell'account Azure. È possibile ricevere questo messaggio se i contenitori non possono comunicare con l'endpoint di fatturazione.

È possibile usare l'archiviazione locale per il contenitore Document Intelligence Sample Labeling Tool (FOTT) ?

FOTT ha una versione che usa l'archiviazione locale. La versione deve essere installata in un computer Windows. È possibile installarlo da questo percorso.

Nella pagina del progetto specificare l'URI della cartella label come /shared o /shared/sub-dir se i file di etichettatura si trovano in una sottodirectory. Tutti gli altri comportamenti dello strumento di etichettatura di esempio di Document Intelligence corrispondono al servizio ospitato.

Qual è la procedura consigliata per aumentare le prestazioni?

Per le chiamate asincrone, è possibile eseguire più contenitori con archiviazione condivisa. Il contenitore che elabora la POST chiamata di analisi archivia l'output nella risorsa di archiviazione. Qualsiasi altro contenitore può quindi recuperare i risultati dalla risorsa di archiviazione e gestire le GET chiamate. L'ID richiesta non è associato a un contenitore.

Per le chiamate sincrone, è possibile eseguire più contenitori, ma solo un contenitore serve una richiesta. Poiché si tratta di una chiamata di blocco, qualsiasi contenitore del pool può gestire la richiesta e inviare la risposta. In questo caso, un solo contenitore è associato a una richiesta alla volta e non è necessario eseguire il polling.

Come è possibile configurare i contenitori con l'archiviazione condivisa?

I contenitori usano la proprietà durante l'avvio Mounts:Shared per specificare l'archiviazione condivisa per archiviare i file di elaborazione. Per visualizzare l'uso di questa proprietà, vedere la documentazione dei contenitori.

Sicurezza e privacy

Quali sono i metodi e i requisiti per l'autenticazione delle richieste ai servizi di intelligenza artificiale di Azure?

Ogni richiesta a un servizio di Azure deve includere un'intestazione di autenticazione. È possibile autenticare una richiesta usando diversi metodi:

Document Intelligence archivia i dati?

Per tutte le funzionalità, Document Intelligence archivia temporaneamente i dati e genera Archiviazione di Azure nella stessa area della richiesta. I dati vengono quindi eliminati entro 24 ore dal momento in cui si invia una richiesta di analisi.

Altre informazioni su dati, privacy e sicurezza per Document Intelligence.

Come vengono archiviati e usati i modelli personalizzati sottoposti a training in Document Intelligence?

Gli output provvisori dopo l'analisi e l'etichettatura vengono archiviati nella stessa posizione Archiviazione di Azure in cui si archiviano i dati di training. I modelli personalizzati sottoposti a training vengono archiviati in Archiviazione di Azure nella stessa area e sono isolati logicamente con le credenziali dell'API e della sottoscrizione di Azure.

Altre informazioni e supporto tecnico

Dove è possibile trovare altre soluzioni alle domande di Intelligence sui documenti di Intelligenza artificiale di Azure?

Microsoft Q&A è la casa per domande tecniche e risposte in Microsoft. È possibile filtrare le query specifiche di Document Intelligence.

Cosa devo fare se il servizio non riconosce testo specifico o lo riconosce in modo errato, quando si etichettano i documenti?

Il modello OCR di Document Intelligence viene aggiornato e migliorato continuamente. È possibile inviare un messaggio di posta elettronica al team di Document Intelligence. Se possibile, condividere un documento di esempio con il problema evidenziato.