Modello di biglietto da visita di Document Intelligence
Importante
A partire da Document Intelligence v4.0 (anteprima) e in futuro, il modello di biglietto da visita (predefinito-businessCard) è deprecato. Per estrarre i dati dai formati di biglietti da visita, usare quanto segue:
Funzionalità | versione | Model ID |
---|---|---|
Modello di biglietto da visita | • v3.1:2023-07-31 (GA) • v3.0:2022-08-31 (GA) • v2.1 (GA) |
prebuilt-businessCard |
Questo contenuto si applica a:v3.0 (GA) | Versioni più recenti:v4.0 (anteprima)v3.1 | Versione precedente:v2.1
Questo contenuto si applica a:v2.1 | Versione più recente:v4.0 (anteprima)
Il modello di biglietto da visita di Document Intelligence combina potenti funzionalità di riconoscimento ottico dei caratteri (OCR) con modelli di Deep Learning per analizzare ed estrarre dati da immagini di biglietti da visita. L'API analizza i biglietti da visita stampati; estrae informazioni sulla chiave, ad esempio nome, cognome, nome della società, indirizzo di posta elettronica e numero di telefono; e restituisce una rappresentazione di dati JSON strutturata.
Estrazione dati biglietti da visita
I biglietti da visita sono un ottimo modo per rappresentare un'azienda o un professionista. Il logo aziendale, i tipi di carattere e le immagini di sfondo trovati nei biglietti da visita aiutano a promuovere la personalizzazione dell'azienda e a differenziarla dagli altri. L'applicazione di tecniche basate su OCR e Machine Learning per automatizzare l'analisi dei biglietti da visita è uno scenario comune di elaborazione delle immagini. I sistemi aziendali usati dai team di vendita e marketing in genere dispongono di funzionalità di estrazione dati biglietti da visita in per il vantaggio dei loro utenti.
Biglietto da visita di esempio elaborato con Document Intelligence Studio
Esempio di business elaborato con lo strumento di etichettatura di esempio di Document Intelligence
Opzioni di sviluppo
Document Intelligence v3.1:2023-07-31 (GA) supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse | Model ID |
---|---|---|
Modello di biglietto da visita | • Document Intelligence Studio • API REST • SDK C# • Python SDK • Java SDK • JavaScript SDK |
precompilt-businessCard |
Document Intelligence v3.0:2022-08-31 (GA) supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse | Model ID |
---|---|---|
Modello di biglietto da visita | • Document Intelligence Studio • API REST • SDK C# • Python SDK • Java SDK • JavaScript SDK |
precompilt-businessCard |
Document Intelligence v2.1 (GA) supporta gli strumenti, le applicazioni e le librerie seguenti:
Funzionalità | Risorse |
---|---|
Modello di biglietto da visita | • Strumento di etichettatura di Document Intelligence • API REST • SDK della libreria client • Contenitore Docker di Document Intelligence |
Provare l'estrazione dei dati dei biglietti da visita
Scopri in che modo i dati, tra cui nome, titolo del processo, indirizzo, posta elettronica e nome della società, vengono estratti dai biglietti da visita. Sono necessarie le risorse seguenti:
Una sottoscrizione di Azure: è possibile crearne una gratuitamente
Istanza di Document Intelligence nel portale di Azure. Per provare il servizio, è possibile usare il piano tariffario gratuito (
F0
). Dopo la distribuzione della risorsa, selezionare Vai alla risorsa per ottenere la chiave e l'endpoint.
Document Intelligence Studio
Nota
Document Intelligence Studio è disponibile con le API v3.1 e v3.0.
Nella home page di Document Intelligence Studio selezionare Biglietti da visita.
È possibile analizzare il biglietto da visita di esempio o caricare i propri file.
Selezionare il pulsante Esegui analisi e, se necessario, configurare le opzioni Analizza :
Strumento di etichettatura di esempio di Document Intelligence
Passare allo strumento di esempio di intelligence per i documenti.
Nella home page dello strumento di esempio selezionare il riquadro Usa modello predefinito per ottenere i dati .
Selezionare il tipo di modulo da analizzare dal menu a discesa.
Scegliere un URL per il file da analizzare dalle opzioni seguenti:
- Documento di fattura di esempio.
- Documento ID di esempio.
- Immagine della ricevuta di esempio.
- Immagine del biglietto da visita di esempio.
Nel campo Origine selezionare URL dal menu a discesa, incollare l'URL selezionato e selezionare il pulsante Recupera.
Nel campo Document Intelligence Service Endpoint (Endpoint servizio Document Intelligence) incollare l'endpoint ottenuto con la sottoscrizione di Document Intelligence.
Nel campo chiave incollare la chiave ottenuta dalla risorsa di Intelligence documenti.
Selezionare Esegui analisi. Lo strumento di etichettatura di esempio di Analisi intelligence dei documenti chiama l'API predefinita Analizza e analizza il documento.
Visualizzare i risultati: vedere le coppie chiave-valore estratte, voci, testo evidenziato estratto e tabelle rilevate.
Nota
Lo strumento di etichettatura di esempio non supporta il formato di file BMP. Si tratta di una limitazione dello strumento non del servizio Di intelligence dei documenti.
Requisiti di input
Per ottenere risultati ottimali, fornire una foto chiara o un'analisi di alta qualità per ogni documento.
Formati di file supportati:
Modello PDF Immagine:
JPEG/JPG, PNG, BMP, TIFF, HEIFMicrosoft Office:
Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e HTMLLettura ✔ ✔ ✔ Layout ✔ ✔ ✔ (2024-02-29-preview, 2023-10-31-preview) Documento generale ✔ ✔ Predefinito ✔ ✔ Estrazione personalizzata ✔ ✔ Classificazione personalizzata ✔ ✔ ✔ (2024-02-29-preview) Per PDF e TIFF, è possibile elaborare fino a 2000 pagine (con una sottoscrizione di livello gratuito, vengono elaborate solo le prime due pagine).
Le dimensioni del file per l'analisi dei documenti sono di 500 MB per il livello a pagamento (S0) e 4 MB per il livello gratuito (F0).
Le dimensioni dell'immagine devono essere comprese tra 50 x 50 pixel e 10.000 px x 10.000 pixel.
Se i file PDF sono bloccati da password, è necessario rimuovere il blocco prima dell'invio.
L'altezza minima del testo da estrarre è di 12 pixel per un'immagine da 1024 x 768 pixel. Questa dimensione corrisponde a circa
8
-point text a 150 punti per pollice (DPI).Per il training di modelli personalizzati, il numero massimo di pagine per i dati di training è 500 per il modello di modello personalizzato e 50.000 per il modello neurale personalizzato.
Per il training del modello di estrazione personalizzato, le dimensioni totali dei dati di training sono di 50 MB per il modello di modello e 1G-MB per il modello neurale.
Per il training del modello di classificazione personalizzato, le dimensioni totali dei dati di training sono
1GB
pari a un massimo di 10.000 pagine.
- Formati di file supportati: JPEG, PNG, PDF e TIFF
- Per PDF e TIFF, vengono elaborate fino a 2000 pagine. Per i sottoscrittori del livello gratuito, vengono elaborate solo le prime due pagine.
- Le dimensioni del file devono essere inferiori a 50 MB e dimensioni almeno 50 x 50 pixel e al massimo 10.000 x 10.000 pixel.
Lingue e impostazioni locali supportate
Per un elenco completo delle lingue supportate, vedere la pagina Supporto lingua .
Estrazione dei campi
Nome | Tipo | Descrizione | Output standardizzato |
---|---|---|---|
ContactNames | Matrice di oggetti | Nome contatto | |
Nome | String | Nome (dato) del contatto | |
Cognome | String | Cognome (famiglia) del contatto | |
CompanyNames | Matrice di stringhe | Nomi della società | |
Reparti | Matrice di stringhe | Reparti o organizzazioni di contatto | |
JobTitles | Matrice di stringhe | Titoli di lavoro elencati del contatto | |
Messaggi e-mail | Matrice di stringhe | Indirizzo di posta elettronica di contatto | |
Siti Web | Matrice di stringhe | Siti Web aziendali | |
Indirizzi | Matrice di stringhe | Indirizzo (es) estratto dal biglietto da visita | |
MobilePhones | Matrice di numeri di telefono | Numeri di telefono cellulare da biglietto da visita | +1 xxx xxx xxx xxxx |
Fax | Matrice di numeri di telefono | Numeri di telefono fax da biglietto da visita | +1 xxx xxx xxx xxxx |
WorkPhones | Matrice di numeri di telefono | Numeri di telefono di lavoro da biglietto da visita | +1 xxx xxx xxx xxxx |
OtherPhones | Matrice di numeri di telefono | Altri numeri di telefono da biglietto da visita | +1 xxx xxx xxx xxxx |
Campi estratti
Nome | Tipo | Descrizione | Testo |
---|---|---|---|
ContactNames | matrice di oggetti | Nome contatto estratto dal biglietto da visita | [{ "FirstName": "John", "LastName": "Doe" }] |
Nome | string | Nome (dato) del contatto | "John" |
Cognome | string | Cognome (famiglia) del contatto | "Doe" |
CompanyNames | matrice di stringhe | Nome della società estratto dal biglietto da visita | ["Contoso"] |
Reparti | matrice di stringhe | Reparto o organizzazione del contatto | ["R&D"] |
JobTitles | matrice di stringhe | Titolo del processo elencato del contatto | ["Software Engineer"] |
Messaggi e-mail | matrice di stringhe | Indirizzo di posta elettronica di contatto estratto dal biglietto da visita | [""johndoe@contoso.com] |
Siti Web | matrice di stringhe | Sito Web estratto dal biglietto da visita | ["https://www.contoso.com"] |
Indirizzi | matrice di stringhe | Indirizzo estratto dal biglietto da visita | ["123 Main Street, Redmond, WA 98052"] |
MobilePhones | matrice di numeri di telefono | Numero di telefono cellulare estratto dal biglietto da visita | ["+19876543210"] |
Fax | matrice di numeri di telefono | Numero di telefono fax estratto dal biglietto da visita | ["+19876543211"] |
WorkPhones | matrice di numeri di telefono | Numero di telefono di lavoro estratto dal biglietto da visita | ["+19876543231"] |
OtherPhones | matrice di numeri di telefono | Altro numero di telefono estratto dal biglietto da visita | ["+19876543233"] |
Impostazioni locali supportate
I biglietti da visita predefiniti v2.1 supportano le impostazioni locali seguenti:
- en-us
- en-au
- en-ca
- en-gb
- en-in
Guida alla migrazione e API REST v3.1
Passaggi successivi
Provare a elaborare moduli e documenti personalizzati con Document Intelligence Studio
Completare una guida introduttiva di Intelligence sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.
Provare a elaborare moduli e documenti personalizzati con lo strumento di etichettatura di esempio di Document Intelligence
Completare una guida introduttiva di Intelligence sui documenti e iniziare a creare un'app per l'elaborazione di documenti nel linguaggio di sviluppo preferito.