Informazioni sulla Visione artificiale

Il servizio Visione artificiale di Azure consente di accedere ad algoritmi avanzati che elaborano le immagini e restituiscono informazioni, in base alle caratteristiche visive a cui si è interessati.

Servizio Descrizione
Riconoscimento ottico dei caratteri (OCR) Il servizio OCR (Optical Character Recognition) estrae il testo dalle immagini. È possibile usare la nuova API Lettura per estrarre testo stampato e scritto a mano da foto e documenti. Usa modelli basati su deep learning e funziona con testo su diverse superfici e sfondi. Questi includono documenti aziendali, fatture, ricevute, poster, biglietti da visita, lettere e lavagna. Le API OCR supportano l'estrazione di testo stampato in diverse lingue. Per iniziare, seguire la guida introduttiva di OCR .
Analisi delle immagini Il servizio Analisi immagini estrae molte funzionalità visive da immagini, ad esempio oggetti, visi, contenuto adulto e descrizioni di testo generate automaticamente. Per iniziare, seguire la guida introduttiva Analisi immagini .
Viso Il servizio Viso fornisce algoritmi di intelligenza artificiale che rilevano, riconoscono e analizzano i visi umani nelle immagini. Il software di riconoscimento facciale è importante in molti scenari diversi, ad esempio la verifica dell'identità, il controllo degli accessi senza tocco e la sfocatura del viso per la privacy. Seguire la guida introduttiva Viso per iniziare.
Analisi spaziale Il servizio Analisi spaziale analizza la presenza e lo spostamento delle persone in un feed video e produce eventi a cui altri sistemi possono rispondere. Installare il contenitore Analisi spaziale per iniziare.

Visione artificiale per la gestione delle risorse digitali

Visione artificiale può ottimizzare molti scenari di gestione delle risorse digitali. La gestione delle risorse digitali è il processo aziendale per l'organizzazione, l'archiviazione e il recupero di risorse multimediali elaborate e per la gestione dei diritti e delle autorizzazioni digitali. Una società potrebbe ad esempio voler raggruppare e identificare le immagini in base a logo visibili, visi, oggetti, colori e così via. Oppure si potrebbe voler generare didascalie per le immagini automaticamente e allegare parole chiave in modo che siano disponibili per la ricerca. Per una soluzione di gestione delle risorse digitali all-in-one che usa Servizi cognitivi, Ricerca cognitiva di Azure e creazione di report intelligenti, vedere la guida su Solution Accelerator per Knowledge Mining in GitHub. Per altri esempi di gestione delle risorse digitali, vedere il repository Computer Vision Solution Templates (Modelli per la soluzione Visione artificiale).

Introduzione

Usare Vision Studio per provare rapidamente le funzionalità Visione artificiale nel Web browser.

Per iniziare a creare Visione artificiale nell'app, seguire una guida introduttiva.

Requisiti dell'immagine

Visione artificiale può analizzare immagini che rispettano i requisiti seguenti:

  • L'immagine deve essere presentata in formato JPEG, PNG, GIF o BMP
  • Le dimensioni del file dell'immagine devono essere minori di 4 megabyte (MB)
  • Le dimensioni dell'immagine devono essere superiori a 50 x 50 pixel
    • Per l'API di lettura (Read), le dimensioni dell'immagine devono essere comprese tra 50 x 50 e 10000 x 10000 pixel.

Sicurezza e privacy dei dati

Come con tutti i Servizi cognitivi, gli sviluppatori che usano il servizio Visione artificiale devono conoscere i criteri di Microsoft sui dati dei clienti. Per altre informazioni, vedere la pagina sui Servizi cognitivi nel Centro protezione di Microsoft.

Passaggi successivi

Seguire una guida introduttiva per implementare ed eseguire un servizio nel linguaggio di sviluppo preferito.