Attività iniziali di Vision Studio in Azure

Completato

Per usare il servizio Visione di Azure AI è necessario creare una risorsa nella propria sottoscrizione di Azure. È possibile usare uno dei tipi di risorse seguenti:

  • Visione di Azure AI: Una risorsa specifica per i servizi di visione. Usare questo tipo di risorsa se non si prevede di usare altri servizi di intelligenza artificiale o se si vuole tenere traccia separatamente dell'uso e dei costi della risorsa AI Vision.
  • Servizi di Azure AI: Una risorsa generale che include Visione di Azure AI insieme a molti altri servizi Azure AI come Lingua di Azure AI, Voce di Azure AI e altri. Usare questo tipo di risorsa se si prevede di usare più servizi di Azure AI e si vogliono semplificare l'amministrazione e lo sviluppo.

Dopo aver creato una risorsa, esistono diversi modi per usare l'API Lettura di Visione di Azure AI:

  • Vision Studio
  • REST API
  • SDK (Software Development Kit): Python, C#, JavaScript

Di seguito verrà esaminato Vision Studio.

Visione di Azure AI Studio

Visione di Azure AI Studio consente di accedere alle API di Visione artificiale di Azure tramite un'interfaccia utente grafica che non richiede la scrittura di codice per iniziare.

A screenshot showing the Vision Studio interface.

Quando si apre Vision Studio, è necessario selezionare la risorsa predefinita. La risorsa predefinita in Vision Studio deve essere una risorsa di servizi di Azure AI anziché una risorsa di Visione di Azure AI.

Nella home page di Vision Studio è possibile selezionare Riconoscimento ottico dei caratteri e il riquadro Estrarre testo dalle immagini per provare il motore OCR di lettura. La risorsa inizia a incorrere in costi di utilizzo quando viene usata per restituire i risultati. Se si usa un file proprio o un file di esempio, è possibile vedere come il motore OCR di lettura restituisce attributi rilevati. Tali attributi corrispondono a ciò che il computer rileva nei rettangoli di selezione.

A screenshot showing the detected attributes.

Dietro le quinte, l'immagine viene analizzata per individuarne le funzionalità, ad esempio persone, testo e oggetti, e contrassegnate da rettangoli delimitatori. Le informazioni rilevate vengono elaborate e i risultati vengono restituiti all'utente. I risultati non elaborati vengono restituiti in formato JSON e includono informazioni sulle posizioni del rettangolo delimitatore nella pagina e sul testo rilevato. Si tenga presente che Vision Studio può restituire esempi di riconoscimento ottico dei caratteri, ma per creare un'applicazione OCR personalizzata, è necessario usare un SDK o un'API REST.

A screenshot showing bounding boxes and the related json returned.