Condividi tramite


Informazioni di riferimento per le API Riconoscimento del testo in Windows App SDK

Informazioni sulle nuove API di riconoscimento del testo di intelligenza artificiale (AI) che verranno fornite con il SDK per app di Windows e possono essere usate per identificare i caratteri in un'immagine, riconoscere parole, linee, limiti poligonali e fornire livelli di attendibilità per le corrispondenze generate.

Per altri dettagli, vedere Riconoscimento del testo nella SDK per app di Windows.

Importante

Il canale sperimentale SDK per app di Windows include API e funzionalità nelle fasi iniziali dello sviluppo. Tutte le API nel canale sperimentale sono soggette a revisioni estese e modifiche di rilievo e possono essere rimosse dalle versioni successive in qualsiasi momento. Non sono supportate per l'uso in ambienti di produzione e le app che usano funzionalità sperimentali non possono essere pubblicate in Microsoft Store.


Spazio dei nomi Microsoft.Windows.Vision

Fornisce API per i modelli di Machine Learning che analizzano il contenuto testuale delle immagini.

Struct Microsoft.Windows.Vision.TextRecognition.BoundingBox

public struct BoundingBox

Poligono con 4 punti utilizzati per il limite di parole e righe di testo riconosciute.

Campi

BottomLeft

Angolo inferiore sinistro del rettangolo di selezione.

BottomRight

Angolo inferiore destro del rettangolo di selezione.

TopLeft

Punto superiore sinistro del rettangolo di selezione.

TopRight

Punto superiore destro del rettangolo di selezione.

Osservazioni:

Quando viene restituito come limite per una parola o una riga, i punti TopLeft, TopRight, BottomRight e BottomLeft sono relativi alla rotazione e all'asimmetria del testo riconosciuto nell'immagine. Il diagramma seguente mostra il layout dei punti per diverse rotazioni di testo in cui 0 è TopLeft, 1 è TopRight, 2 è BottomRight e 3 è BottomLeft, tutto relativo al testo.

Diagramma di tre esempi di rettangolo delimitatore che illustrano il modo in cui i punti dell'angolo vengono identificati in base alla rotazione del testo.

Enumerazione Microsoft.Windows.Vision.DetectedLineStyle

public enum DetectedLineStyle

Specifica gli stili di linea che possono essere riconosciuti.

Campi enumerazione

Scritto a mano: 0

La riga di testo viene scritta a mano.

Altro: 1

La riga di testo non viene scritta a mano.

Enumerazione Microsoft.Windows.Vision.OrientationDetectionOptions

public enum OrientationDetectionOptions

Specifica gli orientamenti di testo che possono essere riconosciuti.

Campi enumerazione

Nessuno: 0

L'orientamento non viene riconosciuto.

DetectOrientation: 1

L'orientamento viene riconosciuto.

Classe Microsoft.Windows.Vision.RecognizedLine

public sealed class RecognizedLine

Rappresenta una singola riga di testo riconosciuto.

Proprietà Microsoft.Windows.Vision.RecognizedLine.Style

public Microsoft.Windows.Vision.RecognizedLineStyle Style { get; }

Ottiene lo stile della linea riconosciuto.

Valore proprietà

lo stile della linea riconosciuto.

Osservazioni:

Indica se la riga di testo è stata scritta a mano o meno e il livello di attendibilità del riconoscimento.

Proprietà Microsoft.Windows.Vision.RecognizedLine.Text

public string Text { get; }

Ottiene il testo della riga riconosciuta.

Valore proprietà

Testo della riga riconosciuta.

Osservazioni:

Tutte le parole concatenate con spazi.

Proprietà Microsoft.Windows.Vision.RecognizedLine.Words

public Microsoft.Windows.Vision.RecognizedWord[] Words { get; }

Parole nella riga riconosciuta.

Valore proprietà

Parole nella riga riconosciuta.

Struct Microsoft.Windows.Vision.RecognizedLineStyle

public struct RecognizedLineStyle

Rappresenta lo stile della linea riconosciuta.

Campi Struct

Attendibilità

Livello di attendibilità del riconoscimento dello stile della linea.

Nome

Nome dello stile della linea.

Classe Microsoft.Windows.Vision.RecognizedText

public sealed class RecognizedText

Rappresenta il risultato di un'operazione di riconoscimento da immagine a testo.

Proprietà Microsoft.Windows.Vision.RecognizedText.ImageAngle

public float ImageAngle { get; }

Ottiene l'angolo rotazionale in senso orario del testo riconosciuto in gradi.

Valore proprietà

Angolo rotazionale in senso orario del testo riconosciuto in gradi.

Proprietà Microsoft.Windows.Vision.RecognizedText.Lines

public Microsoft.Windows.Vision.RecognizedLine[] Lines { get; }

Ottiene la raccolta di righe riconosciute.

Valore proprietà

Raccolta di righe riconosciute.

Classe Microsoft.Windows.Vision.RecognizedWord

public sealed class RecognizedWord

Rappresenta una singola parola riconosciuta.

Proprietà Microsoft.Windows.Vision.RecognizedWord.BoundingBox

public Microsoft.Windows.Vision.BoundingBox BoundingBox { get; }

Ottiene il limite quadrilatero della parola riconosciuta.

Valore proprietà

Limite quadrilatero della parola riconosciuta. TopLeft è relativo alla rotazione della parola.

Proprietà Microsoft.Windows.Vision.RecognizedWord.Confidence

public float Confidence { get; }

Ottiene la probabilità che questa parola sia stata riconosciuta correttamente.

Valore proprietà

Wow probabilmente questa parola è stata riconosciuta correttamente. Il valore è compreso tra 0,0 e 1,0 inclusi.

Proprietà Microsoft.Windows.Vision.RecognizedWord.Text

public string Text { get; }

Ottiene il testo della parola riconosciuta.

Valore proprietà

Testo della parola riconosciuta.

Classe Microsoft.Windows.Vision.TextRecognition.TextRecognizer

public sealed class TextRecognizer : System.IDisposable

Riconosce parole e linee e i relativi limiti quadrilateri in un'immagine di origine.

Metodo Microsoft.Windows.Vision.TextRecognizer.Close

Elimina l'oggetto e le risorse associate.

Osservazioni:

Non implementato in C#.

Metodo Microsoft.Windows.Vision.TextRecognizer.CreateAsync

public static Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.TextRecognizer> CreateAsync ();

Crea in modo asincrono una nuova istanza della classe TextRecognizer.

Valori restituiti

Nuova istanza della classe TextRecognizer.

Verrà restituito un errore se GetModelReadyStatus non è Pronto.

Metodo Microsoft.Windows.Vision.TextRecognizer.IsAvailable

public static bool IsAvailable ();

Recupera un valore che indica se il modello linguistico sottostante è installato.

Valori restituiti

True se il modello linguistico sottostante è installato. In caso contrario, false.

Metodo Microsoft.Windows.Vision.TextRecognizer.MakeAvailableAsync

public static Windows.Foundation.IAsyncOperationWithProgress<Microsoft.Windows.Management.Deployment.PackageDeploymentResult, 
Microsoft.Windows.Management.Deployment.PackageDeploymentProgress> MakeAvailableAsync ();

Assicura che il modello linguistico sottostante sia installato e disponibile per l'uso.

Valori restituiti

Azione asincrona con stato che restituisce un oggetto PackageDeploymentResult al completamento.

Metodo Microsoft.Windows.Vision.TextRecognizer.RecognizeTextFromImage(Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)

public Microsoft.Windows.Vision.RecognizedText RecognizeTextFromImage (Microsoft.Windows.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

Riconoscere il testo nell'immagine specificata.

Parametri
imageBuffer

Bitmap non compressa.

opzioni

Opzioni per la configurazione del modello di riconoscimento del testo per TextRecognizer.

Valori restituiti

Testo riconosciuto.

Metodo Microsoft.Windows.Vision.TextRecognizer.RecognizeTextFromImageAsync(Microsoft.Windows.Imaging.ImageBuffer, Microsoft.Windows.Vision.TextRecognizerOptions)

public Windows.Foundation.IAsyncOperation<Microsoft.Windows.Vision.RecognizedText> RecognizeTextFromImageAsync (Microsoft.Windows.Imaging.ImageBuffer imageBuffer, 
Microsoft.Windows.Vision.TextRecognizerOptions options);

Riconoscere in modo asincrono il testo nell'immagine fornita.

Parametri
imageBuffer

Bitmap non compressa.

opzioni

Opzioni per la configurazione del modello di riconoscimento del testo per TextRecognizer.

Valori restituiti

Testo riconosciuto.

Classe Microsoft.Windows.Vision.TextRecognizerOptions

public sealed class TextRecognizerOptions

Fornisce opzioni per configurare il modello di riconoscimento del testo per un textRecognizer.

Proprietà Microsoft.Windows.Vision.TextRecognizerOptions.MaxAnalysisSize

public Windows.Graphics.SizeInt32 MaxAnalysisSize { get; set; }

Ottiene o imposta la dimensione massima dell'immagine.

Valore proprietà

Dimensioni massime dell'immagine. Il valore predefinito è 1152 larghezza e 768 altezza.

Osservazioni:

Questa dimensione è un suggerimento e potrebbe non essere sempre rispettata.

Se l'immagine di origine è maggiore delle dimensioni massime, verrà automaticamente ridimensionata fino ai limiti superiori.

Proprietà Microsoft.Windows.Vision.TextRecognizerOptions.MaxLineCount

public uint MaxLineCount { get; set; }

Ottiene o imposta il numero massimo di righe da restituire dall'operazione di riconoscimento.

Valore proprietà

Numero massimo di righe da restituire dall'operazione di riconoscimento.

Osservazioni:

Il valore predefinito è MaxLineCountSupported. Se specificato, le righe massime restituite saranno minori di questo valore e MaxLineCountSupported.

Proprietà Microsoft.Windows.Vision.TextRecognizerOptions.OrientationDetection

public Microsoft.Windows.Vision.OrientationDetectionOptions OrientationDetection { get; set; }

Ottiene o imposta un valore che indica se rilevare l'orientamento del testo.

Valore proprietà

Indica se rilevare l'orientamento del testo. Il valore predefinito è Nessuno.

Costruttore Microsoft.Windows.Vision.TextRecognizerOptions.#ctor

public TextRecognizerOptions ();

Inizializza una nuova istanza della classe TextRecognizerOptions.


Spazio dei nomi Microsoft.Windows.Imaging

Fornisce API per i modelli di Machine Learning che modificano le immagini.

Classe Microsoft.Windows.Imaging.ImageBuffer

public sealed class ImageBuffer : System.IDisposable

Rappresenta una bitmap non compressa per un marshalling tra processi efficiente.

Osservazioni:

ImageBuffer può essere usato con le API del modello di intelligenza artificiale, ad esempio TextRecognizer che richiedono dati di immagine. L'utilizzo tipico comporta la creazione di un oggetto ImageBuffer da un softwareBitmap esistente.

Proprietà Microsoft.Windows.Imaging.ImageBuffer.Buffer

public Windows.Storage.Streams.IBuffer Buffer { get; }

Ottiene il buffer di immagini corrente.

Valore proprietà

Buffer dell'immagine corrente.

Proprietà Microsoft.Windows.Imaging.ImageBuffer.BufferLength

public uint BufferLength { get; }

Ottiene la lunghezza del buffer di immagini.

Valore proprietà

Lunghezza del buffer dell'immagine.

Metodo Microsoft.Windows.Imaging.ImageBuffer.Close

Elimina l'oggetto e le risorse associate.

Osservazioni:

Non implementato in C#.

Metodo Microsoft.Windows.Imaging.ImageBuffer.CopyToBuffer(System.Byte[])

public void CopyToBuffer (byte[] values);

Copia il buffer corrente nel buffer di destinazione specificato.

Parametri
valori

Vettore di byte nel buffer.

Metodo Microsoft.Windows.Imaging.ImageBuffer.CreateBufferAttachedToBitmap(Windows.Graphics.Imaging.SoftwareBitmap)

public static Microsoft.Windows.Imaging.ImageBuffer CreateBufferAttachedToBitmap (Windows.Graphics.Imaging.SoftwareBitmap softwareBitmap);

Creare un nuovo oggetto ImageBuffer da un oggetto SotftwareBitmap esistente ottenendo un oggetto IMemoryBufferReference dall'oggetto bitmap.

Parametri
softwareBitmap

SotftwareBitmap da cui creare ImageBuffer.

Valori restituiti

ImageBuffer o Null se è un formato non supportato.

Osservazioni:

SoftwareBitmap viene bloccato fino al completamento dell'operazione asincrona e il nuovo ImageBuffer viene eliminato definitivamente.

Metodo Microsoft.Windows.Imaging.ImageBuffer.CreateCopyFromBitmap(Windows.Graphics.Imaging.SoftwareBitmap)

public static Microsoft.Windows.Imaging.ImageBuffer CreateCopyFromBitmap (Windows.Graphics.Imaging.SoftwareBitmap softwareBitmap);

Creare un nuovo oggetto ImageBuffer da un oggetto SotftwareBitmap esistente copiando i dati bitmap sottostanti.

Parametri
softwareBitmap

SotftwareBitmap da cui creare ImageBuffer.

Valori restituiti

ImageBuffer o Null se è un formato non supportato.

Osservazioni:

SoftwareBitmap viene bloccato fino al completamento dell'operazione asincrona e il nuovo ImageBuffer viene eliminato definitivamente.

Metodo Microsoft.Windows.Imaging.ImageBuffer.CreateSoftwareBitmap

public Windows.Graphics.Imaging.SoftwareBitmap CreateSoftwareBitmap ();

Creare un nuovo SoftwareBitmap di tipo pixel BGRA32 dai dati pixel archiviati in un oggetto ImageBuffer.

Valori restituiti

Nuovo SoftwareBitmap di tipo pixel BGRA32.

Proprietà Microsoft.Windows.Imaging.ImageBuffer.Height

public uint Height { get; }

Ottiene l'altezza dell'immagine, in pixel.

Valore proprietà

Altezza dell'immagine, in pixel.

Costruttore Microsoft.Windows.Imaging.ImageBuffer.#ctor(Windows.Storage.Streams.IBuffer, Microsoft.Windows.Imaging.PixelFormat, System.UInt32, System.UInt32)

public ImageBuffer (Windows.Storage.Streams.IBuffer buffer, 
Microsoft.Windows.Imaging.PixelFormat pixelFormat, uint width, uint height);

Inizializza una nuova istanza della classe ImageBuffer.

Parametri
buffer

The ImageBuffer.

pixelFormat

Formato pixel dell'immagine.

width

Larghezza dell'immagine, in pixel.

height

Altezza dell'immagine, in pixel.

Proprietà Microsoft.Windows.Imaging.ImageBuffer.PixelFormat

public Microsoft.Windows.Imaging.PixelFormat PixelFormat { get; }

Ottiene il formato pixel dell'immagine.

Valore proprietà

Formato pixel dell'immagine.

Proprietà Microsoft.Windows.Imaging.ImageBuffer.Width

public uint Width { get; }

Ottiene la larghezza dell'immagine, espressa in pixel.

Valore proprietà

Larghezza dell'immagine, in pixel.

Enumerazione Microsoft.Windows.Imaging.PixelFormat

public enum PixelFormat

Specifica i tipi di layout binari per i dati bitmap sottostanti.

Campi enumerazione

Non definito: 0

Il formato binario non è definito.

Rgb24: 1

Il formato binario è di 24 bit per pixel; 8 bit ciascuno vengono usati per i componenti rosso, verde e blu.

Argb32: 2

Formato binario a 32 bit per pixel; 8 bit ciascuno viene usato per i componenti alfa, rosso, verde e blu.

Rgba32: 3

Il formato binario è di 32 bit per pixel; 8 bit ciascuno viene usato per i componenti rosso, verde, blu e alfa. I componenti di colore vengono archiviati in ordine rosso, verde, blu e alfa.

Bgra32: 4

Il formato binario è di 32 bit per pixel; 8 bit ciascuno viene usato per i componenti blu, verde, rosso e alfa. I componenti di colore vengono archiviati in ordine blu, verde, rosso e alfa.

Grigio8: 5

Il formato binario è di 16 bit per pixel. Le informazioni sul colore specificano 65536 sfumature di grigio.