Compartir a través de


Tutorial del reconocedor de texto

En este breve tutorial se explica la funcionalidad de reconocimiento de texto incluida en el ejemplo de windows AI Foundry para WinForms. En concreto, muestra cómo usar las API de Windows AI Foundry para realizar el reconocimiento de texto en una imagen y resumir el texto reconocido.

Prerrequisitos

Complete los pasos de la página Introducción para WinForms.

Introducción

La clase MainForm de MainForm.cs es la interfaz de usuario principal de la aplicación windows AI Foundry Sample e implementa la siguiente funcionalidad:

  • Seleccionar archivo: permite al usuario seleccionar un archivo de imagen en su sistema de archivos y mostrar esa imagen en un PictureBox.
  • Imagen de proceso: procesa la imagen seleccionada para extraer texto mediante reconocimiento óptico de caracteres (OCR) y, a continuación, resume el texto extraído.

Funciones clave y controladores de eventos

Algunas de las funciones y controladores de eventos más importantes del ejemplo de encontrador de IA de Windows para WinForms incluyen lo siguiente:

  • SelectFile_Click: abre un cuadro de diálogo de archivo para que el usuario seleccione un archivo de imagen y muestre la imagen seleccionada.
  • ProcessButton_Click: controla el procesamiento de la imagen seleccionada, incluida la carga de modelos de IA, la realización del reconocimiento de texto y el resumen del texto.
  • LoadAIModels: carga los modelos de IA necesarios (TextRecognizer y LanguageModel) para el reconocimiento y el resumen de texto.
  • PerformTextRecognition: usa TextRecognizer para realizar OCR en la imagen seleccionada y extrae el texto. Esta función se incluye en el siguiente ejemplo de reconocimiento de texto.
  • SummarizeImageText: Usa el modelo de lenguaje para generar un resumen del texto extraído a partir de una instrucción dada.

Ejemplo de reconocimiento de texto

La PerformTextRecognition función de este ejemplo

Imagen de entrada.

Aplicación de ejemplo inicializada.

private async Task<string> PerformTextRecognition()
{
    using TextRecognizer textRecognizer = await TextRecognizer.CreateAsync();
    ImageBuffer? imageBuffer = await LoadImageBufferFromFileAsync(pathToImage);

    if (imageBuffer == null)
    {
        throw new Exception("Failed to load image buffer.");
    }

    RecognizedText recognizedText = 
        textRecognizer!.RecognizeTextFromImage(imageBuffer);

    var recognizedTextLines = recognizedText.Lines.Select(line => line.Text);
    string text = string.Join(Environment.NewLine, recognizedTextLines);

    richTextBoxForImageText.Text = text;
    return text;
}

Aplicación de ejemplo después de capturar texto de imagen (mostrado en el cuadro inferior izquierdo) y resumir el texto de la imagen (que se muestra en el cuadro inferior derecho).

Compilar y ejecutar el ejemplo

  1. Clona el repositorio en tu Copilot+PC.
  2. Abra el archivo de solución WindowsCopilotRuntimeSample.sln en Visual Studio 2022.
  3. Cambie la Plataforma de soluciones para que coincida con la arquitectura de su PC de Copilot+.
  4. Haga clic con el botón derecho en la solución en el Explorador de soluciones y seleccione "Compilar" para compilar la solución.
  5. Una vez que la compilación se haya realizado correctamente, haga clic con el botón derecho en el proyecto en el Explorador de soluciones y seleccione "Establecer como proyecto de inicio".
  6. Presione F5 o seleccione "Iniciar depuración" en el menú Depurar para ejecutar el ejemplo. Nota: El ejemplo también se puede ejecutar sin depurar seleccionando "Iniciar sin depurar" en el menú Depurar o Ctrl+F5.

Consulte también