Rychlý start: Obecná dostupnost Azure AI Vision v3.2

Edice OCR (Read)

Důležité

Vyberte edici Read, která nejlépe vyhovuje vašim požadavkům.

Vstup Příklady Číst edici Výhoda
Obrázky: Obecné, in-the-wild images štítky, dopravní značky a plakáty OCR pro image (verze 4.0) Optimalizované pro obecné nedokumentované obrázky s využitím synchronního rozhraní API s vylepšeným výkonem, které usnadňuje vkládání OCR ve scénářích uživatelského prostředí.
Dokumenty: Digitální a naskenované, včetně obrázků knihy, články a sestavy Model čtení funkce Document Intelligence Optimalizované pro naskenované a digitální dokumenty náročné na text s asynchronním rozhraním API, které pomáhá automatizovat inteligentní zpracování dokumentů ve velkém měřítku.

Informace o azure AI Vision verze 3.2 – obecná dostupnost

Hledáte nejnovější verzi Ga služby Azure AI Vision verze 3.2? Všechna budoucí vylepšení OCR pro čtení jsou součástí dvou dříve uvedených služeb. Ve službě Azure AI Vision verze 3.2 nejsou žádné další aktualizace. Další informace najdete v tématu Volání rozhraní AZURE AI Vision 3.2 GA Read API a rychlého startu: Azure AI Vision v3.2 GA Read.

Začínáme s rozhraním REST API služby Azure AI Vision nebo klientskými knihovnami. Rozhraní API pro čtení poskytuje algoritmy AI pro extrakci textu z obrázků a jejich vrácení jako strukturovaných řetězců. Tímto postupem nainstalujete balíček do aplikace a vyzkoušíte ukázkový kód pro základní úlohy.

Ke čtení tištěného a rukou psaného textu z obrázku použijte klientskou knihovnu optického rozpoznávání znaků (OCR). Služba OCR může číst viditelný text na obrázku a převést ho na datový proud znaků. Další informace o rozpoznávání textu najdete v přehledu OCR. Kód v této části používá nejnovější balíček Azure AI Vision .

Tip

Můžete také extrahovat text z místního obrázku. Podívejte se na metody ComputerVisionClient , například ReadInStreamAsync. Nebo se podívejte na ukázkový kód na GitHubu pro scénáře zahrnující místní image.

Referenční dokumentace | – ukázky balíčku zdrojového kódu | knihovny (NuGet) |

Požadavky

  • Předplatné Azure – Vytvořte si ho zdarma.

  • Integrované vývojové prostředí sady Visual Studio nebo aktuální verze .NET Core.

  • Prostředek Azure AI Vision. K vyzkoušení služby můžete použít cenovou úroveňF0 Free a později upgradovat na placenou úroveň pro produkční prostředí.

  • Klíč a koncový bod z prostředku, který vytvoříte pro připojení aplikace ke službě Azure AI Vision.

    1. Po nasazení prostředku Azure Vision vyberte Přejít k prostředku.
    2. V levé navigační nabídce vyberte Klíče a koncový bod.
    3. Zkopírujte jeden z klíčů a koncový bod pro pozdější použití v rychlém startu.

Vytvoření proměnných prostředí

V tomto příkladu zapište své přihlašovací údaje do proměnných prostředí na místním počítači, na kterém běží aplikace.

Přejděte na Azure Portal. Pokud se prostředek, který jste vytvořili v části Požadavky, úspěšně nasadil, vyberte v části Další kroky přejít k prostředku. Klíč a koncový bod najdete v části Správa prostředků na stránce Klíče a koncový bod. Váš klíč prostředku není stejný jako ID předplatného Azure.

Tip

Nezahrňte klíč přímo do kódu a nikdy ho nesdělujte veřejně. Další možnosti ověřování, jako je Azure Key Vault, najdete v článku zabezpečení služeb Azure AI.

Pokud chcete nastavit proměnnou prostředí pro klíč a koncový bod, otevřete okno konzoly a postupujte podle pokynů pro operační systém a vývojové prostředí.

  1. Pokud chcete nastavit proměnnou VISION_KEY prostředí, nahraďte your-key jedním z klíčů pro váš prostředek.
  2. Pokud chcete nastavit proměnnou VISION_ENDPOINT prostředí, nahraďte your-endpoint koncovým bodem vašeho prostředku.
setx VISION_KEY your-key
setx VISION_ENDPOINT your-endpoint

Po přidání proměnných prostředí budete možná muset restartovat všechny spuštěné programy, které budou číst proměnné prostředí, včetně okna konzoly.

Čtení tištěného a rukou psaného textu

  1. Vytvořte novou aplikaci jazyka C#.

    Pomocí sady Visual Studio vytvořte projekt konzolové aplikace (.NET Framework) pro C#, Windows a konzolu.

    Po vytvoření nového projektu nainstalujte klientskou knihovnu:

    1. Klikněte pravým tlačítkem na řešení projektu v Průzkumník řešení a vyberte Spravovat balíčky NuGet pro řešení.
    2. Ve správci balíčků, který se otevře, vyberte Procházet. Vyberte Zahrnout předběžné verze.
    3. Vyhledejte a vyberte Microsoft.Azure.CognitiveServices.Vision.ComputerVision.
    4. V dialogovém okně podrobností vyberte projekt a vyberte nejnovější stabilní verzi. Pak vyberte Nainstalovat.
  2. V adresáři projektu otevřete soubor Program.cs v preferovaném editoru nebo integrovaném vývojovém prostředí (IDE). Obsah Program.cs nahraďte následujícím kódem.

    using System;
    using System.Collections.Generic;
    using Microsoft.Azure.CognitiveServices.Vision.ComputerVision;
    using Microsoft.Azure.CognitiveServices.Vision.ComputerVision.Models;
    using System.Threading.Tasks;
    using System.IO;
    using Newtonsoft.Json;
    using Newtonsoft.Json.Linq;
    using System.Threading;
    using System.Linq;
    
    namespace ComputerVisionQuickstart
    {
        class Program
        {
            // Add your Computer Vision key and endpoint
            static string key = Environment.GetEnvironmentVariable("VISION_KEY");
            static string endpoint = Environment.GetEnvironmentVariable("VISION_ENDPOINT");
    
            private const string READ_TEXT_URL_IMAGE = "https://raw.githubusercontent.com/Azure-Samples/cognitive-services-sample-data-files/master/ComputerVision/Images/printed_text.jpg";
    
            static void Main(string[] args)
            {
                Console.WriteLine("Azure Cognitive Services Computer Vision - .NET quickstart example");
                Console.WriteLine();
    
                ComputerVisionClient client = Authenticate(endpoint, key);
    
                // Extract text (OCR) from a URL image using the Read API
                ReadFileUrl(client, READ_TEXT_URL_IMAGE).Wait();
            }
    
            public static ComputerVisionClient Authenticate(string endpoint, string key)
            {
                ComputerVisionClient client =
                  new ComputerVisionClient(new ApiKeyServiceClientCredentials(key))
                  { Endpoint = endpoint };
                return client;
            }
    
            public static async Task ReadFileUrl(ComputerVisionClient client, string urlFile)
            {
                Console.WriteLine("----------------------------------------------------------");
                Console.WriteLine("READ FILE FROM URL");
                Console.WriteLine();
    
                // Read text from URL
                var textHeaders = await client.ReadAsync(urlFile);
                // After the request, get the operation location (operation ID)
                string operationLocation = textHeaders.OperationLocation;
                Thread.Sleep(2000);
    
                // Retrieve the URI where the extracted text will be stored from the Operation-Location header.
                // We only need the ID and not the full URL
                const int numberOfCharsInOperationId = 36;
                string operationId = operationLocation.Substring(operationLocation.Length - numberOfCharsInOperationId);
    
                // Extract the text
                ReadOperationResult results;
                Console.WriteLine($"Extracting text from URL file {Path.GetFileName(urlFile)}...");
                Console.WriteLine();
                do
                {
                    results = await client.GetReadResultAsync(Guid.Parse(operationId));
                }
                while ((results.Status == OperationStatusCodes.Running ||
                    results.Status == OperationStatusCodes.NotStarted));
    
                // Display the found text.
                Console.WriteLine();
                var textUrlFileResults = results.AnalyzeResult.ReadResults;
                foreach (ReadResult page in textUrlFileResults)
                {
                    foreach (Line line in page.Lines)
                    {
                        Console.WriteLine(line.Text);
                    }
                }
                Console.WriteLine();
            }
    
        }
    }
    
  3. Jako volitelný krok se podívejte na určení způsobu zpracování dat. Pokud chcete například explicitně zadat nejnovější model GA, upravte ReadAsync volání, jak je znázorněno. Přeskočte parametr nebo použijte "latest" nejnovější model GA.

      // Read text from URL with a specific model version
      var textHeaders = await client.ReadAsync(urlFile,null,null,"2022-04-30");
    
  4. Aplikaci spusťte.

    • V nabídce Ladění vyberte Spustit ladění.

Výstup

Azure AI Vision - .NET quickstart example

----------------------------------------------------------
READ FILE FROM URL

Extracting text from URL file printed_text.jpg...


Nutrition Facts Amount Per Serving
Serving size: 1 bar (40g)
Serving Per Package: 4
Total Fat 13g
Saturated Fat 1.5g
Amount Per Serving
Trans Fat 0g
Calories 190
Cholesterol 0mg
ories from Fat 110
Sodium 20mg
nt Daily Values are based on Vitamin A 50%
calorie diet.

Vyčištění prostředků

Pokud chcete vyčistit a odebrat předplatné služeb Azure AI, můžete odstranit prostředek nebo skupinu prostředků. Odstraněním skupiny prostředků se odstraní také všechny ostatní prostředky, které jsou k ní přidružené.

Další kroky

V tomto rychlém startu jste zjistili, jak nainstalovat klientskou knihovnu OCR a používat rozhraní API pro čtení. V dalším kroku se dozvíte více o funkcích rozhraní API pro čtení.

Ke čtení tištěného a rukou psaného textu ze vzdáleného obrázku použijte klientskou knihovnu optického rozpoznávání znaků (OCR). Služba OCR může číst viditelný text na obrázku a převést ho na datový proud znaků. Další informace o rozpoznávání textu najdete v přehledu OCR.

Tip

Můžete také číst text z místního obrázku. Podívejte se na metody ComputerVisionClientOperationsMixin , například read_in_stream. Nebo se podívejte na ukázkový kód na GitHubu pro scénáře zahrnující místní image.

Referenční dokumentace | – ukázky balíčku zdrojového kódu | knihovny (PiPy) |

Požadavky

  • Předplatné Azure – Vytvořte si ho zdarma.

  • Python 3.x

  • Vaše instalace Pythonu by měla obsahovat pip. Můžete zkontrolovat, jestli máte nainstalovaný pip, spustit pip --version na příkazovém řádku. Získejte pip instalací nejnovější verze Pythonu.

  • Prostředek Azure AI Vision. K vyzkoušení služby můžete použít cenovou úroveňF0 Free a později upgradovat na placenou úroveň pro produkční prostředí.

  • Klíč a koncový bod z prostředku, který vytvoříte pro připojení aplikace ke službě Azure AI Vision.

    1. Po nasazení prostředku Azure Vision vyberte Přejít k prostředku.
    2. V levé navigační nabídce vyberte Klíče a koncový bod.
    3. Zkopírujte jeden z klíčů a koncový bod pro pozdější použití v rychlém startu.

Vytvoření proměnných prostředí

V tomto příkladu zapište své přihlašovací údaje do proměnných prostředí na místním počítači, na kterém běží aplikace.

Přejděte na Azure Portal. Pokud se prostředek, který jste vytvořili v části Požadavky, úspěšně nasadil, vyberte v části Další kroky přejít k prostředku. Klíč a koncový bod najdete v části Správa prostředků na stránce Klíče a koncový bod. Váš klíč prostředku není stejný jako ID předplatného Azure.

Tip

Nezahrňte klíč přímo do kódu a nikdy ho nesdělujte veřejně. Další možnosti ověřování, jako je Azure Key Vault, najdete v článku zabezpečení služeb Azure AI.

Pokud chcete nastavit proměnnou prostředí pro klíč a koncový bod, otevřete okno konzoly a postupujte podle pokynů pro operační systém a vývojové prostředí.

  1. Pokud chcete nastavit proměnnou VISION_KEY prostředí, nahraďte your-key jedním z klíčů pro váš prostředek.
  2. Pokud chcete nastavit proměnnou VISION_ENDPOINT prostředí, nahraďte your-endpoint koncovým bodem vašeho prostředku.
setx VISION_KEY your-key
setx VISION_ENDPOINT your-endpoint

Po přidání proměnných prostředí budete možná muset restartovat všechny spuštěné programy, které budou číst proměnné prostředí, včetně okna konzoly.

Čtení tištěného a rukou psaného textu

  1. Nainstalujte klientskou knihovnu.

    V okně konzoly spusťte následující příkaz:

    pip install --upgrade azure-cognitiveservices-vision-computervision
    
  2. Nainstalujte knihovnu Pillow.

    pip install pillow
    
  3. Vytvořte nový soubor aplikace Pythonu quickstart-file.py. Pak ho otevřete v preferovaném editoru nebo integrovaném vývojovém prostředí (IDE).

  4. Obsah quickstart-file.py nahraďte následujícím kódem.

    from azure.cognitiveservices.vision.computervision import ComputerVisionClient
    from azure.cognitiveservices.vision.computervision.models import OperationStatusCodes
    from azure.cognitiveservices.vision.computervision.models import VisualFeatureTypes
    from msrest.authentication import CognitiveServicesCredentials
    
    from array import array
    import os
    from PIL import Image
    import sys
    import time
    
    '''
    Authenticate
    Authenticates your credentials and creates a client.
    '''
    subscription_key = os.environ["VISION_KEY"]
    endpoint = os.environ["VISION_ENDPOINT"]
    
    computervision_client = ComputerVisionClient(endpoint, CognitiveServicesCredentials(subscription_key))
    '''
    END - Authenticate
    '''
    
    '''
    OCR: Read File using the Read API, extract text - remote
    This example will extract text in an image, then print results, line by line.
    This API call can also extract handwriting style text (not shown).
    '''
    print("===== Read File - remote =====")
    # Get an image with text
    read_image_url = "https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png"
    
    # Call API with URL and raw response (allows you to get the operation location)
    read_response = computervision_client.read(read_image_url,  raw=True)
    
    # Get the operation location (URL with an ID at the end) from the response
    read_operation_location = read_response.headers["Operation-Location"]
    # Grab the ID from the URL
    operation_id = read_operation_location.split("/")[-1]
    
    # Call the "GET" API and wait for it to retrieve the results 
    while True:
        read_result = computervision_client.get_read_result(operation_id)
        if read_result.status not in ['notStarted', 'running']:
            break
        time.sleep(1)
    
    # Print the detected text, line by line
    if read_result.status == OperationStatusCodes.succeeded:
        for text_result in read_result.analyze_result.read_results:
            for line in text_result.lines:
                print(line.text)
                print(line.bounding_box)
    print()
    '''
    END - Read File - remote
    '''
    
    print("End of Computer Vision quickstart.")
    
    
  5. Jako volitelný krok se podívejte na určení způsobu zpracování dat. Pokud chcete například explicitně zadat nejnovější model GA, upravte read příkaz, jak je znázorněno. Přeskočení parametru nebo použití "latest" automaticky používá nejnovější model GA.

       # Call API with URL and raw response (allows you to get the operation location)
       read_response = computervision_client.read(read_image_url,  raw=True, model_version="2022-04-30")
    
  6. Spusťte aplikaci pomocí příkazu python pro soubor rychlého startu.

    python quickstart-file.py
    

Výstup

===== Read File - remote =====
The quick brown fox jumps
[38.0, 650.0, 2572.0, 699.0, 2570.0, 854.0, 37.0, 815.0]
Over
[184.0, 1053.0, 508.0, 1044.0, 510.0, 1123.0, 184.0, 1128.0]
the lazy dog!
[639.0, 1011.0, 1976.0, 1026.0, 1974.0, 1158.0, 637.0, 1141.0]

End of Azure AI Vision quickstart.

Vyčištění prostředků

Pokud chcete vyčistit a odebrat předplatné služeb Azure AI, můžete odstranit prostředek nebo skupinu prostředků. Odstraněním skupiny prostředků se odstraní také všechny ostatní prostředky, které jsou k ní přidružené.

Další kroky

V tomto rychlém startu jste zjistili, jak nainstalovat klientskou knihovnu OCR a používat rozhraní API pro čtení. V dalším kroku se dozvíte více o funkcích rozhraní API pro čtení.

Ke čtení tištěného a rukou psaného textu pomocí rozhraní API pro čtení použijte klientskou knihovnu optického rozpoznávání znaků (OCR). Služba OCR může číst viditelný text na obrázku a převést ho na datový proud znaků. Další informace o rozpoznávání textu najdete v přehledu OCR.

Tip

Můžete také číst text z místního obrázku. Podívejte se na metody ComputerVisionClient , například readInStream. Nebo se podívejte na ukázkový kód na GitHubu pro scénáře zahrnující místní image.

Referenční dokumentace | – ukázky balíčku zdrojového kódu | knihovny (npm) |

Požadavky

  • Předplatné Azure – Vytvořte si ho zdarma.

  • Aktuální verze Node.js.

  • Prostředek Azure AI Vision. K vyzkoušení služby můžete použít cenovou úroveňF0 Free a později upgradovat na placenou úroveň pro produkční prostředí.

  • Klíč a koncový bod z prostředku, který vytvoříte pro připojení aplikace ke službě Azure AI Vision.

    1. Po nasazení prostředku Azure Vision vyberte Přejít k prostředku.
    2. V levé navigační nabídce vyberte Klíče a koncový bod.
    3. Zkopírujte jeden z klíčů a koncový bod pro pozdější použití v rychlém startu.

Vytvoření proměnných prostředí

V tomto příkladu zapište své přihlašovací údaje do proměnných prostředí na místním počítači, na kterém běží aplikace.

Přejděte na Azure Portal. Pokud se prostředek, který jste vytvořili v části Požadavky, úspěšně nasadil, vyberte v části Další kroky přejít k prostředku. Klíč a koncový bod najdete v části Správa prostředků na stránce Klíče a koncový bod. Váš klíč prostředku není stejný jako ID předplatného Azure.

Tip

Nezahrňte klíč přímo do kódu a nikdy ho nesdělujte veřejně. Další možnosti ověřování, jako je Azure Key Vault, najdete v článku zabezpečení služeb Azure AI.

Pokud chcete nastavit proměnnou prostředí pro klíč a koncový bod, otevřete okno konzoly a postupujte podle pokynů pro operační systém a vývojové prostředí.

  1. Pokud chcete nastavit proměnnou VISION_KEY prostředí, nahraďte your-key jedním z klíčů pro váš prostředek.
  2. Pokud chcete nastavit proměnnou VISION_ENDPOINT prostředí, nahraďte your-endpoint koncovým bodem vašeho prostředku.
setx VISION_KEY your-key
setx VISION_ENDPOINT your-endpoint

Po přidání proměnných prostředí budete možná muset restartovat všechny spuštěné programy, které budou číst proměnné prostředí, včetně okna konzoly.

Čtení tištěného a rukou psaného textu

Vytvořte novou aplikaci Node.js.

  1. V okně konzoly vytvořte pro aplikaci nový adresář a přejděte na něj.

    mkdir myapp
    cd myapp
    
  2. Spuštěním příkazu npm init vytvoříte aplikaci uzlu se souborem package.json. Pro všechny výzvy vyberte Enter .

    npm init
    
  3. Pokud chcete nainstalovat klientskou knihovnums-rest-azure, nainstalujte balíček npm:@azure/cognitiveservices-computervision

    npm install ms-rest-azure
    npm install @azure/cognitiveservices-computervision
    
  4. Nainstalujte asynchronní modul:

    npm install async
    

    Soubor vaší aplikace package.json se aktualizuje o závislosti.

  5. Vytvořte nový soubor, index.js a otevřete ho v textovém editoru.

  6. Do souboru index.js vložte následující kód.

    'use strict';
    
    const async = require('async');
    const fs = require('fs');
    const https = require('https');
    const path = require("path");
    const createReadStream = require('fs').createReadStream
    const sleep = require('util').promisify(setTimeout);
    const ComputerVisionClient = require('@azure/cognitiveservices-computervision').ComputerVisionClient;
    const ApiKeyCredentials = require('@azure/ms-rest-js').ApiKeyCredentials;
    /**
     * AUTHENTICATE
     * This single client is used for all examples.
     */
    const key = process.env.VISION_KEY;
    const endpoint = process.env.VISION_ENDPOINT;
    
    const computerVisionClient = new ComputerVisionClient(
      new ApiKeyCredentials({ inHeader: { 'Ocp-Apim-Subscription-Key': key } }), endpoint);
    /**
     * END - Authenticate
     */
    
    function computerVision() {
      async.series([
        async function () {
    
          /**
           * OCR: READ PRINTED & HANDWRITTEN TEXT WITH THE READ API
           * Extracts text from images using OCR (optical character recognition).
           */
          console.log('-------------------------------------------------');
          console.log('READ PRINTED, HANDWRITTEN TEXT AND PDF');
          console.log();
    
          // URL images containing printed and/or handwritten text. 
          // The URL can point to image files (.jpg/.png/.bmp) or multi-page files (.pdf, .tiff).
          const printedTextSampleURL = 'https://raw.githubusercontent.com/Azure-Samples/cognitive-services-sample-data-files/master/ComputerVision/Images/printed_text.jpg';
    
          // Recognize text in printed image from a URL
          console.log('Read printed text from URL...', printedTextSampleURL.split('/').pop());
          const printedResult = await readTextFromURL(computerVisionClient, printedTextSampleURL);
          printRecText(printedResult);
    
          // Perform read and await the result from URL
          async function readTextFromURL(client, url) {
            // To recognize text in a local image, replace client.read() with readTextInStream() as shown:
            let result = await client.read(url);
            // Operation ID is last path segment of operationLocation (a URL)
            let operation = result.operationLocation.split('/').slice(-1)[0];
    
            // Wait for read recognition to complete
            // result.status is initially undefined, since it's the result of read
            while (result.status !== "succeeded") { await sleep(1000); result = await client.getReadResult(operation); }
            return result.analyzeResult.readResults; // Return the first page of result. Replace [0] with the desired page if this is a multi-page file such as .pdf or .tiff.
          }
    
          // Prints all text from Read result
          function printRecText(readResults) {
            console.log('Recognized text:');
            for (const page in readResults) {
              if (readResults.length > 1) {
                console.log(`==== Page: ${page}`);
              }
              const result = readResults[page];
              if (result.lines.length) {
                for (const line of result.lines) {
                  console.log(line.words.map(w => w.text).join(' '));
                }
              }
              else { console.log('No recognized text.'); }
            }
          }
    
          /**
           * 
           * Download the specified file in the URL to the current local folder
           * 
           */
          function downloadFilesToLocal(url, localFileName) {
            return new Promise((resolve, reject) => {
              console.log('--- Downloading file to local directory from: ' + url);
              const request = https.request(url, (res) => {
                if (res.statusCode !== 200) {
                  console.log(`Download sample file failed. Status code: ${res.statusCode}, Message: ${res.statusMessage}`);
                  reject();
                }
                var data = [];
                res.on('data', (chunk) => {
                  data.push(chunk);
                });
                res.on('end', () => {
                  console.log('   ... Downloaded successfully');
                  fs.writeFileSync(localFileName, Buffer.concat(data));
                  resolve();
                });
              });
              request.on('error', function (e) {
                console.log(e.message);
                reject();
              });
              request.end();
            });
          }
    
          /**
           * END - Recognize Printed & Handwritten Text
           */
          console.log();
          console.log('-------------------------------------------------');
          console.log('End of quickstart.');
    
        },
        function () {
          return new Promise((resolve) => {
            resolve();
          })
        }
      ], (err) => {
        throw (err);
      });
    }
    
    computerVision();
    
  7. Jako volitelný krok se podívejte na určení způsobu zpracování dat. Pokud chcete například explicitně zadat nejnovější model GA, upravte read příkaz, jak je znázorněno. Přeskočení parametru nebo použití "latest" automaticky používá nejnovější model GA.

      let result = await client.read(url,{modelVersion:"2022-04-30"});
    
  8. Spusťte aplikaci pomocí příkazu node pro soubor rychlého startu.

    node index.js
    

Výstup

-------------------------------------------------
READ PRINTED, HANDWRITTEN TEXT AND PDF

Read printed text from URL... printed_text.jpg
Recognized text:
Nutrition Facts Amount Per Serving
Serving size: 1 bar (40g)
Serving Per Package: 4
Total Fat 13g
Saturated Fat 1.5g
Amount Per Serving
Trans Fat 0g
Calories 190
Cholesterol 0mg
ories from Fat 110
Sodium 20mg
nt Daily Values are based on Vitamin A 50%
calorie diet.

-------------------------------------------------
End of quickstart.

Vyčištění prostředků

Pokud chcete vyčistit a odebrat předplatné služeb Azure AI, můžete odstranit prostředek nebo skupinu prostředků. Odstraněním skupiny prostředků se odstraní také všechny ostatní prostředky, které jsou k ní přidružené.

Další kroky

V tomto rychlém startu jste zjistili, jak nainstalovat klientskou knihovnu OCR a používat rozhraní API pro čtení. V dalším kroku se dozvíte více o funkcích rozhraní API pro čtení.

K přečtení tištěného a rukou psaného textu použijte rozhraní REST API optického rozpoznávání znaků (OCR).

Poznámka:

V tomto rychlém startu se k volání rozhraní REST API používají příkazy cURL. Rozhraní REST API můžete také volat pomocí programovacího jazyka. Příklady v jazyce C#, Python, Java a JavaScript najdete v ukázkách GitHubu.

Požadavky

  • Předplatné Azure – Vytvořte si ho zdarma.

  • Nainstalovaný cURL .

  • Prostředek Azure AI Vision. K vyzkoušení služby můžete použít cenovou úroveňF0 Free a později upgradovat na placenou úroveň pro produkční prostředí.

  • Klíč a koncový bod z prostředku, který vytvoříte pro připojení aplikace ke službě Azure AI Vision.

    1. Po nasazení prostředku Azure Vision vyberte Přejít k prostředku.
    2. V levé navigační nabídce vyberte Klíče a koncový bod.
    3. Zkopírujte jeden z klíčů a koncový bod pro pozdější použití v rychlém startu.

Čtení tištěného a rukou psaného textu

Služba optického rozpoznávání znaků (OCR) dokáže extrahovat viditelný text v obrázku nebo dokumentu a převést ho na datový proud znaků. Další informace o extrakci textu najdete v přehledu OCR.

Volání rozhraní API pro čtení

Pokud chcete vytvořit a spustit ukázku, postupujte takto:

  1. Zkopírujte do textového editoru následující příkaz.

  2. Proveďte v příkazu na příslušných místech následující změny:

    1. Nahraďte hodnotu <key> klíčem.
    2. První část adresy URL požadavku (https://westcentralus.api.cognitive.microsoft.com/) nahraďte textem ve vlastní adrese URL koncového bodu.

      Poznámka:

      Nové prostředky vytvořené po 1. červenci 2019 budou používat vlastní názvy subdomén. Další informace a úplný seznam regionálních koncových bodů najdete v tématu Vlastní subdomény pro služby Azure AI.

    3. Volitelně můžete změnit adresu URL obrázku v textu požadavku (https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png) na adresu URL jiného obrázku, který se má analyzovat.
  3. Otevřete okno příkazového řádku.

  4. Vložte příkaz z textového editoru do okna příkazového řádku a pak příkaz spusťte.

curl -v -X POST "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyze" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription key>" --data-ascii "{'url':'https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png'}"

Odpověď obsahuje hlavičku Operation-Location , jejíž hodnota je jedinečná adresa URL. Tuto adresu URL použijete k dotazování výsledků operace čtení. Platnost adresy URL vyprší za 48 hodin.

Volitelně můžete zadat verzi modelu.

Jako volitelný krok se podívejte na určení způsobu zpracování dat. Pokud chcete například explicitně zadat nejnovější model GA, použijte model-version=2022-04-30 ho jako parametr. Přeskočení parametru nebo použití model-version=latest automaticky používá nejnovější model GA.

curl -v -X POST "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyze?model-version=2022-04-30" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription key>" --data-ascii "{'url':'https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png'}"

Získání výsledků čtení

  1. Do textového editoru zkopírujte následující příkaz.

  2. Nahraďte adresu URL Operation-Location hodnotou, kterou jste zkopírovali v předchozím postupu.

  3. Nahraďte hodnotu <key> klíčem.

  4. Otevřete okno konzoly.

  5. Vložte příkaz z textového editoru do okna konzoly a spusťte příkaz.

    curl -v -X GET "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyzeResults/{operationId}" -H "Ocp-Apim-Subscription-Key: {key}" --data-ascii "{body}" 
    

Prozkoumání odpovědi

Úspěšná odpověď se vrátí ve formátu JSON. Ukázková aplikace provede analýzu a zobrazí úspěšnou odpověď v okně konzoly, podobně jako v následujícím příkladu:

{
  "status": "succeeded",
  "createdDateTime": "2021-04-08T21:56:17.6819115+00:00",
  "lastUpdatedDateTime": "2021-04-08T21:56:18.4161316+00:00",
  "analyzeResult": {
    "version": "3.2",
    "readResults": [
      {
        "page": 1,
        "angle": 0,
        "width": 338,
        "height": 479,
        "unit": "pixel",
        "lines": [
          {
            "boundingBox": [
              25,
              14,
              318,
              14,
              318,
              59,
              25,
              59
            ],
            "text": "NOTHING",
            "appearance": {
              "style": {
                "name": "other",
                "confidence": 0.971
              }
            },
            "words": [
              {
                "boundingBox": [
                  27,
                  15,
                  294,
                  15,
                  294,
                  60,
                  27,
                  60
                ],
                "text": "NOTHING",
                "confidence": 0.994
              }
            ]
          }
        ]
      }
    ]
  }
}

Vyčištění prostředků

Pokud chcete vyčistit a odebrat předplatné služeb Azure AI, můžete odstranit prostředek nebo skupinu prostředků. Odstraněním skupiny prostředků se odstraní také všechny ostatní prostředky, které jsou k ní přidružené.

Další kroky

V tomto rychlém startu jste zjistili, jak volat rozhraní REST API pro čtení. V dalším kroku se dozvíte více o funkcích rozhraní API pro čtení.

Požadavky

  • Předplatné Azure – Vytvořte si ho zdarma.

  • Prostředek Azure AI Vision. K vyzkoušení služby můžete použít cenovou úroveňF0 Free a později upgradovat na placenou úroveň pro produkční prostředí.

  • Připojení do Vision Studio.

    • Možná se budete muset přihlásit.
    • Po přihlášení vyberte Zobrazit všechny prostředky. V případě potřeby vyberte Aktualizovat. Ověřte, že je váš prostředek dostupný.

    Další informace najdete v tématu Začínáme používat Vision Studio.

Čtení tištěného a rukou psaného textu

  1. V části Optické rozpoznávání znaků vyberte Extrahovat text z obrázků.

  2. V části Vyzkoušet potvrďte, že tato ukázka způsobuje využití vašeho účtu Azure. Další informace najdete v tématu o cenách služby Azure AI Vision.

  3. Vyberte obrázek z dostupné sady nebo nahrajte vlastní.

  4. V případě potřeby vyberte prostředek , který chcete vybrat.

    Po výběru obrázku se extrahovaný text zobrazí v okně výstupu. Můžete také vybrat kartu JSON a zobrazit výstup JSON , který volání rozhraní API vrátí.

Pod vyzkoušením je další postup, jak začít tuto funkci používat ve své vlastní aplikaci.

Další kroky

V tomto rychlém startu jste pro přístup k rozhraní API pro čtení použili Vision Studio. V dalším kroku se dozvíte více o funkcích rozhraní API pro čtení.