Rychlý start: Obecná dostupnost Azure AI Vision v3.2
Edice OCR (Read)
Důležité
Vyberte edici Read, která nejlépe vyhovuje vašim požadavkům.
Vstup | Příklady | Číst edici | Výhoda |
---|---|---|---|
Obrázky: Obecné, in-the-wild images | štítky, dopravní značky a plakáty | OCR pro image (verze 4.0) | Optimalizované pro obecné nedokumentované obrázky s využitím synchronního rozhraní API s vylepšeným výkonem, které usnadňuje vkládání OCR ve scénářích uživatelského prostředí. |
Dokumenty: Digitální a naskenované, včetně obrázků | knihy, články a sestavy | Model čtení funkce Document Intelligence | Optimalizované pro naskenované a digitální dokumenty náročné na text s asynchronním rozhraním API, které pomáhá automatizovat inteligentní zpracování dokumentů ve velkém měřítku. |
Informace o azure AI Vision verze 3.2 – obecná dostupnost
Hledáte nejnovější verzi Ga služby Azure AI Vision verze 3.2? Všechna budoucí vylepšení OCR pro čtení jsou součástí dvou dříve uvedených služeb. Ve službě Azure AI Vision verze 3.2 nejsou žádné další aktualizace. Další informace najdete v tématu Volání rozhraní AZURE AI Vision 3.2 GA Read API a rychlého startu: Azure AI Vision v3.2 GA Read.
Začínáme s rozhraním REST API služby Azure AI Vision nebo klientskými knihovnami. Rozhraní API pro čtení poskytuje algoritmy AI pro extrakci textu z obrázků a jejich vrácení jako strukturovaných řetězců. Tímto postupem nainstalujete balíček do aplikace a vyzkoušíte ukázkový kód pro základní úlohy.
Ke čtení tištěného a rukou psaného textu z obrázku použijte klientskou knihovnu optického rozpoznávání znaků (OCR). Služba OCR může číst viditelný text na obrázku a převést ho na datový proud znaků. Další informace o rozpoznávání textu najdete v přehledu OCR. Kód v této části používá nejnovější balíček Azure AI Vision .
Tip
Můžete také extrahovat text z místního obrázku. Podívejte se na metody ComputerVisionClient , například ReadInStreamAsync. Nebo se podívejte na ukázkový kód na GitHubu pro scénáře zahrnující místní image.
Referenční dokumentace | – ukázky balíčku zdrojového kódu | knihovny (NuGet) |
Požadavky
- Předplatné Azure – Vytvořte si ho zdarma.
- Integrované vývojové prostředí sady Visual Studio nebo aktuální verze .NET Core.
- Prostředek Azure AI Vision. K vyzkoušení služby můžete použít cenovou úroveň
F0
Free a později upgradovat na placenou úroveň pro produkční prostředí. - Klíč a koncový bod z prostředku, který vytvoříte pro připojení aplikace ke službě Azure AI Vision.
- Po nasazení prostředku Azure Vision vyberte Přejít k prostředku.
- V levé navigační nabídce vyberte Klíče a koncový bod.
- Zkopírujte jeden z klíčů a koncový bod pro pozdější použití v rychlém startu.
Vytvoření proměnných prostředí
V tomto příkladu zapište své přihlašovací údaje do proměnných prostředí na místním počítači, na kterém běží aplikace.
Přejděte na Azure Portal. Pokud se prostředek, který jste vytvořili v části Požadavky, úspěšně nasadil, vyberte v části Další kroky přejít k prostředku. Klíč a koncový bod najdete v části Správa prostředků na stránce Klíče a koncový bod. Váš klíč prostředku není stejný jako ID předplatného Azure.
Pokud chcete nastavit proměnnou prostředí pro klíč a koncový bod, otevřete okno konzoly a postupujte podle pokynů pro operační systém a vývojové prostředí.
- Pokud chcete nastavit proměnnou
VISION_KEY
prostředí, nahraďte<your_key>
jedním z klíčů pro váš prostředek. - Pokud chcete nastavit proměnnou
VISION_ENDPOINT
prostředí, nahraďte<your_endpoint>
koncovým bodem vašeho prostředku.
Důležité
Pokud používáte klíč rozhraní API, uložte ho bezpečně někam jinam, například ve službě Azure Key Vault. Nezahrnujte klíč rozhraní API přímo do kódu a nikdy ho nevštěvujte veřejně.
Další informace o zabezpečení služeb AI najdete v tématu Ověřování požadavků na služby Azure AI.
setx VISION_KEY <your_key>
setx VISION_ENDPOINT <your_endpoint>
Po přidání proměnných prostředí budete možná muset restartovat všechny spuštěné programy, které budou číst proměnné prostředí, včetně okna konzoly.
Čtení tištěného a rukou psaného textu
Vytvořte novou aplikaci jazyka C#.
Pomocí sady Visual Studio vytvořte projekt konzolové aplikace (.NET Framework) pro C#, Windows a konzolu.
Po vytvoření nového projektu nainstalujte klientskou knihovnu:
- Klikněte pravým tlačítkem na řešení projektu v Průzkumník řešení a vyberte Spravovat balíčky NuGet pro řešení.
- Ve správci balíčků, který se otevře, vyberte Procházet. Vyberte Zahrnout předběžné verze.
- Vyhledejte a vyberte
Microsoft.Azure.CognitiveServices.Vision.ComputerVision
. - V dialogovém okně podrobností vyberte projekt a vyberte nejnovější stabilní verzi. Pak vyberte Nainstalovat.
V adresáři projektu otevřete soubor Program.cs v preferovaném editoru nebo integrovaném vývojovém prostředí (IDE). Obsah Program.cs nahraďte následujícím kódem.
using System; using System.Collections.Generic; using Microsoft.Azure.CognitiveServices.Vision.ComputerVision; using Microsoft.Azure.CognitiveServices.Vision.ComputerVision.Models; using System.Threading.Tasks; using System.IO; using Newtonsoft.Json; using Newtonsoft.Json.Linq; using System.Threading; using System.Linq; namespace ComputerVisionQuickstart { class Program { // Add your Computer Vision key and endpoint static string key = Environment.GetEnvironmentVariable("VISION_KEY"); static string endpoint = Environment.GetEnvironmentVariable("VISION_ENDPOINT"); private const string READ_TEXT_URL_IMAGE = "https://raw.githubusercontent.com/Azure-Samples/cognitive-services-sample-data-files/master/ComputerVision/Images/printed_text.jpg"; static void Main(string[] args) { Console.WriteLine("Azure Cognitive Services Computer Vision - .NET quickstart example"); Console.WriteLine(); ComputerVisionClient client = Authenticate(endpoint, key); // Extract text (OCR) from a URL image using the Read API ReadFileUrl(client, READ_TEXT_URL_IMAGE).Wait(); } public static ComputerVisionClient Authenticate(string endpoint, string key) { ComputerVisionClient client = new ComputerVisionClient(new ApiKeyServiceClientCredentials(key)) { Endpoint = endpoint }; return client; } public static async Task ReadFileUrl(ComputerVisionClient client, string urlFile) { Console.WriteLine("----------------------------------------------------------"); Console.WriteLine("READ FILE FROM URL"); Console.WriteLine(); // Read text from URL var textHeaders = await client.ReadAsync(urlFile); // After the request, get the operation location (operation ID) string operationLocation = textHeaders.OperationLocation; Thread.Sleep(2000); // Retrieve the URI where the extracted text will be stored from the Operation-Location header. // We only need the ID and not the full URL const int numberOfCharsInOperationId = 36; string operationId = operationLocation.Substring(operationLocation.Length - numberOfCharsInOperationId); // Extract the text ReadOperationResult results; Console.WriteLine($"Extracting text from URL file {Path.GetFileName(urlFile)}..."); Console.WriteLine(); do { results = await client.GetReadResultAsync(Guid.Parse(operationId)); } while ((results.Status == OperationStatusCodes.Running || results.Status == OperationStatusCodes.NotStarted)); // Display the found text. Console.WriteLine(); var textUrlFileResults = results.AnalyzeResult.ReadResults; foreach (ReadResult page in textUrlFileResults) { foreach (Line line in page.Lines) { Console.WriteLine(line.Text); } } Console.WriteLine(); } } }
Jako volitelný krok se podívejte na určení způsobu zpracování dat. Pokud chcete například explicitně zadat nejnovější model GA, upravte
ReadAsync
volání, jak je znázorněno. Přeskočte parametr nebo použijte"latest"
nejnovější model GA.// Read text from URL with a specific model version var textHeaders = await client.ReadAsync(urlFile,null,null,"2022-04-30");
Aplikaci spusťte.
- V nabídce Ladění vyberte Spustit ladění.
Výstup
Azure AI Vision - .NET quickstart example
----------------------------------------------------------
READ FILE FROM URL
Extracting text from URL file printed_text.jpg...
Nutrition Facts Amount Per Serving
Serving size: 1 bar (40g)
Serving Per Package: 4
Total Fat 13g
Saturated Fat 1.5g
Amount Per Serving
Trans Fat 0g
Calories 190
Cholesterol 0mg
ories from Fat 110
Sodium 20mg
nt Daily Values are based on Vitamin A 50%
calorie diet.
Vyčištění prostředků
Pokud chcete vyčistit a odebrat předplatné služeb Azure AI, můžete odstranit prostředek nebo skupinu prostředků. Odstraněním skupiny prostředků se odstraní také všechny ostatní prostředky, které jsou k ní přidružené.
Další kroky
V tomto rychlém startu jste zjistili, jak nainstalovat klientskou knihovnu OCR a používat rozhraní API pro čtení. V dalším kroku se dozvíte více o funkcích rozhraní API pro čtení.
- Přehled OCR
- Zdrojový kód pro tuto ukázku najdete na GitHubu.
Ke čtení tištěného a rukou psaného textu ze vzdáleného obrázku použijte klientskou knihovnu optického rozpoznávání znaků (OCR). Služba OCR může číst viditelný text na obrázku a převést ho na datový proud znaků. Další informace o rozpoznávání textu najdete v přehledu OCR.
Tip
Můžete také číst text z místního obrázku. Podívejte se na metody ComputerVisionClientOperationsMixin , například read_in_stream. Nebo se podívejte na ukázkový kód na GitHubu pro scénáře zahrnující místní image.
Referenční dokumentace | – ukázky balíčku zdrojového kódu | knihovny (PiPy) |
Požadavky
- Předplatné Azure – Vytvořte si ho zdarma.
- Python 3.x
- Vaše instalace Pythonu by měla obsahovat pip. Můžete zkontrolovat, jestli máte nainstalovaný pip, spustit
pip --version
na příkazovém řádku. Získejte pip instalací nejnovější verze Pythonu. - Prostředek Azure AI Vision. K vyzkoušení služby můžete použít cenovou úroveň
F0
Free a později upgradovat na placenou úroveň pro produkční prostředí. - Klíč a koncový bod z prostředku, který vytvoříte pro připojení aplikace ke službě Azure AI Vision.
- Po nasazení prostředku Azure Vision vyberte Přejít k prostředku.
- V levé navigační nabídce vyberte Klíče a koncový bod.
- Zkopírujte jeden z klíčů a koncový bod pro pozdější použití v rychlém startu.
Vytvoření proměnných prostředí
V tomto příkladu zapište své přihlašovací údaje do proměnných prostředí na místním počítači, na kterém běží aplikace.
Přejděte na Azure Portal. Pokud se prostředek, který jste vytvořili v části Požadavky, úspěšně nasadil, vyberte v části Další kroky přejít k prostředku. Klíč a koncový bod najdete v části Správa prostředků na stránce Klíče a koncový bod. Váš klíč prostředku není stejný jako ID předplatného Azure.
Pokud chcete nastavit proměnnou prostředí pro klíč a koncový bod, otevřete okno konzoly a postupujte podle pokynů pro operační systém a vývojové prostředí.
- Pokud chcete nastavit proměnnou
VISION_KEY
prostředí, nahraďte<your_key>
jedním z klíčů pro váš prostředek. - Pokud chcete nastavit proměnnou
VISION_ENDPOINT
prostředí, nahraďte<your_endpoint>
koncovým bodem vašeho prostředku.
Důležité
Pokud používáte klíč rozhraní API, uložte ho bezpečně někam jinam, například ve službě Azure Key Vault. Nezahrnujte klíč rozhraní API přímo do kódu a nikdy ho nevštěvujte veřejně.
Další informace o zabezpečení služeb AI najdete v tématu Ověřování požadavků na služby Azure AI.
setx VISION_KEY <your_key>
setx VISION_ENDPOINT <your_endpoint>
Po přidání proměnných prostředí budete možná muset restartovat všechny spuštěné programy, které budou číst proměnné prostředí, včetně okna konzoly.
Čtení tištěného a rukou psaného textu
Nainstalujte klientskou knihovnu.
V okně konzoly spusťte následující příkaz:
pip install --upgrade azure-cognitiveservices-vision-computervision
Nainstalujte knihovnu Pillow.
pip install pillow
Vytvořte nový soubor aplikace Pythonu quickstart-file.py. Pak ho otevřete v preferovaném editoru nebo integrovaném vývojovém prostředí (IDE).
Obsah quickstart-file.py nahraďte následujícím kódem.
from azure.cognitiveservices.vision.computervision import ComputerVisionClient from azure.cognitiveservices.vision.computervision.models import OperationStatusCodes from azure.cognitiveservices.vision.computervision.models import VisualFeatureTypes from msrest.authentication import CognitiveServicesCredentials from array import array import os from PIL import Image import sys import time ''' Authenticate Authenticates your credentials and creates a client. ''' subscription_key = os.environ["VISION_KEY"] endpoint = os.environ["VISION_ENDPOINT"] computervision_client = ComputerVisionClient(endpoint, CognitiveServicesCredentials(subscription_key)) ''' END - Authenticate ''' ''' OCR: Read File using the Read API, extract text - remote This example will extract text in an image, then print results, line by line. This API call can also extract handwriting style text (not shown). ''' print("===== Read File - remote =====") # Get an image with text read_image_url = "https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png" # Call API with URL and raw response (allows you to get the operation location) read_response = computervision_client.read(read_image_url, raw=True) # Get the operation location (URL with an ID at the end) from the response read_operation_location = read_response.headers["Operation-Location"] # Grab the ID from the URL operation_id = read_operation_location.split("/")[-1] # Call the "GET" API and wait for it to retrieve the results while True: read_result = computervision_client.get_read_result(operation_id) if read_result.status not in ['notStarted', 'running']: break time.sleep(1) # Print the detected text, line by line if read_result.status == OperationStatusCodes.succeeded: for text_result in read_result.analyze_result.read_results: for line in text_result.lines: print(line.text) print(line.bounding_box) print() ''' END - Read File - remote ''' print("End of Computer Vision quickstart.")
Jako volitelný krok se podívejte na určení způsobu zpracování dat. Pokud chcete například explicitně zadat nejnovější model GA, upravte
read
příkaz, jak je znázorněno. Přeskočení parametru nebo použití"latest"
automaticky používá nejnovější model GA.# Call API with URL and raw response (allows you to get the operation location) read_response = computervision_client.read(read_image_url, raw=True, model_version="2022-04-30")
Spusťte aplikaci pomocí příkazu
python
pro soubor rychlého startu.python quickstart-file.py
Výstup
===== Read File - remote =====
The quick brown fox jumps
[38.0, 650.0, 2572.0, 699.0, 2570.0, 854.0, 37.0, 815.0]
Over
[184.0, 1053.0, 508.0, 1044.0, 510.0, 1123.0, 184.0, 1128.0]
the lazy dog!
[639.0, 1011.0, 1976.0, 1026.0, 1974.0, 1158.0, 637.0, 1141.0]
End of Azure AI Vision quickstart.
Vyčištění prostředků
Pokud chcete vyčistit a odebrat předplatné služeb Azure AI, můžete odstranit prostředek nebo skupinu prostředků. Odstraněním skupiny prostředků se odstraní také všechny ostatní prostředky, které jsou k ní přidružené.
Další kroky
V tomto rychlém startu jste zjistili, jak nainstalovat klientskou knihovnu OCR a používat rozhraní API pro čtení. V dalším kroku se dozvíte více o funkcích rozhraní API pro čtení.
- Přehled OCR
- Zdrojový kód pro tuto ukázku najdete na GitHubu.
Ke čtení tištěného a rukou psaného textu pomocí rozhraní API pro čtení použijte klientskou knihovnu optického rozpoznávání znaků (OCR). Služba OCR může číst viditelný text na obrázku a převést ho na datový proud znaků. Další informace o rozpoznávání textu najdete v přehledu OCR.
Tip
Můžete také číst text z místního obrázku. Podívejte se na metody ComputerVisionClient , například readInStream. Nebo se podívejte na ukázkový kód na GitHubu pro scénáře zahrnující místní image.
Referenční dokumentace | – ukázky (npm) |
Požadavky
- Předplatné Azure – Vytvořte si ho zdarma.
- Aktuální verze Node.js.
- Prostředek Azure AI Vision. K vyzkoušení služby můžete použít cenovou úroveň
F0
Free a později upgradovat na placenou úroveň pro produkční prostředí. - Klíč a koncový bod z prostředku, který vytvoříte pro připojení aplikace ke službě Azure AI Vision.
- Po nasazení prostředku Azure Vision vyberte Přejít k prostředku.
- V levé navigační nabídce vyberte Klíče a koncový bod.
- Zkopírujte jeden z klíčů a koncový bod pro pozdější použití v rychlém startu.
Vytvoření proměnných prostředí
V tomto příkladu zapište své přihlašovací údaje do proměnných prostředí na místním počítači, na kterém běží aplikace.
Přejděte na Azure Portal. Pokud se prostředek, který jste vytvořili v části Požadavky, úspěšně nasadil, vyberte v části Další kroky přejít k prostředku. Klíč a koncový bod najdete v části Správa prostředků na stránce Klíče a koncový bod. Váš klíč prostředku není stejný jako ID předplatného Azure.
Pokud chcete nastavit proměnnou prostředí pro klíč a koncový bod, otevřete okno konzoly a postupujte podle pokynů pro operační systém a vývojové prostředí.
- Pokud chcete nastavit proměnnou
VISION_KEY
prostředí, nahraďte<your_key>
jedním z klíčů pro váš prostředek. - Pokud chcete nastavit proměnnou
VISION_ENDPOINT
prostředí, nahraďte<your_endpoint>
koncovým bodem vašeho prostředku.
Důležité
Pokud používáte klíč rozhraní API, uložte ho bezpečně někam jinam, například ve službě Azure Key Vault. Nezahrnujte klíč rozhraní API přímo do kódu a nikdy ho nevštěvujte veřejně.
Další informace o zabezpečení služeb AI najdete v tématu Ověřování požadavků na služby Azure AI.
setx VISION_KEY <your_key>
setx VISION_ENDPOINT <your_endpoint>
Po přidání proměnných prostředí budete možná muset restartovat všechny spuštěné programy, které budou číst proměnné prostředí, včetně okna konzoly.
Čtení tištěného a rukou psaného textu
Vytvořte novou aplikaci Node.js.
V okně konzoly vytvořte pro aplikaci nový adresář a přejděte na něj.
mkdir myapp cd myapp
Spuštěním příkazu
npm init
vytvoříte aplikaci uzlu se souborempackage.json
. Pro všechny výzvy vyberte Enter .npm init
Pokud chcete nainstalovat klientskou knihovnu
ms-rest-azure
, nainstalujte balíček npm:@azure/cognitiveservices-computervision
npm install ms-rest-azure npm install @azure/cognitiveservices-computervision
Nainstalujte asynchronní modul:
npm install async
Soubor vaší aplikace
package.json
se aktualizuje o závislosti.Vytvořte nový soubor, index.js a otevřete ho v textovém editoru.
Do souboru index.js vložte následující kód.
'use strict'; const async = require('async'); const fs = require('fs'); const https = require('https'); const path = require("path"); const createReadStream = require('fs').createReadStream const sleep = require('util').promisify(setTimeout); const ComputerVisionClient = require('@azure/cognitiveservices-computervision').ComputerVisionClient; const ApiKeyCredentials = require('@azure/ms-rest-js').ApiKeyCredentials; /** * AUTHENTICATE * This single client is used for all examples. */ const key = process.env.VISION_KEY; const endpoint = process.env.VISION_ENDPOINT; const computerVisionClient = new ComputerVisionClient( new ApiKeyCredentials({ inHeader: { 'Ocp-Apim-Subscription-Key': key } }), endpoint); /** * END - Authenticate */ function computerVision() { async.series([ async function () { /** * OCR: READ PRINTED & HANDWRITTEN TEXT WITH THE READ API * Extracts text from images using OCR (optical character recognition). */ console.log('-------------------------------------------------'); console.log('READ PRINTED, HANDWRITTEN TEXT AND PDF'); console.log(); // URL images containing printed and/or handwritten text. // The URL can point to image files (.jpg/.png/.bmp) or multi-page files (.pdf, .tiff). const printedTextSampleURL = 'https://raw.githubusercontent.com/Azure-Samples/cognitive-services-sample-data-files/master/ComputerVision/Images/printed_text.jpg'; // Recognize text in printed image from a URL console.log('Read printed text from URL...', printedTextSampleURL.split('/').pop()); const printedResult = await readTextFromURL(computerVisionClient, printedTextSampleURL); printRecText(printedResult); // Perform read and await the result from URL async function readTextFromURL(client, url) { // To recognize text in a local image, replace client.read() with readTextInStream() as shown: let result = await client.read(url); // Operation ID is last path segment of operationLocation (a URL) let operation = result.operationLocation.split('/').slice(-1)[0]; // Wait for read recognition to complete // result.status is initially undefined, since it's the result of read while (result.status !== "succeeded") { await sleep(1000); result = await client.getReadResult(operation); } return result.analyzeResult.readResults; // Return the first page of result. Replace [0] with the desired page if this is a multi-page file such as .pdf or .tiff. } // Prints all text from Read result function printRecText(readResults) { console.log('Recognized text:'); for (const page in readResults) { if (readResults.length > 1) { console.log(`==== Page: ${page}`); } const result = readResults[page]; if (result.lines.length) { for (const line of result.lines) { console.log(line.words.map(w => w.text).join(' ')); } } else { console.log('No recognized text.'); } } } /** * * Download the specified file in the URL to the current local folder * */ function downloadFilesToLocal(url, localFileName) { return new Promise((resolve, reject) => { console.log('--- Downloading file to local directory from: ' + url); const request = https.request(url, (res) => { if (res.statusCode !== 200) { console.log(`Download sample file failed. Status code: ${res.statusCode}, Message: ${res.statusMessage}`); reject(); } var data = []; res.on('data', (chunk) => { data.push(chunk); }); res.on('end', () => { console.log(' ... Downloaded successfully'); fs.writeFileSync(localFileName, Buffer.concat(data)); resolve(); }); }); request.on('error', function (e) { console.log(e.message); reject(); }); request.end(); }); } /** * END - Recognize Printed & Handwritten Text */ console.log(); console.log('-------------------------------------------------'); console.log('End of quickstart.'); }, function () { return new Promise((resolve) => { resolve(); }) } ], (err) => { throw (err); }); } computerVision();
Jako volitelný krok se podívejte na určení způsobu zpracování dat. Pokud chcete například explicitně zadat nejnovější model GA, upravte
read
příkaz, jak je znázorněno. Přeskočení parametru nebo použití"latest"
automaticky používá nejnovější model GA.let result = await client.read(url,{modelVersion:"2022-04-30"});
Spusťte aplikaci pomocí příkazu
node
pro soubor rychlého startu.node index.js
Výstup
-------------------------------------------------
READ PRINTED, HANDWRITTEN TEXT AND PDF
Read printed text from URL... printed_text.jpg
Recognized text:
Nutrition Facts Amount Per Serving
Serving size: 1 bar (40g)
Serving Per Package: 4
Total Fat 13g
Saturated Fat 1.5g
Amount Per Serving
Trans Fat 0g
Calories 190
Cholesterol 0mg
ories from Fat 110
Sodium 20mg
nt Daily Values are based on Vitamin A 50%
calorie diet.
-------------------------------------------------
End of quickstart.
Vyčištění prostředků
Pokud chcete vyčistit a odebrat předplatné služeb Azure AI, můžete odstranit prostředek nebo skupinu prostředků. Odstraněním skupiny prostředků se odstraní také všechny ostatní prostředky, které jsou k ní přidružené.
Další kroky
V tomto rychlém startu jste zjistili, jak nainstalovat klientskou knihovnu OCR a používat rozhraní API pro čtení. V dalším kroku se dozvíte více o funkcích rozhraní API pro čtení.
- Přehled OCR
- Zdrojový kód pro tuto ukázku najdete na GitHubu.
K přečtení tištěného a rukou psaného textu použijte rozhraní REST API optického rozpoznávání znaků (OCR).
Poznámka:
V tomto rychlém startu se k volání rozhraní REST API používají příkazy cURL. Rozhraní REST API můžete také volat pomocí programovacího jazyka. Příklady v jazyce C#, Python, Java a JavaScript najdete v ukázkách GitHubu.
Požadavky
- Předplatné Azure – Vytvořte si ho zdarma.
- Nainstalovaný cURL .
- Prostředek Azure AI Vision. K vyzkoušení služby můžete použít cenovou úroveň
F0
Free a později upgradovat na placenou úroveň pro produkční prostředí. - Klíč a koncový bod z prostředku, který vytvoříte pro připojení aplikace ke službě Azure AI Vision.
- Po nasazení prostředku Azure Vision vyberte Přejít k prostředku.
- V levé navigační nabídce vyberte Klíče a koncový bod.
- Zkopírujte jeden z klíčů a koncový bod pro pozdější použití v rychlém startu.
Čtení tištěného a rukou psaného textu
Služba optického rozpoznávání znaků (OCR) dokáže extrahovat viditelný text v obrázku nebo dokumentu a převést ho na datový proud znaků. Další informace o extrakci textu najdete v přehledu OCR.
Volání rozhraní API pro čtení
Pokud chcete vytvořit a spustit ukázku, postupujte takto:
Zkopírujte do textového editoru následující příkaz.
Proveďte v příkazu na příslušných místech následující změny:
- Nahraďte hodnotu
<key>
klíčem. - První část adresy URL požadavku (
https://westcentralus.api.cognitive.microsoft.com/
) nahraďte textem ve vlastní adrese URL koncového bodu.Poznámka:
Nové prostředky vytvořené po 1. červenci 2019 budou používat vlastní názvy subdomén. Další informace a úplný seznam regionálních koncových bodů najdete v tématu Vlastní subdomény pro služby Azure AI.
- Volitelně můžete změnit adresu URL obrázku v textu požadavku (
https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png
) na adresu URL jiného obrázku, který se má analyzovat.
- Nahraďte hodnotu
Otevřete okno příkazového řádku.
Vložte příkaz z textového editoru do okna příkazového řádku a pak příkaz spusťte.
curl -v -X POST "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyze" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription key>" --data-ascii "{'url':'https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png'}"
Odpověď obsahuje hlavičku Operation-Location
, jejíž hodnota je jedinečná adresa URL. Tuto adresu URL použijete k dotazování výsledků operace čtení. Platnost adresy URL vyprší za 48 hodin.
Volitelně můžete zadat verzi modelu.
Jako volitelný krok se podívejte na určení způsobu zpracování dat. Pokud chcete například explicitně zadat nejnovější model GA, použijte model-version=2022-04-30
ho jako parametr. Přeskočení parametru nebo použití model-version=latest
automaticky používá nejnovější model GA.
curl -v -X POST "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyze?model-version=2022-04-30" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription key>" --data-ascii "{'url':'https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png'}"
Získání výsledků čtení
Do textového editoru zkopírujte následující příkaz.
Nahraďte adresu URL
Operation-Location
hodnotou, kterou jste zkopírovali v předchozím postupu.Nahraďte hodnotu
<key>
klíčem.Otevřete okno konzoly.
Vložte příkaz z textového editoru do okna konzoly a spusťte příkaz.
curl -v -X GET "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyzeResults/{operationId}" -H "Ocp-Apim-Subscription-Key: {key}" --data-ascii "{body}"
Prozkoumání odpovědi
Úspěšná odpověď se vrátí ve formátu JSON. Ukázková aplikace provede analýzu a zobrazí úspěšnou odpověď v okně konzoly, podobně jako v následujícím příkladu:
{
"status": "succeeded",
"createdDateTime": "2021-04-08T21:56:17.6819115+00:00",
"lastUpdatedDateTime": "2021-04-08T21:56:18.4161316+00:00",
"analyzeResult": {
"version": "3.2",
"readResults": [
{
"page": 1,
"angle": 0,
"width": 338,
"height": 479,
"unit": "pixel",
"lines": [
{
"boundingBox": [
25,
14,
318,
14,
318,
59,
25,
59
],
"text": "NOTHING",
"appearance": {
"style": {
"name": "other",
"confidence": 0.971
}
},
"words": [
{
"boundingBox": [
27,
15,
294,
15,
294,
60,
27,
60
],
"text": "NOTHING",
"confidence": 0.994
}
]
}
]
}
]
}
}
Vyčištění prostředků
Pokud chcete vyčistit a odebrat předplatné služeb Azure AI, můžete odstranit prostředek nebo skupinu prostředků. Odstraněním skupiny prostředků se odstraní také všechny ostatní prostředky, které jsou k ní přidružené.
Další kroky
V tomto rychlém startu jste zjistili, jak volat rozhraní REST API pro čtení. V dalším kroku se dozvíte více o funkcích rozhraní API pro čtení.
Požadavky
Předplatné Azure – Vytvořte si ho zdarma.
Prostředek Azure AI Vision. K vyzkoušení služby můžete použít cenovou úroveň
F0
Free a později upgradovat na placenou úroveň pro produkční prostředí.Připojte se ke Vision Studiu.
- Možná se budete muset přihlásit.
- Po přihlášení vyberte Zobrazit všechny prostředky. V případě potřeby vyberte Aktualizovat. Ověřte, že je váš prostředek dostupný.
Další informace najdete v tématu Začínáme používat Vision Studio.
Čtení tištěného a rukou psaného textu
V části Optické rozpoznávání znaků vyberte Extrahovat text z obrázků.
V části Vyzkoušet potvrďte, že tato ukázka způsobuje využití vašeho účtu Azure. Další informace najdete v tématu o cenách služby Azure AI Vision.
Vyberte obrázek z dostupné sady nebo nahrajte vlastní.
V případě potřeby vyberte prostředek , který chcete vybrat.
Po výběru obrázku se extrahovaný text zobrazí v okně výstupu. Můžete také vybrat kartu JSON a zobrazit výstup JSON , který volání rozhraní API vrátí.
Pod vyzkoušením je další postup, jak začít tuto funkci používat ve své vlastní aplikaci.
Další kroky
V tomto rychlém startu jste pro přístup k rozhraní API pro čtení použili Vision Studio. V dalším kroku se dozvíte více o funkcích rozhraní API pro čtení.