Rövid útmutató: Azure AI Vision v3.2 GA Read
OCR (Olvasás) kiadások
Fontos
Válassza ki a követelményeknek leginkább megfelelő olvasási kiadást.
Bevitel | Példák | Kiadás olvasása | Juttatás |
---|---|---|---|
Képek: Általános, vadon élő képek | címkék, utcatáblák és plakátok | OCR képekhez (4.0-s verzió) | Általános, nem dokumentumképekhez optimalizált, teljesítmény-továbbfejlesztett szinkron API-val, amely megkönnyíti az OCR beágyazását a felhasználói élmény forgatókönyveibe. |
Dokumentumok: Digitális és szkennelt, képeket is beleértve | könyvek, cikkek és jelentések | Dokumentumintelligencia-olvasási modell | Aszinkron API-val szövegigényes beolvasott és digitális dokumentumokhoz optimalizálva az intelligens dokumentumfeldolgozás nagy léptékű automatizálásához. |
Tudnivalók az Azure AI Vision 3.2-s ga-olvasásáról
A legújabb Azure AI Vision v3.2 GA-olvasást keresi? A Read OCR jövőbeli fejlesztései a korábban felsorolt két szolgáltatás részét képezik. Nincsenek további frissítések az Azure AI Képfelismerés 3.2-höz. További információ: Az Azure AI Vision 3.2 GA Read API meghívása és rövid útmutató: Azure AI Vision v3.2 GA Read.
Ismerkedés az Azure AI Vision Read REST API-val vagy ügyfélkódtárakkal. A Read API AI-algoritmusokat biztosít a szövegek képekből való kinyeréhez és strukturált sztringekként való visszaadásához. Az alábbi lépéseket követve telepíthet egy csomagot az alkalmazásba, és kipróbálhatja az alapműveletek mintakódját.
Az optikai karakterfelismerési (OCR) ügyféloldali kódtár használatával nyomtatott és kézzel írt szöveget olvashat egy képből. Az OCR szolgáltatás képes beolvasni egy kép látható szövegét, és karakterfolyammá alakítani. A szövegfelismerésről további információt az OCR áttekintésében talál. A jelen szakaszban szereplő kód a legújabb Azure AI Vision-csomagot használja.
Tipp.
Egy helyi képből is kinyerhet szöveget. Lásd a ComputerVisionClient metódusokat, például a ReadInStreamAsyncet. Vagy tekintse meg a GitHub mintakódját a helyi rendszerképeket érintő forgatókönyvekhez.
Referenciadokumentáció Kódtár forráskódcsomagja | (NuGet) | -minták |
Előfeltételek
- Azure-előfizetés – Hozzon létre egyet ingyenesen.
- A Visual Studio IDE vagy a .NET Core aktuális verziója.
- Egy Azure AI Vision-erőforrás. Az ingyenes tarifacsomag (
F0
) használatával kipróbálhatja a szolgáltatást, és később frissíthet egy fizetős szintre az éles környezetben. - Az alkalmazás azure AI Vision szolgáltatáshoz való csatlakoztatásához létrehozott erőforrás kulcsa és végpontja.
- Az Azure Vision-erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget.
- A bal oldali navigációs menüben válassza a Kulcsok és végpont lehetőséget.
- Másolja ki az egyik kulcsot és a végpontot a rövid útmutató későbbi részében való használatra.
Környezeti változók létrehozása
Ebben a példában írja meg a hitelesítő adatait az alkalmazást futtató helyi gépen lévő környezeti változókba.
Nyissa meg az Azure Portalt. Ha az Előfeltételek szakaszban létrehozott erőforrás sikeresen üzembe lett helyezve, válassza az Ugrás az erőforrásra lehetőséget a Következő lépések csoportban. A kulcsot és a végpontot a Kulcsok és végpontok lapon, az Erőforrás-kezelés területen találja. Az erőforráskulcs nem ugyanaz, mint az Azure-előfizetés azonosítója.
A kulcs és a végpont környezeti változójának beállításához nyisson meg egy konzolablakot, és kövesse az operációs rendszer és a fejlesztési környezet utasításait.
- A
VISION_KEY
környezeti változó beállításához cserélje le<your_key>
az erőforrás egyik kulcsára. - A
VISION_ENDPOINT
környezeti változó beállításához cserélje le<your_endpoint>
az erőforrás végpontját.
Fontos
HA API-kulcsot használ, biztonságosan tárolja valahol máshol, például az Azure Key Vaultban. Ne foglalja bele közvetlenül az API-kulcsot a kódba, és soha ne tegye közzé nyilvánosan.
Az AI-szolgáltatások biztonságáról további információt az Azure AI-szolgáltatásokhoz érkező kérelmek hitelesítése című témakörben talál.
setx VISION_KEY <your_key>
setx VISION_ENDPOINT <your_endpoint>
A környezeti változók hozzáadása után előfordulhat, hogy újra kell indítania a futó programokat, amelyek felolvassák a környezeti változókat, beleértve a konzolablakot is.
Nyomtatott és kézzel írt szöveg olvasása
Hozzon létre egy új C#-alkalmazást.
A Visual Studio használatával hozzon létre egy konzolalkalmazási (.NET-keretrendszer) projektet c#, Windows, Console rendszerhez.
Új projekt létrehozása után telepítse az ügyfélkódtárat:
- Kattintson a jobb gombbal a projektmegoldásra a Megoldáskezelő, és válassza a Megoldáshoz készült NuGet-csomagok kezelése lehetőséget.
- A megnyíló csomagkezelőben válassza a Tallózás lehetőséget. Válassza az Előválasztás belefoglalása lehetőséget.
- Keresse meg és válassza ki a
Microsoft.Azure.CognitiveServices.Vision.ComputerVision
elemet. - A Részletek párbeszédpanelen válassza ki a projektet, és válassza ki a legújabb stabil verziót. Ezután válassza a Telepítés parancsot.
A projektkönyvtárban nyissa meg a Program.cs fájlt az előnyben részesített szerkesztőben vagy IDE-ben. Cserélje le a Program.cs tartalmát a következő kódra.
using System; using System.Collections.Generic; using Microsoft.Azure.CognitiveServices.Vision.ComputerVision; using Microsoft.Azure.CognitiveServices.Vision.ComputerVision.Models; using System.Threading.Tasks; using System.IO; using Newtonsoft.Json; using Newtonsoft.Json.Linq; using System.Threading; using System.Linq; namespace ComputerVisionQuickstart { class Program { // Add your Computer Vision key and endpoint static string key = Environment.GetEnvironmentVariable("VISION_KEY"); static string endpoint = Environment.GetEnvironmentVariable("VISION_ENDPOINT"); private const string READ_TEXT_URL_IMAGE = "https://raw.githubusercontent.com/Azure-Samples/cognitive-services-sample-data-files/master/ComputerVision/Images/printed_text.jpg"; static void Main(string[] args) { Console.WriteLine("Azure Cognitive Services Computer Vision - .NET quickstart example"); Console.WriteLine(); ComputerVisionClient client = Authenticate(endpoint, key); // Extract text (OCR) from a URL image using the Read API ReadFileUrl(client, READ_TEXT_URL_IMAGE).Wait(); } public static ComputerVisionClient Authenticate(string endpoint, string key) { ComputerVisionClient client = new ComputerVisionClient(new ApiKeyServiceClientCredentials(key)) { Endpoint = endpoint }; return client; } public static async Task ReadFileUrl(ComputerVisionClient client, string urlFile) { Console.WriteLine("----------------------------------------------------------"); Console.WriteLine("READ FILE FROM URL"); Console.WriteLine(); // Read text from URL var textHeaders = await client.ReadAsync(urlFile); // After the request, get the operation location (operation ID) string operationLocation = textHeaders.OperationLocation; Thread.Sleep(2000); // Retrieve the URI where the extracted text will be stored from the Operation-Location header. // We only need the ID and not the full URL const int numberOfCharsInOperationId = 36; string operationId = operationLocation.Substring(operationLocation.Length - numberOfCharsInOperationId); // Extract the text ReadOperationResult results; Console.WriteLine($"Extracting text from URL file {Path.GetFileName(urlFile)}..."); Console.WriteLine(); do { results = await client.GetReadResultAsync(Guid.Parse(operationId)); } while ((results.Status == OperationStatusCodes.Running || results.Status == OperationStatusCodes.NotStarted)); // Display the found text. Console.WriteLine(); var textUrlFileResults = results.AnalyzeResult.ReadResults; foreach (ReadResult page in textUrlFileResults) { foreach (Line line in page.Lines) { Console.WriteLine(line.Text); } } Console.WriteLine(); } } }
Választható lépésként tekintse meg az adatok feldolgozásának módját. Például a legújabb GA-modell explicit megadásához szerkessze a hívást az
ReadAsync
ábrán látható módon. Hagyja ki a paramétert, vagy használja"latest"
a legújabb GA-modellt.// Read text from URL with a specific model version var textHeaders = await client.ReadAsync(urlFile,null,null,"2022-04-30");
Futtassa az alkalmazást.
- A Hibakeresés menüben válassza a Hibakeresés indítása lehetőséget.
Hozam
Azure AI Vision - .NET quickstart example
----------------------------------------------------------
READ FILE FROM URL
Extracting text from URL file printed_text.jpg...
Nutrition Facts Amount Per Serving
Serving size: 1 bar (40g)
Serving Per Package: 4
Total Fat 13g
Saturated Fat 1.5g
Amount Per Serving
Trans Fat 0g
Calories 190
Cholesterol 0mg
ories from Fat 110
Sodium 20mg
nt Daily Values are based on Vitamin A 50%
calorie diet.
Az erőforrások eltávolítása
Ha törölni és eltávolítani szeretne egy Azure AI-szolgáltatási előfizetést, törölheti az erőforrást vagy az erőforráscsoportot. Az erőforráscsoport törlése a hozzá társított egyéb erőforrásokat is törli.
Következő lépések
Ebben a rövid útmutatóban megtanulta, hogyan telepítheti az OCR-ügyfélkódtárat, és hogyan használhatja a Read API-t. Ezután további információ az API olvasási funkcióiról.
- AZ OCR áttekintése
- A minta forráskódja a GitHubon található.
Az optikai karakterfelismerő (OCR) ügyfélkódtár használatával nyomtatott és kézzel írt szöveget olvashat egy távoli képről. Az OCR szolgáltatás képes beolvasni egy kép látható szövegét, és karakterfolyammá alakítani. A szövegfelismerésről további információt az OCR áttekintésében talál.
Tipp.
A helyi képről is olvashat szöveget. Lásd a ComputerVisionClientOperationsMixin metódusokat, például read_in_stream. Vagy tekintse meg a GitHub mintakódját a helyi rendszerképeket érintő forgatókönyvekhez.
Referenciadokumentáció Kódtár forráskódcsomagja | (PiPy) | -minták |
Előfeltételek
- Azure-előfizetés – Hozzon létre egyet ingyenesen.
- Python 3.x.
- A Python-telepítésnek tartalmaznia kell a pipet. Ellenőrizheti, hogy telepítve van-e a pip, és fut-e
pip --version
a parancssorban. Kérje le a pipet a Python legújabb verziójának telepítésével. - Egy Azure AI Vision-erőforrás. Az ingyenes tarifacsomag (
F0
) használatával kipróbálhatja a szolgáltatást, és később frissíthet egy fizetős szintre az éles környezetben. - Az alkalmazás azure AI Vision szolgáltatáshoz való csatlakoztatásához létrehozott erőforrás kulcsa és végpontja.
- Az Azure Vision-erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget.
- A bal oldali navigációs menüben válassza a Kulcsok és végpont lehetőséget.
- Másolja ki az egyik kulcsot és a végpontot a rövid útmutató későbbi részében való használatra.
Környezeti változók létrehozása
Ebben a példában írja meg a hitelesítő adatait az alkalmazást futtató helyi gépen lévő környezeti változókba.
Nyissa meg az Azure Portalt. Ha az Előfeltételek szakaszban létrehozott erőforrás sikeresen üzembe lett helyezve, válassza az Ugrás az erőforrásra lehetőséget a Következő lépések csoportban. A kulcsot és a végpontot a Kulcsok és végpontok lapon, az Erőforrás-kezelés területen találja. Az erőforráskulcs nem ugyanaz, mint az Azure-előfizetés azonosítója.
A kulcs és a végpont környezeti változójának beállításához nyisson meg egy konzolablakot, és kövesse az operációs rendszer és a fejlesztési környezet utasításait.
- A
VISION_KEY
környezeti változó beállításához cserélje le<your_key>
az erőforrás egyik kulcsára. - A
VISION_ENDPOINT
környezeti változó beállításához cserélje le<your_endpoint>
az erőforrás végpontját.
Fontos
HA API-kulcsot használ, biztonságosan tárolja valahol máshol, például az Azure Key Vaultban. Ne foglalja bele közvetlenül az API-kulcsot a kódba, és soha ne tegye közzé nyilvánosan.
Az AI-szolgáltatások biztonságáról további információt az Azure AI-szolgáltatásokhoz érkező kérelmek hitelesítése című témakörben talál.
setx VISION_KEY <your_key>
setx VISION_ENDPOINT <your_endpoint>
A környezeti változók hozzáadása után előfordulhat, hogy újra kell indítania a futó programokat, amelyek felolvassák a környezeti változókat, beleértve a konzolablakot is.
Nyomtatott és kézzel írt szöveg olvasása
Telepítse az ügyfélkódtárat.
Egy konzolablakban futtassa a következő parancsot:
pip install --upgrade azure-cognitiveservices-vision-computervision
Telepítse a Párna könyvtárat.
pip install pillow
Hozzon létre egy új Python-alkalmazásfájlt, quickstart-file.py. Ezután nyissa meg a kívánt szerkesztőben vagy IDE-ben.
Cserélje le a quickstart-file.py tartalmát a következő kódra.
from azure.cognitiveservices.vision.computervision import ComputerVisionClient from azure.cognitiveservices.vision.computervision.models import OperationStatusCodes from azure.cognitiveservices.vision.computervision.models import VisualFeatureTypes from msrest.authentication import CognitiveServicesCredentials from array import array import os from PIL import Image import sys import time ''' Authenticate Authenticates your credentials and creates a client. ''' subscription_key = os.environ["VISION_KEY"] endpoint = os.environ["VISION_ENDPOINT"] computervision_client = ComputerVisionClient(endpoint, CognitiveServicesCredentials(subscription_key)) ''' END - Authenticate ''' ''' OCR: Read File using the Read API, extract text - remote This example will extract text in an image, then print results, line by line. This API call can also extract handwriting style text (not shown). ''' print("===== Read File - remote =====") # Get an image with text read_image_url = "https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png" # Call API with URL and raw response (allows you to get the operation location) read_response = computervision_client.read(read_image_url, raw=True) # Get the operation location (URL with an ID at the end) from the response read_operation_location = read_response.headers["Operation-Location"] # Grab the ID from the URL operation_id = read_operation_location.split("/")[-1] # Call the "GET" API and wait for it to retrieve the results while True: read_result = computervision_client.get_read_result(operation_id) if read_result.status not in ['notStarted', 'running']: break time.sleep(1) # Print the detected text, line by line if read_result.status == OperationStatusCodes.succeeded: for text_result in read_result.analyze_result.read_results: for line in text_result.lines: print(line.text) print(line.bounding_box) print() ''' END - Read File - remote ''' print("End of Computer Vision quickstart.")
Választható lépésként tekintse meg az adatok feldolgozásának módját. A legújabb GA-modell explicit megadásához például szerkessze az utasítást az
read
ábrán látható módon. A paraméter kihagyása vagy automatikus használata"latest"
a legújabb GA-modellt használja.# Call API with URL and raw response (allows you to get the operation location) read_response = computervision_client.read(read_image_url, raw=True, model_version="2022-04-30")
Futtassa az alkalmazást a
python
paranccsal a gyorsútmutatós fájlon.python quickstart-file.py
Hozam
===== Read File - remote =====
The quick brown fox jumps
[38.0, 650.0, 2572.0, 699.0, 2570.0, 854.0, 37.0, 815.0]
Over
[184.0, 1053.0, 508.0, 1044.0, 510.0, 1123.0, 184.0, 1128.0]
the lazy dog!
[639.0, 1011.0, 1976.0, 1026.0, 1974.0, 1158.0, 637.0, 1141.0]
End of Azure AI Vision quickstart.
Az erőforrások eltávolítása
Ha törölni és eltávolítani szeretne egy Azure AI-szolgáltatási előfizetést, törölheti az erőforrást vagy az erőforráscsoportot. Az erőforráscsoport törlése a hozzá társított egyéb erőforrásokat is törli.
Következő lépések
Ebben a rövid útmutatóban megtanulta, hogyan telepítheti az OCR-ügyfélkódtárat, és hogyan használhatja a Read API-t. Ezután további információ az API olvasási funkcióiról.
- AZ OCR áttekintése
- A minta forráskódja a GitHubon található.
Az optikai karakterfelismerési (OCR) ügyféloldali kódtár használatával nyomtatott és kézzel írt szöveget olvashat a Read API-val. Az OCR szolgáltatás képes beolvasni egy kép látható szövegét, és karakterfolyammá alakítani. A szövegfelismerésről további információt az OCR áttekintésében talál.
Tipp.
A helyi képről is olvashat szöveget. Lásd a ComputerVisionClient metódusokat, például a readInStreamet. Vagy tekintse meg a GitHub mintakódját a helyi rendszerképeket érintő forgatókönyvekhez.
Referenciadokumentáció csomag (npm) | minták |
Előfeltételek
- Azure-előfizetés – Hozzon létre egyet ingyenesen.
- A Node.js aktuális verziója.
- Egy Azure AI Vision-erőforrás. Az ingyenes tarifacsomag (
F0
) használatával kipróbálhatja a szolgáltatást, és később frissíthet egy fizetős szintre az éles környezetben. - Az alkalmazás azure AI Vision szolgáltatáshoz való csatlakoztatásához létrehozott erőforrás kulcsa és végpontja.
- Az Azure Vision-erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget.
- A bal oldali navigációs menüben válassza a Kulcsok és végpont lehetőséget.
- Másolja ki az egyik kulcsot és a végpontot a rövid útmutató későbbi részében való használatra.
Környezeti változók létrehozása
Ebben a példában írja meg a hitelesítő adatait az alkalmazást futtató helyi gépen lévő környezeti változókba.
Nyissa meg az Azure Portalt. Ha az Előfeltételek szakaszban létrehozott erőforrás sikeresen üzembe lett helyezve, válassza az Ugrás az erőforrásra lehetőséget a Következő lépések csoportban. A kulcsot és a végpontot a Kulcsok és végpontok lapon, az Erőforrás-kezelés területen találja. Az erőforráskulcs nem ugyanaz, mint az Azure-előfizetés azonosítója.
A kulcs és a végpont környezeti változójának beállításához nyisson meg egy konzolablakot, és kövesse az operációs rendszer és a fejlesztési környezet utasításait.
- A
VISION_KEY
környezeti változó beállításához cserélje le<your_key>
az erőforrás egyik kulcsára. - A
VISION_ENDPOINT
környezeti változó beállításához cserélje le<your_endpoint>
az erőforrás végpontját.
Fontos
HA API-kulcsot használ, biztonságosan tárolja valahol máshol, például az Azure Key Vaultban. Ne foglalja bele közvetlenül az API-kulcsot a kódba, és soha ne tegye közzé nyilvánosan.
Az AI-szolgáltatások biztonságáról további információt az Azure AI-szolgáltatásokhoz érkező kérelmek hitelesítése című témakörben talál.
setx VISION_KEY <your_key>
setx VISION_ENDPOINT <your_endpoint>
A környezeti változók hozzáadása után előfordulhat, hogy újra kell indítania a futó programokat, amelyek felolvassák a környezeti változókat, beleértve a konzolablakot is.
Nyomtatott és kézzel írt szöveg olvasása
Hozzon létre egy új Node.js alkalmazást.
Egy konzolablakban hozzon létre egy új könyvtárat az alkalmazáshoz, és navigáljon hozzá.
mkdir myapp cd myapp
Futtassa az
npm init
parancsot egy Node-alkalmazáspackage.json
fájllal való létrehozásához. Válassza az Enter billentyűt az esetleges kérdésekhez.npm init
Az ügyfélkódtár telepítéséhez telepítse az
ms-rest-azure
npm-csomagot@azure/cognitiveservices-computervision
:npm install ms-rest-azure npm install @azure/cognitiveservices-computervision
Telepítse az aszinkron modult:
npm install async
Az alkalmazás fájlja
package.json
frissül a függőségekkel.Hozzon létre egy új fájlt, index.js, és nyissa meg egy szövegszerkesztőben.
Illessze be a következő kódot a index.js fájlba.
'use strict'; const async = require('async'); const fs = require('fs'); const https = require('https'); const path = require("path"); const createReadStream = require('fs').createReadStream const sleep = require('util').promisify(setTimeout); const ComputerVisionClient = require('@azure/cognitiveservices-computervision').ComputerVisionClient; const ApiKeyCredentials = require('@azure/ms-rest-js').ApiKeyCredentials; /** * AUTHENTICATE * This single client is used for all examples. */ const key = process.env.VISION_KEY; const endpoint = process.env.VISION_ENDPOINT; const computerVisionClient = new ComputerVisionClient( new ApiKeyCredentials({ inHeader: { 'Ocp-Apim-Subscription-Key': key } }), endpoint); /** * END - Authenticate */ function computerVision() { async.series([ async function () { /** * OCR: READ PRINTED & HANDWRITTEN TEXT WITH THE READ API * Extracts text from images using OCR (optical character recognition). */ console.log('-------------------------------------------------'); console.log('READ PRINTED, HANDWRITTEN TEXT AND PDF'); console.log(); // URL images containing printed and/or handwritten text. // The URL can point to image files (.jpg/.png/.bmp) or multi-page files (.pdf, .tiff). const printedTextSampleURL = 'https://raw.githubusercontent.com/Azure-Samples/cognitive-services-sample-data-files/master/ComputerVision/Images/printed_text.jpg'; // Recognize text in printed image from a URL console.log('Read printed text from URL...', printedTextSampleURL.split('/').pop()); const printedResult = await readTextFromURL(computerVisionClient, printedTextSampleURL); printRecText(printedResult); // Perform read and await the result from URL async function readTextFromURL(client, url) { // To recognize text in a local image, replace client.read() with readTextInStream() as shown: let result = await client.read(url); // Operation ID is last path segment of operationLocation (a URL) let operation = result.operationLocation.split('/').slice(-1)[0]; // Wait for read recognition to complete // result.status is initially undefined, since it's the result of read while (result.status !== "succeeded") { await sleep(1000); result = await client.getReadResult(operation); } return result.analyzeResult.readResults; // Return the first page of result. Replace [0] with the desired page if this is a multi-page file such as .pdf or .tiff. } // Prints all text from Read result function printRecText(readResults) { console.log('Recognized text:'); for (const page in readResults) { if (readResults.length > 1) { console.log(`==== Page: ${page}`); } const result = readResults[page]; if (result.lines.length) { for (const line of result.lines) { console.log(line.words.map(w => w.text).join(' ')); } } else { console.log('No recognized text.'); } } } /** * * Download the specified file in the URL to the current local folder * */ function downloadFilesToLocal(url, localFileName) { return new Promise((resolve, reject) => { console.log('--- Downloading file to local directory from: ' + url); const request = https.request(url, (res) => { if (res.statusCode !== 200) { console.log(`Download sample file failed. Status code: ${res.statusCode}, Message: ${res.statusMessage}`); reject(); } var data = []; res.on('data', (chunk) => { data.push(chunk); }); res.on('end', () => { console.log(' ... Downloaded successfully'); fs.writeFileSync(localFileName, Buffer.concat(data)); resolve(); }); }); request.on('error', function (e) { console.log(e.message); reject(); }); request.end(); }); } /** * END - Recognize Printed & Handwritten Text */ console.log(); console.log('-------------------------------------------------'); console.log('End of quickstart.'); }, function () { return new Promise((resolve) => { resolve(); }) } ], (err) => { throw (err); }); } computerVision();
Választható lépésként tekintse meg az adatok feldolgozásának módját. A legújabb GA-modell explicit megadásához például szerkessze az utasítást az
read
ábrán látható módon. A paraméter kihagyása vagy automatikus használata"latest"
a legújabb GA-modellt használja.let result = await client.read(url,{modelVersion:"2022-04-30"});
Futtassa az alkalmazást a
node
paranccsal a gyorsútmutatós fájlon.node index.js
Hozam
-------------------------------------------------
READ PRINTED, HANDWRITTEN TEXT AND PDF
Read printed text from URL... printed_text.jpg
Recognized text:
Nutrition Facts Amount Per Serving
Serving size: 1 bar (40g)
Serving Per Package: 4
Total Fat 13g
Saturated Fat 1.5g
Amount Per Serving
Trans Fat 0g
Calories 190
Cholesterol 0mg
ories from Fat 110
Sodium 20mg
nt Daily Values are based on Vitamin A 50%
calorie diet.
-------------------------------------------------
End of quickstart.
Az erőforrások eltávolítása
Ha törölni és eltávolítani szeretne egy Azure AI-szolgáltatási előfizetést, törölheti az erőforrást vagy az erőforráscsoportot. Az erőforráscsoport törlése a hozzá társított egyéb erőforrásokat is törli.
Következő lépések
Ebben a rövid útmutatóban megtanulta, hogyan telepítheti az OCR-ügyfélkódtárat, és hogyan használhatja a Read API-t. Ezután további információ az API olvasási funkcióiról.
- AZ OCR áttekintése
- A minta forráskódja a GitHubon található.
Az optikai karakterfelismerési (OCR) REST API-val nyomtatott és kézzel írt szöveget olvashat.
Feljegyzés
Ez a rövid útmutató cURL-parancsokkal hívja meg a REST API-t. A REST API-t programozási nyelv használatával is meghívhatja. A GitHub-mintákat a C#, a Python, a Java és a JavaScript használatával szemlélteti.
Előfeltételek
- Azure-előfizetés – Hozzon létre egyet ingyenesen.
- a cURL telepítve van.
- Egy Azure AI Vision-erőforrás. Az ingyenes tarifacsomag (
F0
) használatával kipróbálhatja a szolgáltatást, és később frissíthet egy fizetős szintre az éles környezetben. - Az alkalmazás azure AI Vision szolgáltatáshoz való csatlakoztatásához létrehozott erőforrás kulcsa és végpontja.
- Az Azure Vision-erőforrás üzembe helyezése után válassza az Ugrás az erőforráshoz lehetőséget.
- A bal oldali navigációs menüben válassza a Kulcsok és végpont lehetőséget.
- Másolja ki az egyik kulcsot és a végpontot a rövid útmutató későbbi részében való használatra.
Nyomtatott és kézzel írt szöveg olvasása
Az optikai karakterfelismerési (OCR) szolgáltatás képes kinyerni egy kép vagy dokumentum látható szövegét, és karakterfolyammá konvertálni. A szövegkinyerésről további információt az OCR áttekintésében talál.
A Read API meghívása
A minta létrehozásához és futtatásához az alábbi lépéseket kell végrehajtania:
Másolja az alábbi parancsot egy szövegszerkesztőbe.
Hajtsa végre a következő módosításokat a parancs megfelelő területein:
- Cserélje le a kulcs értékét
<key>
. - Cserélje le a kérelem URL-címének (
https://westcentralus.api.cognitive.microsoft.com/
) első részét a saját végpont URL-címében lévő szövegre.Feljegyzés
A 2019. július 1. után létrehozott új erőforrások egyéni altartományneveket fognak használni. További információkért és a regionális végpontok teljes listájáért tekintse meg az Azure AI-szolgáltatások egyéni altartományneveit.
- Igény szerint cserélje a kép URL-címét a kérelem törzsében (
https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png
) egy másik elemzendő kép URL-címére.
- Cserélje le a kulcs értékét
Nyisson meg egy parancsablakot.
Illessze be a szövegszerkesztőből a parancsot, majd futtassa.
curl -v -X POST "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyze" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription key>" --data-ascii "{'url':'https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png'}"
A válasz tartalmaz egy Operation-Location
fejlécet, amelynek értéke egy egyedi URL-cím. Ezzel az URL-címvel kérdezheti le az olvasási művelet eredményeit. Az URL-cím 48 órán belül lejár.
Igény szerint adja meg a modell verzióját
Választható lépésként tekintse meg az adatok feldolgozásának módját. Például a legújabb GA-modell explicit megadásához használja model-version=2022-04-30
paraméterként. A paraméter kihagyása vagy automatikus használata model-version=latest
a legújabb GA-modellt használja.
curl -v -X POST "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyze?model-version=2022-04-30" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription key>" --data-ascii "{'url':'https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png'}"
Olvasási eredmények lekérése
Másolja a következő parancsot a szövegszerkesztőbe.
Cserélje le az URL-címet az
Operation-Location
előző eljárásban másolt értékre.Cserélje le a kulcs értékét
<key>
.Nyisson meg egy konzolablakot.
Illessze be a parancsot a szövegszerkesztőből a konzolablakba, majd futtassa a parancsot.
curl -v -X GET "https://westcentralus.api.cognitive.microsoft.com/vision/v3.2/read/analyzeResults/{operationId}" -H "Ocp-Apim-Subscription-Key: {key}" --data-ascii "{body}"
A válasz vizsgálata
A rendszer JSON formátumban adja vissza a sikeres választ. A mintaalkalmazás elemzi és megjeleníti a sikeres választ a konzolablakban, a következő példához hasonló módon:
{
"status": "succeeded",
"createdDateTime": "2021-04-08T21:56:17.6819115+00:00",
"lastUpdatedDateTime": "2021-04-08T21:56:18.4161316+00:00",
"analyzeResult": {
"version": "3.2",
"readResults": [
{
"page": 1,
"angle": 0,
"width": 338,
"height": 479,
"unit": "pixel",
"lines": [
{
"boundingBox": [
25,
14,
318,
14,
318,
59,
25,
59
],
"text": "NOTHING",
"appearance": {
"style": {
"name": "other",
"confidence": 0.971
}
},
"words": [
{
"boundingBox": [
27,
15,
294,
15,
294,
60,
27,
60
],
"text": "NOTHING",
"confidence": 0.994
}
]
}
]
}
]
}
}
Az erőforrások eltávolítása
Ha törölni és eltávolítani szeretne egy Azure AI-szolgáltatási előfizetést, törölheti az erőforrást vagy az erőforráscsoportot. Az erőforráscsoport törlése a hozzá társított egyéb erőforrásokat is törli.
Következő lépések
Ebben a rövid útmutatóban megtanulta, hogyan hívhatja meg a Read REST API-t. Ezután további információ az API olvasási funkcióiról.
Előfeltételek
Azure-előfizetés – Hozzon létre egyet ingyenesen.
Egy Azure AI Vision-erőforrás. Az ingyenes tarifacsomag (
F0
) használatával kipróbálhatja a szolgáltatást, és később frissíthet egy fizetős szintre az éles környezetben.Csatlakozás a Vision Studióhoz.
- Előfordulhat, hogy be kell jelentkeznie.
- A bejelentkezés után válassza az Összes erőforrás megtekintése lehetőséget. Ha szükséges, válassza a Frissítés lehetőséget. Ellenőrizze, hogy az erőforrás elérhető-e.
További információ: A Vision Studio használatának első lépései.
Nyomtatott és kézzel írt szöveg olvasása
Az Optikai karakterfelismerés területen válassza a Szöveg kinyerése képekből lehetőséget.
A Kipróbálás területen nyugtázza, hogy ez a bemutató használatot von maga után az Azure-fiókjában. További információkért tekintse meg az Azure AI Vision díjszabását.
Válasszon egy képet az elérhető készletből, vagy töltse fel a sajátját.
Ha szükséges, válassza a Kérjük, válasszon egy erőforrást az erőforrás kiválasztásához.
A kép kijelölése után a kinyert szöveg megjelenik a kimeneti ablakban. A JSON fülre kattintva megtekintheti az API-hívás által visszaadott JSON-kimenetet.
A kipróbálás élménye alatt a következő lépéseket követve elkezdheti használni ezt a képességet a saját alkalmazásában.
Következő lépések
Ebben a rövid útmutatóban a Vision Studiót használta a Read API eléréséhez. Ezután további információ az API olvasási funkcióiról.