Partilhar via


Atualizar de Read v2.x para Read v3.x

Este guia mostra como atualizar seu contêiner existente ou o código da API na nuvem de Read v2.x para Read v3.x.

Determinar o caminho da API

Use a tabela a seguir para determinar a cadeia de caracteres de versão no caminho da API com base na versão Read 3.x para a qual você está migrando.

Tipo de produto Versão Cadeia de caracteres de versão no caminho da API 3.x
Serviço Ler 3.0, 3.1 ou 3.2 v3.0, v3.1 ou v3.2 , respetivamente
Serviço Ler 3.2 pré-visualização v3.2-pré-visualização.1
Contentor Ler pré-visualização 3.0 ou Ler 3.1 pré-visualização v3.0 ou v3.1-preview.2 respectivamente

Em seguida, use as seções a seguir para restringir suas operações e substituir a cadeia de caracteres de versão no caminho da API pelo valor da tabela. Por exemplo, para as versões de nuvem e contêiner Read v3.2 preview , atualize o caminho da API para https://{endpoint}/vision/v3.2-preview.1/read/analyze[?language].

Serviço/Contentor

Batch Read File

Ler 2.x Ler 3.x
https://{endpoint}/vision/v2.0/read/core/asyncBatchAnalyze https://{endpoint}/vision/<version string>/read/analyze[?language]

Um novo parâmetro de idioma opcional está disponível. Se não souber o idioma do seu documento, ou se este for multilingue, não o inclua.

Get Read Results

Ler 2.x Ler 3.x
https://{endpoint}/vision/v2.0/read/operations/{operationId} https://{endpoint}/vision/<version string>/read/analyzeResults/{operationId}

Get Read Operation Result sinalizador de status

Quando a chamada para Get Read Operation Result é bem-sucedida, ela retorna um campo de cadeia de status no corpo JSON.

Ler 2.x Ler 3.x
"NotStarted" "notStarted"
"Running" "running"
"Failed" "failed"
"Succeeded" "succeeded"

Resposta da API (JSON)

Observe as seguintes alterações no json:

  • Na v2.x, Get Read Operation Result retornará o reconhecimento de OCR json quando o status for Succeeded". Na v3.0, este campo é succeeded.
  • Para obter a raiz para a matriz de páginas, altere a hierarquia json de recognitionResults para analyzeResult/readResults. A hierarquia json de linha e palavras por página permanece inalterada, portanto, nenhuma alteração de código é necessária.
  • O ângulo clockwiseOrientation da página foi renomeado para angle e o intervalo foi alterado de 0 - 360 graus para -180 a 180 graus. Dependendo do seu código, você pode ou não ter que fazer alterações, pois a maioria das funções matemáticas pode lidar com qualquer intervalo.

A API v3.0 também apresenta as seguintes melhorias que você pode usar opcionalmente:

  • createdDateTime e lastUpdatedDateTime são adicionados para que você possa acompanhar a duração do processamento.
  • version informa a versão da API usada para gerar resultados
  • Foi acrescentado um por palavra confidence . Esse valor é calibrado para que um valor de 0,95 signifique que há 95% de chance de o reconhecimento estar correto. A pontuação de confiança pode ser usada para selecionar qual texto enviar para a revisão humana.

Em 2.X, o formato de saída é o seguinte:

{
    {
    "status": "Succeeded",
    "recognitionResults": [
        {
        "page": 1,
        "language": "en",
        "clockwiseOrientation": 349.59,
        "width": 2661,
        "height": 1901,
        "unit": "pixel",
        "lines": [
            {
            "boundingBox": [
                67,
                646,
                2582,
                713,
                2580,
                876,
                67,
                821
            ],
            "text": "The quick brown fox jumps",
            "words": [
                {
                "boundingBox": [
                    143,
                    650,
                    435,
                    661,
                    436,
                    823,
                    144,
                    824
                ],
                "text": "The",
                },
        // The rest of result is omitted for brevity 
            
}

Na v3.0, foi ajustado:

{
    {
    "status": "succeeded",
    "createdDateTime": "2020-05-28T05:13:21Z",
    "lastUpdatedDateTime": "2020-05-28T05:13:22Z",
    "analyzeResult": {
    "version": "3.0.0",
    "readResults": [
        {
        "page": 1,
        "language": "en",
        "angle": 0.8551,
        "width": 2661,
        "height": 1901,
        "unit": "pixel",
        "lines": [
            {
            "boundingBox": [
                67,
                646,
                2582,
                713,
                2580,
                876,
                67,
                821
            ],
            "text": "The quick brown fox jumps",
            "words": [
                {
                "boundingBox": [
                    143,
                    650,
                    435,
                    661,
                    436,
                    823,
                    144,
                    824
                ],
                "text": "The",
                "confidence": 0.958
                },
// The rest of result is omitted for brevity 
    
}

Apenas serviço na nuvem

Recognize Text

Recognize Text é uma operação de visualização que está sendo preterida em todas as versões da API do Azure AI Vision. Você deve migrar de Recognize Text para Read (v3.0) ou Batch Read File (v2.0, v2.1). v3.0 de inclui modelos mais novos e melhores para reconhecimento de Read texto e outros recursos, por isso é recomendado. Para atualizar de Recognize Text para Read:

Reconhecer texto 2.x Ler 3.x
https://{endpoint}/vision/v2.0/recognizeText[?mode] https://{endpoint}/vision/<version string>/read/analyze[?language]

O parâmetro mode não é suportado no Read. Tanto o texto manuscrito como o impresso serão automaticamente suportados.

Um novo parâmetro de idioma opcional está disponível na v3.0. Se não souber o idioma do seu documento, ou se este for multilingue, não o inclua.

Get Recognize Text Operation Result

Reconhecer texto 2.x Ler 3.x
https://{endpoint}/vision/v2.0/textOperations/{operationId} https://{endpoint}/vision/<version string>/read/analyzeResults/{operationId}

Get Recognize Text Operation Result Sinalizadores de status

Quando a chamada para Get Recognize Text Operation Result é bem-sucedida, ela retorna um campo de cadeia de status no corpo JSON.

Reconhecer texto 2.x Ler 3.x
"NotStarted" "notStarted"
"Running" "running"
"Failed" "failed"
"Succeeded" "succeeded"

Resposta da API (JSON)

Observe as seguintes alterações no json:

  • Na v2.x, Get Read Operation Result retornará o reconhecimento de OCR json quando o status for Succeeded. Na v3.x, este campo é succeeded.
  • Para obter a raiz para a matriz de páginas, altere a hierarquia json de recognitionResult para analyzeResult/readResults. A hierarquia json de linha e palavras por página permanece inalterada, portanto, nenhuma alteração de código é necessária.

A API v3.0 também apresenta as seguintes melhorias que você pode usar opcionalmente. Consulte a referência da API para obter mais detalhes:

  • createdDateTime e lastUpdatedDateTime são adicionados para que você possa acompanhar a duração do processamento.
  • version informa a versão da API usada para gerar resultados
  • Foi acrescentado um por palavra confidence . Esse valor é calibrado para que um valor de 0,95 signifique que há 95% de chance de o reconhecimento estar correto. A pontuação de confiança pode ser usada para selecionar qual texto enviar para a revisão humana.
  • angle orientação geral do texto no sentido horário, medida em graus entre (-180, 180).
  • width e "height" fornece as dimensões do documento e "unit" fornece a unidade dessas dimensões (pixels ou polegadas, dependendo do tipo de documento).
  • page Documentos de várias páginas são suportados
  • languageo idioma de entrada do documento (a partir do parâmetro de idioma opcional.)

Em 2.X, o formato de saída é o seguinte:

{
    {
    "status": "Succeeded",
    "recognitionResult": [
        {
        "lines": [
            {
            "boundingBox": [
                67,
                646,
                2582,
                713,
                2580,
                876,
                67,
                821
            ],
            "text": "The quick brown fox jumps",
            "words": [
                {
                "boundingBox": [
                    143,
                    650,
                    435,
                    661,
                    436,
                    823,
                    144,
                    824
                ],
                "text": "The",
                },
// The rest of result is omitted for brevity 
        
}

Na v3.x, foi ajustado:

{
    {
    "status": "succeeded",
    "createdDateTime": "2020-05-28T05:13:21Z",
    "lastUpdatedDateTime": "2020-05-28T05:13:22Z",
    "analyzeResult": {
    "version": "3.0.0",
    "readResults": [
        {
        "page": 1,
        "angle": 0.8551,
        "width": 2661,
        "height": 1901,
        "unit": "pixel",
        "lines": [
            {
            "boundingBox": [
                67,
                646,
                2582,
                713,
                2580,
                876,
                67,
                821
            ],
            "text": "The quick brown fox jumps",
            "words": [
                {
                "boundingBox": [
                    143,
                    650,
                    435,
                    661,
                    436,
                    823,
                    144,
                    824
                ],
                "text": "The",
                "confidence": 0.958
                },
// The rest of result is omitted for brevity 
    
}

Apenas contentor

Synchronous Read

Ler 2.0 Ler 3.x
https://{endpoint}/vision/v2.0/read/core/Analyze https://{endpoint}/vision/<version string>/read/syncAnalyze[?language]