ComputerVisionClientOperationsMixin Classe
- Ereditarietà
-
builtins.objectComputerVisionClientOperationsMixin
Costruttore
ComputerVisionClientOperationsMixin()
Metodi
analyze_image |
Questa operazione estrae un set completo di funzionalità visive in base al contenuto dell'immagine. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. All'interno della richiesta è disponibile un parametro facoltativo per consentire di scegliere quali funzionalità restituire. Per impostazione predefinita, le categorie di immagini vengono restituite nella risposta. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male. |
analyze_image_by_domain |
Questa operazione riconosce il contenuto all'interno di un'immagine applicando un modello specifico del dominio. È possibile recuperare l'elenco di modelli specifici del dominio supportati dall'API Visione artificiale usando la richiesta GET /models. Attualmente l'API fornisce modelli specifici del dominio seguenti: celebrità, punti di riferimento. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male. |
analyze_image_by_domain_in_stream |
Questa operazione riconosce il contenuto all'interno di un'immagine applicando un modello specifico del dominio. È possibile recuperare l'elenco di modelli specifici del dominio supportati dall'API Visione artificiale usando la richiesta GET /models. Attualmente l'API fornisce modelli specifici del dominio seguenti: celebrità, punti di riferimento. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male. |
analyze_image_in_stream |
Questa operazione estrae un set completo di funzionalità visive in base al contenuto dell'immagine. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. All'interno della richiesta è disponibile un parametro facoltativo per consentire di scegliere quali funzionalità restituire. Per impostazione predefinita, le categorie di immagini vengono restituite nella risposta. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male. |
describe_image |
Questa operazione genera una descrizione di un'immagine nel linguaggio leggibile umano con frasi complete. La descrizione si basa su una raccolta di tag di contenuto, restituiti anche dall'operazione. È possibile generare più di una descrizione per ogni immagine. Le descrizioni vengono ordinate dal punteggio di attendibilità. Le descrizioni possono includere risultati da modelli di dominio celebrità e punti di riferimento, se applicabile. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male. |
describe_image_in_stream |
Questa operazione genera una descrizione di un'immagine nel linguaggio leggibile umano con frasi complete. La descrizione si basa su una raccolta di tag di contenuto, restituiti anche dall'operazione. È possibile generare più di una descrizione per ogni immagine. Le descrizioni vengono ordinate dal punteggio di attendibilità. Le descrizioni possono includere risultati da modelli di dominio celebrità e punti di riferimento, se applicabile. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male. |
detect_objects |
Esegue il rilevamento degli oggetti nell'immagine specificata. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male. |
detect_objects_in_stream |
Esegue il rilevamento degli oggetti nell'immagine specificata. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male. |
generate_thumbnail |
Questa operazione genera un'immagine di anteprima con la larghezza e l'altezza specificate dall'utente. Per impostazione predefinita il servizio analizza l'immagine, identifica l'area di interesse e genera le coordinate di ritaglio intelligente sulla base dell'area di interesse. Il ritaglio intelligente consente di specificare proporzioni diverse da quella dell'immagine di input. Una risposta con esito positivo contiene il file binario dell'immagine di anteprima. Se la richiesta non è riuscita, la risposta contiene un codice di errore e un messaggio per determinare l'errore. In caso di errore, vengono restituiti il codice di errore e un messaggio di errore. Il codice di errore potrebbe essere uno di InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError. |
generate_thumbnail_in_stream |
Questa operazione genera un'immagine di anteprima con la larghezza e l'altezza specificate dall'utente. Per impostazione predefinita il servizio analizza l'immagine, identifica l'area di interesse e genera le coordinate di ritaglio intelligente sulla base dell'area di interesse. Il ritaglio intelligente consente di specificare proporzioni diverse da quella dell'immagine di input. Una risposta con esito positivo contiene il file binario dell'immagine di anteprima. Se la richiesta non è riuscita, la risposta contiene un codice di errore e un messaggio per determinare l'errore. In caso di errore, vengono restituiti il codice di errore e un messaggio di errore. Il codice di errore potrebbe essere uno di InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError. |
get_area_of_interest |
Questa operazione restituisce un rettangolo di selezione intorno all'area più importante dell'immagine. Verrà restituita una risposta con esito positivo in JSON. Se la richiesta non è riuscita, la risposta contiene un codice di errore e un messaggio per determinare l'errore. In caso di errore, vengono restituiti il codice di errore e un messaggio di errore. Il codice di errore potrebbe essere uno di InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError. |
get_area_of_interest_in_stream |
Questa operazione restituisce un rettangolo di selezione intorno all'area più importante dell'immagine. Verrà restituita una risposta con esito positivo in JSON. Se la richiesta non è riuscita, la risposta contiene un codice di errore e un messaggio per determinare l'errore. In caso di errore, vengono restituiti il codice di errore e un messaggio di errore. Il codice di errore potrebbe essere uno di InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError. |
get_read_result |
Questa interfaccia viene usata per ottenere i risultati OCR dell'operazione di lettura. L'URL di questa interfaccia deve essere recuperato dal campo 'Operation-Location' restituito dall'interfaccia lettura. |
list_models |
Questa operazione restituisce l'elenco di modelli specifici del dominio supportati dall'API Visione artificiale. Attualmente, l'API supporta i modelli specifici del dominio seguenti: riconoscimento di celebrità, riconoscimento dei punti di riferimento. Verrà restituita una risposta con esito positivo in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato storto. |
read |
Usare questa interfaccia per ottenere il risultato di un'operazione di lettura, utilizzando gli algoritmi OCR (Optical Character Recognition) all'avanguardia ottimizzati per i documenti con un numero elevato di testo. Quando si usa l'interfaccia Lettura, la risposta contiene un campo denominato 'Operation-Location'. Il campo 'Operation-Location' contiene l'URL che è necessario usare per l'operazione 'GetReadResult' per accedere ai risultati OCR.. |
read_in_stream |
Usare questa interfaccia per ottenere il risultato di un'operazione di lettura, utilizzando gli algoritmi OCR (Optical Character Recognition) all'avanguardia ottimizzati per i documenti con un numero elevato di testo. Quando si usa l'interfaccia Lettura, la risposta contiene un campo denominato 'Operation-Location'. Il campo 'Operation-Location' contiene l'URL che è necessario usare per l'operazione 'GetReadResult' per accedere ai risultati OCR.. |
recognize_printed_text |
Il riconoscimento ottico dei caratteri rileva il testo in un'immagine ed estrae i caratteri riconosciuti in un flusso di caratteri utilizzabile dal computer. Al termine dell'operazione, verranno restituiti i risultati di OCR. In caso di errore, verrà restituito il codice di errore insieme a un messaggio di errore. Il codice di errore può essere uno di InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage o InternalServerError. |
recognize_printed_text_in_stream |
Il riconoscimento ottico dei caratteri rileva il testo in un'immagine ed estrae i caratteri riconosciuti in un flusso di caratteri utilizzabile dal computer. Al termine dell'operazione, verranno restituiti i risultati di OCR. In caso di errore, verrà restituito il codice di errore insieme a un messaggio di errore. Il codice di errore può essere uno di InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage o InternalServerError. |
tag_image |
Questa operazione genera un elenco di parole o tag rilevanti per il contenuto dell'immagine fornita. L'API Visione artificiale può restituire tag basati su oggetti, esseri viventi, paesaggi o azioni presenti nelle immagini. A differenza delle categorie, i tag non sono organizzati in base a un sistema di classificazione gerarchica, ma corrispondono al contenuto dell'immagine. I tag possono contenere hint per evitare ambiguità o fornire contesto, ad esempio il tag "ascomycete" può essere accompagnato dall'hint "fungo". Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL di immagine. Verrà restituita una risposta con esito positivo in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato storto. |
tag_image_in_stream |
Questa operazione genera un elenco di parole o tag pertinenti al contenuto dell'immagine specificata. L'API Visione artificiale può restituire tag basati su oggetti, esseri viventi, scenari o azioni trovati nelle immagini. A differenza delle categorie, i tag non sono organizzati in base a un sistema di classificazione gerarchico, ma corrispondono al contenuto dell'immagine. I tag possono contenere hint per evitare ambiguità o fornire contesto, ad esempio il tag "ascomycete" può essere accompagnato dall'hint "fungo". Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male. |
analyze_image
Questa operazione estrae un set completo di funzionalità visive in base al contenuto dell'immagine. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. All'interno della richiesta è disponibile un parametro facoltativo per consentire di scegliere quali funzionalità restituire. Per impostazione predefinita, le categorie di immagini vengono restituite nella risposta. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.
analyze_image(url, visual_features=None, details=None, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, **operation_config)
Parametri
- visual_features
- list[str oppure VisualFeatureTypes]
Stringa che indica quali tipi di funzionalità visive restituire. Più valori devono essere separati da virgole. I tipi di funzionalità di visualizzazione validi includono: Categorie: classifica il contenuto dell'immagine in base a una tassonomia definita nella documentazione. Tag: contrassegna l'immagine con un elenco dettagliato di parole correlate al contenuto dell'immagine. Descrizione - descrive il contenuto dell'immagine con una frase in lingua inglese completa. Visi - rileva se sono presenti visi. Se presente, generare coordinate, sesso e età. ImageType - rileva se l'immagine è clipart o un disegno. Colore: determina il colore accentato, il colore dominante e se un'immagine è bianca&. Adulti - rileva se l'immagine è pornografica in natura (mostra nudità o un atto sessuale) o è gory (rappresenta la violenza estrema o il sangue). Viene rilevato anche contenuto sessualmente suggestivo (contenuto aka racy). Oggetti: rileva vari oggetti all'interno di un'immagine, inclusa la posizione approssimativa. L'argomento Objects è disponibile solo in inglese. Marchi: rileva vari marchi all'interno di un'immagine, inclusa la posizione approssimativa. L'argomento Brand è disponibile solo in inglese.
Stringa che indica quali dettagli specifici del dominio restituire. Più valori devono essere separati da virgole. I tipi di funzionalità visive validi includono: celebrità - identifica le celebrità se rilevate nell'immagine, Punti di riferimento - identifica punti di riferimento rilevanti nell'immagine.
- language
- str
Lingua desiderata per la generazione di output. Se questo parametro non è specificato, il valore predefinito è "en". Lingue supportate:en - Inglese, Impostazione predefinita. es - spagnolo, ja - giapponese, pt - portoghese, zh - Cinese semplificato. I valori possibili includono: 'en', 'es', 'ja', 'pt', 'zh'
- description_exclude
- list[str oppure DescriptionExclude]
Disattivare i modelli di dominio specificati durante la generazione della descrizione.
- model_version
- str
Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Le impostazioni predefinite sono "più recenti".
- raw
- bool
restituisce la risposta diretta insieme alla risposta deserializzata
- operation_config
La configurazione dell'operazione esegue l'override.
Restituisce
ImageAnalysis o ClientRawResponse se raw=true
Tipo restituito
Eccezioni
analyze_image_by_domain
Questa operazione riconosce il contenuto all'interno di un'immagine applicando un modello specifico del dominio. È possibile recuperare l'elenco di modelli specifici del dominio supportati dall'API Visione artificiale usando la richiesta GET /models. Attualmente l'API fornisce modelli specifici del dominio seguenti: celebrità, punti di riferimento. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.
analyze_image_by_domain(model, url, language='en', model_version='latest', custom_headers=None, raw=False, **operation_config)
Parametri
- language
- str
Lingua desiderata per la generazione di output. Se questo parametro non è specificato, il valore predefinito è "en". Lingue supportate:en - Inglese, Impostazione predefinita. es - spagnolo, ja - giapponese, pt - portoghese, zh - Cinese semplificato. I valori possibili includono: 'en', 'es', 'ja', 'pt', 'zh'
- model_version
- str
Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Le impostazioni predefinite sono "più recenti".
- raw
- bool
restituisce la risposta diretta insieme alla risposta deserializzata
- operation_config
La configurazione dell'operazione esegue l'override.
Restituisce
DomainModelResults o ClientRawResponse se raw=true
Tipo restituito
Eccezioni
analyze_image_by_domain_in_stream
Questa operazione riconosce il contenuto all'interno di un'immagine applicando un modello specifico del dominio. È possibile recuperare l'elenco di modelli specifici del dominio supportati dall'API Visione artificiale usando la richiesta GET /models. Attualmente l'API fornisce modelli specifici del dominio seguenti: celebrità, punti di riferimento. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.
analyze_image_by_domain_in_stream(model, image, language='en', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametri
- language
- str
Lingua desiderata per la generazione di output. Se questo parametro non è specificato, il valore predefinito è "en". Lingue supportate:en - Inglese, Impostazione predefinita. es - spagnolo, ja - giapponese, pt - portoghese, zh - Cinese semplificato. I valori possibili includono: 'en', 'es', 'ja', 'pt', 'zh'
- model_version
- str
Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Le impostazioni predefinite sono "più recenti".
- raw
- bool
restituisce la risposta diretta insieme alla risposta deserializzata
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Quando specificato, verrà chiamato con ogni blocco di dati trasmessi. Il callback deve accettare due argomenti, i byte del blocco corrente di dati e l'oggetto risposta. Se i dati sono in caricamento, la risposta sarà Nessuna.
- operation_config
La configurazione dell'operazione esegue l'override.
Restituisce
DomainModelResults o ClientRawResponse se raw=true
Tipo restituito
Eccezioni
analyze_image_in_stream
Questa operazione estrae un set completo di funzionalità visive in base al contenuto dell'immagine. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. All'interno della richiesta è disponibile un parametro facoltativo per consentire di scegliere quali funzionalità restituire. Per impostazione predefinita, le categorie di immagini vengono restituite nella risposta. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.
analyze_image_in_stream(image, visual_features=None, details=None, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametri
- visual_features
- list[str oppure VisualFeatureTypes]
Stringa che indica quali tipi di funzionalità visive restituire. Più valori devono essere separati da virgole. I tipi di funzionalità di visualizzazione validi includono: Categorie: classifica il contenuto dell'immagine in base a una tassonomia definita nella documentazione. Tag: contrassegna l'immagine con un elenco dettagliato di parole correlate al contenuto dell'immagine. Descrizione - descrive il contenuto dell'immagine con una frase in lingua inglese completa. Visi - rileva se sono presenti visi. Se presente, generare coordinate, sesso e età. ImageType - rileva se l'immagine è clipart o un disegno. Colore: determina il colore accentato, il colore dominante e se un'immagine è bianca&. Adulti - rileva se l'immagine è pornografica in natura (mostra nudità o un atto sessuale) o è gory (rappresenta la violenza estrema o il sangue). Viene rilevato anche contenuto sessualmente suggestivo (contenuto aka racy). Oggetti: rileva vari oggetti all'interno di un'immagine, inclusa la posizione approssimativa. L'argomento Objects è disponibile solo in inglese. Marchi: rileva vari marchi all'interno di un'immagine, inclusa la posizione approssimativa. L'argomento Brand è disponibile solo in inglese.
Stringa che indica quali dettagli specifici del dominio restituire. Più valori devono essere separati da virgole. I tipi di funzionalità visive validi includono: celebrità - identifica le celebrità se rilevate nell'immagine, Punti di riferimento - identifica punti di riferimento rilevanti nell'immagine.
- language
- str
Lingua desiderata per la generazione di output. Se questo parametro non è specificato, il valore predefinito è "en". Lingue supportate:en - Inglese, Impostazione predefinita. es - spagnolo, ja - giapponese, pt - portoghese, zh - Cinese semplificato. I valori possibili includono: 'en', 'es', 'ja', 'pt', 'zh'
- description_exclude
- list[str oppure DescriptionExclude]
Disattivare i modelli di dominio specificati durante la generazione della descrizione.
- model_version
- str
Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Le impostazioni predefinite sono "più recenti".
- raw
- bool
restituisce la risposta diretta insieme alla risposta deserializzata
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Quando specificato, verrà chiamato con ogni blocco di dati trasmessi. Il callback deve accettare due argomenti, i byte del blocco corrente di dati e l'oggetto risposta. Se i dati sono in caricamento, la risposta sarà Nessuna.
- operation_config
La configurazione dell'operazione esegue l'override.
Restituisce
ImageAnalysis o ClientRawResponse se raw=true
Tipo restituito
Eccezioni
describe_image
Questa operazione genera una descrizione di un'immagine nel linguaggio leggibile umano con frasi complete. La descrizione si basa su una raccolta di tag di contenuto, restituiti anche dall'operazione. È possibile generare più di una descrizione per ogni immagine. Le descrizioni vengono ordinate dal punteggio di attendibilità. Le descrizioni possono includere risultati da modelli di dominio celebrità e punti di riferimento, se applicabile. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.
describe_image(url, max_candidates=1, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, **operation_config)
Parametri
- max_candidates
- int
Numero massimo di descrizioni dei candidati da restituire. Il valore predefinito è 1.
- language
- str
Lingua desiderata per la generazione di output. Se questo parametro non è specificato, il valore predefinito è "en". Lingue supportate:en - Inglese, Impostazione predefinita. es - spagnolo, ja - giapponese, pt - portoghese, zh - Cinese semplificato. I valori possibili includono: 'en', 'es', 'ja', 'pt', 'zh'
- description_exclude
- list[str oppure DescriptionExclude]
Disattivare i modelli di dominio specificati durante la generazione della descrizione.
- model_version
- str
Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Le impostazioni predefinite sono "più recenti".
- raw
- bool
restituisce la risposta diretta insieme alla risposta deserializzata
- operation_config
La configurazione dell'operazione esegue l'override.
Restituisce
ImageDescription o ClientRawResponse se raw=true
Tipo restituito
Eccezioni
describe_image_in_stream
Questa operazione genera una descrizione di un'immagine nel linguaggio leggibile umano con frasi complete. La descrizione si basa su una raccolta di tag di contenuto, restituiti anche dall'operazione. È possibile generare più di una descrizione per ogni immagine. Le descrizioni vengono ordinate dal punteggio di attendibilità. Le descrizioni possono includere risultati da modelli di dominio celebrità e punti di riferimento, se applicabile. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.
describe_image_in_stream(image, max_candidates=1, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametri
- max_candidates
- int
Numero massimo di descrizioni dei candidati da restituire. Il valore predefinito è 1.
- language
- str
Lingua desiderata per la generazione di output. Se questo parametro non è specificato, il valore predefinito è "en". Lingue supportate:en - Inglese, Impostazione predefinita. es - spagnolo, ja - giapponese, pt - portoghese, zh - Cinese semplificato. I valori possibili includono: 'en', 'es', 'ja', 'pt', 'zh'
- description_exclude
- list[str oppure DescriptionExclude]
Disattivare i modelli di dominio specificati durante la generazione della descrizione.
- model_version
- str
Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Le impostazioni predefinite sono "più recenti".
- raw
- bool
restituisce la risposta diretta insieme alla risposta deserializzata
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Quando specificato, verrà chiamato con ogni blocco di dati trasmessi. Il callback deve accettare due argomenti, i byte del blocco corrente di dati e l'oggetto risposta. Se i dati sono in caricamento, la risposta sarà Nessuna.
- operation_config
La configurazione dell'operazione esegue l'override.
Restituisce
ImageDescription o ClientRawResponse se raw=true
Tipo restituito
Eccezioni
detect_objects
Esegue il rilevamento degli oggetti nell'immagine specificata. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.
detect_objects(url, model_version='latest', custom_headers=None, raw=False, **operation_config)
Parametri
- model_version
- str
Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Le impostazioni predefinite sono "più recenti".
- raw
- bool
restituisce la risposta diretta insieme alla risposta deserializzata
- operation_config
La configurazione dell'operazione esegue l'override.
Restituisce
DetectResult o ClientRawResponse se raw=true
Tipo restituito
Eccezioni
detect_objects_in_stream
Esegue il rilevamento degli oggetti nell'immagine specificata. Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.
detect_objects_in_stream(image, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametri
- model_version
- str
Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Le impostazioni predefinite sono "più recenti".
- raw
- bool
restituisce la risposta diretta insieme alla risposta deserializzata
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Quando specificato, verrà chiamato con ogni blocco di dati trasmessi. Il callback deve accettare due argomenti, i byte del blocco corrente di dati e l'oggetto risposta. Se i dati sono in caricamento, la risposta sarà Nessuna.
- operation_config
La configurazione dell'operazione esegue l'override.
Restituisce
DetectResult o ClientRawResponse se raw=true
Tipo restituito
Eccezioni
generate_thumbnail
Questa operazione genera un'immagine di anteprima con la larghezza e l'altezza specificate dall'utente. Per impostazione predefinita il servizio analizza l'immagine, identifica l'area di interesse e genera le coordinate di ritaglio intelligente sulla base dell'area di interesse. Il ritaglio intelligente consente di specificare proporzioni diverse da quella dell'immagine di input. Una risposta con esito positivo contiene il file binario dell'immagine di anteprima. Se la richiesta non è riuscita, la risposta contiene un codice di errore e un messaggio per determinare l'errore. In caso di errore, vengono restituiti il codice di errore e un messaggio di errore. Il codice di errore potrebbe essere uno di InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError.
generate_thumbnail(width, height, url, smart_cropping=False, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametri
- width
- int
Larghezza dell'anteprima, in pixel. Deve essere compreso tra 1 e 1024. Minimo consigliato 50.
- height
- int
Altezza dell'anteprima, in pixel. Deve essere compreso tra 1 e 1024. Minimo consigliato 50.
- model_version
- str
Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Il valore predefinito è "latest".
- raw
- bool
restituisce la risposta diretta insieme alla risposta deserializzata
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Se specificato, verrà chiamato con ogni blocco di dati trasmessi. Il callback deve accettare due argomenti, i byte del blocco di dati corrente e l'oggetto risposta. Se i dati sono in corso di caricamento, la risposta sarà Nessuno.
- operation_config
Override della configurazione dell'operazione.
Restituisce
object o ClientRawResponse if raw=true
Tipo restituito
Eccezioni
generate_thumbnail_in_stream
Questa operazione genera un'immagine di anteprima con la larghezza e l'altezza specificate dall'utente. Per impostazione predefinita il servizio analizza l'immagine, identifica l'area di interesse e genera le coordinate di ritaglio intelligente sulla base dell'area di interesse. Il ritaglio intelligente consente di specificare proporzioni diverse da quella dell'immagine di input. Una risposta con esito positivo contiene il file binario dell'immagine di anteprima. Se la richiesta non è riuscita, la risposta contiene un codice di errore e un messaggio per determinare l'errore. In caso di errore, vengono restituiti il codice di errore e un messaggio di errore. Il codice di errore potrebbe essere uno di InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError.
generate_thumbnail_in_stream(width, height, image, smart_cropping=False, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametri
- width
- int
Larghezza dell'anteprima, in pixel. Deve essere compreso tra 1 e 1024. Minimo consigliato 50.
- height
- int
Altezza dell'anteprima, in pixel. Deve essere compreso tra 1 e 1024. Minimo consigliato 50.
- model_version
- str
Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Il valore predefinito è "latest".
- raw
- bool
restituisce la risposta diretta insieme alla risposta deserializzata
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Se specificato, verrà chiamato con ogni blocco di dati trasmessi. Il callback deve accettare due argomenti, i byte del blocco di dati corrente e l'oggetto risposta. Se i dati sono in corso di caricamento, la risposta sarà Nessuno.
- operation_config
Override della configurazione dell'operazione.
Restituisce
object o ClientRawResponse if raw=true
Tipo restituito
Eccezioni
get_area_of_interest
Questa operazione restituisce un rettangolo di selezione intorno all'area più importante dell'immagine. Verrà restituita una risposta con esito positivo in JSON. Se la richiesta non è riuscita, la risposta contiene un codice di errore e un messaggio per determinare l'errore. In caso di errore, vengono restituiti il codice di errore e un messaggio di errore. Il codice di errore potrebbe essere uno di InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError.
get_area_of_interest(url, model_version='latest', custom_headers=None, raw=False, **operation_config)
Parametri
- model_version
- str
Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Il valore predefinito è "latest".
- raw
- bool
restituisce la risposta diretta insieme alla risposta deserializzata
- operation_config
Override della configurazione dell'operazione.
Restituisce
AreaOfInterestResult o ClientRawResponse se raw=true
Tipo restituito
Eccezioni
get_area_of_interest_in_stream
Questa operazione restituisce un rettangolo di selezione intorno all'area più importante dell'immagine. Verrà restituita una risposta con esito positivo in JSON. Se la richiesta non è riuscita, la risposta contiene un codice di errore e un messaggio per determinare l'errore. In caso di errore, vengono restituiti il codice di errore e un messaggio di errore. Il codice di errore potrebbe essere uno di InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError.
get_area_of_interest_in_stream(image, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametri
- model_version
- str
Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Il valore predefinito è "latest".
- raw
- bool
restituisce la risposta diretta insieme alla risposta deserializzata
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Se specificato, verrà chiamato con ogni blocco di dati trasmessi. Il callback deve accettare due argomenti, i byte del blocco di dati corrente e l'oggetto risposta. Se i dati sono in corso di caricamento, la risposta sarà Nessuno.
- operation_config
Override della configurazione dell'operazione.
Restituisce
AreaOfInterestResult o ClientRawResponse se raw=true
Tipo restituito
Eccezioni
get_read_result
Questa interfaccia viene usata per ottenere i risultati OCR dell'operazione di lettura. L'URL di questa interfaccia deve essere recuperato dal campo 'Operation-Location' restituito dall'interfaccia lettura.
get_read_result(operation_id, custom_headers=None, raw=False, **operation_config)
Parametri
- operation_id
- str
ID dell'operazione di lettura restituita nella risposta dell'interfaccia 'Read'.
- raw
- bool
restituisce la risposta diretta insieme alla risposta deserializzata
- operation_config
Override della configurazione dell'operazione.
Restituisce
ReadOperationResult o ClientRawResponse se raw=true
Tipo restituito
Eccezioni
list_models
Questa operazione restituisce l'elenco di modelli specifici del dominio supportati dall'API Visione artificiale. Attualmente, l'API supporta i modelli specifici del dominio seguenti: riconoscimento di celebrità, riconoscimento dei punti di riferimento. Verrà restituita una risposta con esito positivo in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato storto.
list_models(custom_headers=None, raw=False, **operation_config)
Parametri
- raw
- bool
restituisce la risposta diretta insieme alla risposta deserializzata
- operation_config
Override della configurazione dell'operazione.
Restituisce
ListModelsResult o ClientRawResponse se raw=true
Tipo restituito
Eccezioni
read
Usare questa interfaccia per ottenere il risultato di un'operazione di lettura, utilizzando gli algoritmi OCR (Optical Character Recognition) all'avanguardia ottimizzati per i documenti con un numero elevato di testo. Quando si usa l'interfaccia Lettura, la risposta contiene un campo denominato 'Operation-Location'. Il campo 'Operation-Location' contiene l'URL che è necessario usare per l'operazione 'GetReadResult' per accedere ai risultati OCR..
read(url, language=None, pages=None, model_version='latest', reading_order='basic', custom_headers=None, raw=False, **operation_config)
Parametri
- language
- str oppure OcrDetectionLanguage
Codice della lingua BCP-47 del testo nel documento. Read supporta l'identificazione automatica della lingua e i documenti in più lingue, quindi fornire solo un codice linguistico se si desidera forzare l'elaborazione del documento in tale lingua specifica. Per l'elenco delle lingue supportate, vedere https://aka.ms/ocr-languages . I valori possibili includono: 'af', 'ast', 'bi', 'br', 'ca', 'ceb', 'ch', 'co', 'crh', 'cs', 'cs', 'da', 'de', 'en', 'es', 'et', 'eu', 'fi', 'fil', 'fj', 'fr', 'fur', 'fy', 'ga', 'gd', 'gil', 'gl', 'gv', 'hni', 'hsb', 'ht', 'hu', 'ia', 'id', 'it', 'iu', 'ja', 'jv', 'kaa', 'kac', 'kac 'kea', 'kha', 'kl', 'ko', 'ku', 'kw', 'lb', 'ms', 'mww', 'nap', 'nl', 'no', 'oc', 'oc', 'pl', 'pt', 'quc', 'rm', 'sco', 'sl', 'sq', 'sv', 'sw', 'tet', 'tr', 'tt', 'uz', 'vo', 'wae', 'yua', 'za', 'zh-Hans', 'zh-Hant', 'zu'
Numeri di pagina personalizzati per documenti a più pagine (PDF/TIFF), immettere il numero delle pagine che si desidera ottenere il risultato OCR. Per un intervallo di pagine, usare un trattino. Separare ogni pagina o intervallo con una virgola.
- model_version
- str
Parametro facoltativo per specificare la versione del modello OCR usato per l'estrazione di testo. I valori accettati sono: "latest", "latest-preview", "2021-04-12". Il valore predefinito è "latest".
- reading_order
- str
Parametro facoltativo per specificare l'algoritmo di ordine di lettura da applicare durante l'ordinamento degli elementi di testo di estrazione. Può essere "di base" o "naturale". L'impostazione predefinita è 'basic' se non specificata
- raw
- bool
restituisce la risposta diretta insieme alla risposta deserializzata
- operation_config
Override della configurazione dell'operazione.
Restituisce
Nessuno o ClientRawResponse se raw=true
Tipo restituito
Eccezioni
read_in_stream
Usare questa interfaccia per ottenere il risultato di un'operazione di lettura, utilizzando gli algoritmi OCR (Optical Character Recognition) all'avanguardia ottimizzati per i documenti con un numero elevato di testo. Quando si usa l'interfaccia Lettura, la risposta contiene un campo denominato 'Operation-Location'. Il campo 'Operation-Location' contiene l'URL che è necessario usare per l'operazione 'GetReadResult' per accedere ai risultati OCR..
read_in_stream(image, language=None, pages=None, model_version='latest', reading_order='basic', custom_headers=None, raw=False, callback=None, **operation_config)
Parametri
- language
- str oppure OcrDetectionLanguage
Codice della lingua BCP-47 del testo nel documento. Read supporta l'identificazione automatica della lingua e i documenti in più lingue, quindi fornire solo un codice linguistico se si desidera forzare l'elaborazione del documento in tale lingua specifica. Per l'elenco delle lingue supportate, vedere https://aka.ms/ocr-languages . I valori possibili includono: 'af', 'ast', 'bi', 'br', 'ca', 'ceb', 'ch', 'co', 'crh', 'cs', 'cs', 'da', 'de', 'en', 'es', 'et', 'eu', 'fi', 'fil', 'fj', 'fr', 'fur', 'fy', 'ga', 'gd', 'gil', 'gl', 'gv', 'hni', 'hsb', 'ht', 'hu', 'ia', 'id', 'it', 'iu', 'ja', 'jv', 'kaa', 'kac', 'kac 'kea', 'kha', 'kl', 'ko', 'ku', 'kw', 'lb', 'ms', 'mww', 'nap', 'nl', 'no', 'oc', 'oc', 'pl', 'pt', 'quc', 'rm', 'sco', 'sl', 'sq', 'sv', 'sw', 'tet', 'tr', 'tt', 'uz', 'vo', 'wae', 'yua', 'za', 'zh-Hans', 'zh-Hant', 'zu'
Numeri di pagina personalizzati per documenti a più pagine (PDF/TIFF), immettere il numero delle pagine che si desidera ottenere il risultato OCR. Per un intervallo di pagine, usare un trattino. Separare ogni pagina o intervallo con una virgola.
- model_version
- str
Parametro facoltativo per specificare la versione del modello OCR usato per l'estrazione di testo. I valori accettati sono: "latest", "latest-preview", "2021-04-12". Il valore predefinito è "latest".
- reading_order
- str
Parametro facoltativo per specificare l'algoritmo di ordine di lettura da applicare durante l'ordinamento degli elementi di testo di estrazione. Può essere "di base" o "naturale". L'impostazione predefinita è 'basic' se non specificata
- raw
- bool
restituisce la risposta diretta insieme alla risposta deserializzata
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Se specificato, verrà chiamato con ogni blocco di dati trasmessi. Il callback deve accettare due argomenti, i byte del blocco di dati corrente e l'oggetto risposta. Se i dati sono in corso di caricamento, la risposta sarà Nessuno.
- operation_config
Override della configurazione dell'operazione.
Restituisce
Nessuno o ClientRawResponse se raw=true
Tipo restituito
Eccezioni
recognize_printed_text
Il riconoscimento ottico dei caratteri rileva il testo in un'immagine ed estrae i caratteri riconosciuti in un flusso di caratteri utilizzabile dal computer. Al termine dell'operazione, verranno restituiti i risultati di OCR. In caso di errore, verrà restituito il codice di errore insieme a un messaggio di errore. Il codice di errore può essere uno di InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage o InternalServerError.
recognize_printed_text(url, detect_orientation=True, language='unk', model_version='latest', custom_headers=None, raw=False, **operation_config)
Parametri
- detect_orientation
- bool
Indica se rilevare l'orientamento del testo nell'immagine. Con detectOrientation=true, il servizio OCR tenta di rilevare l'orientamento dell'immagine e correggerlo prima di un'ulteriore elaborazione, ad esempio se è capovolto.
- language
- str oppure OcrLanguages
Codice linguistico BCP-47 del testo da rilevare nell'immagine. Il valore predefinito è 'unk'. I valori possibili includono: 'unk', 'zh-Hans', 'zh-Hant', 'cs', 'da', 'nl', 'en', 'fi', 'fr', 'de', 'el', 'hu', 'it', 'ja', 'ko', 'nb', 'pl', 'pt', 'ru', 'es', 'sv', 'tr', 'ar', 'ro', 'sr-Cyrl', 'sr-Latn', 'sk'
- model_version
- str
Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Il valore predefinito è "latest".
- raw
- bool
restituisce la risposta diretta insieme alla risposta deserializzata
- operation_config
Override della configurazione dell'operazione.
Restituisce
OcrResult o ClientRawResponse se raw=true
Tipo restituito
Eccezioni
recognize_printed_text_in_stream
Il riconoscimento ottico dei caratteri rileva il testo in un'immagine ed estrae i caratteri riconosciuti in un flusso di caratteri utilizzabile dal computer. Al termine dell'operazione, verranno restituiti i risultati di OCR. In caso di errore, verrà restituito il codice di errore insieme a un messaggio di errore. Il codice di errore può essere uno di InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage o InternalServerError.
recognize_printed_text_in_stream(image, detect_orientation=True, language='unk', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametri
- detect_orientation
- bool
Indica se rilevare l'orientamento del testo nell'immagine. Con detectOrientation=true, il servizio OCR tenta di rilevare l'orientamento dell'immagine e correggerlo prima di un'ulteriore elaborazione, ad esempio se è capovolto.
- language
- str oppure OcrLanguages
Codice linguistico BCP-47 del testo da rilevare nell'immagine. Il valore predefinito è 'unk'. I valori possibili includono: 'unk', 'zh-Hans', 'zh-Hant', 'cs', 'da', 'nl', 'en', 'fi', 'fr', 'de', 'el', 'hu', 'it', 'ja', 'ko', 'nb', 'pl', 'pt', 'ru', 'es', 'sv', 'tr', 'ar', 'ro', 'sr-Cyrl', 'sr-Latn', 'sk'
- model_version
- str
Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Il valore predefinito è "latest".
- raw
- bool
restituisce la risposta diretta insieme alla risposta deserializzata
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Se specificato, verrà chiamato con ogni blocco di dati trasmessi. Il callback deve accettare due argomenti, i byte del blocco di dati corrente e l'oggetto risposta. Se i dati sono in corso di caricamento, la risposta sarà Nessuno.
- operation_config
Override della configurazione dell'operazione.
Restituisce
OcrResult o ClientRawResponse se raw=true
Tipo restituito
Eccezioni
tag_image
Questa operazione genera un elenco di parole o tag rilevanti per il contenuto dell'immagine fornita. L'API Visione artificiale può restituire tag basati su oggetti, esseri viventi, paesaggi o azioni presenti nelle immagini. A differenza delle categorie, i tag non sono organizzati in base a un sistema di classificazione gerarchica, ma corrispondono al contenuto dell'immagine. I tag possono contenere hint per evitare ambiguità o fornire contesto, ad esempio il tag "ascomycete" può essere accompagnato dall'hint "fungo". Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL di immagine. Verrà restituita una risposta con esito positivo in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato storto.
tag_image(url, language='en', model_version='latest', custom_headers=None, raw=False, **operation_config)
Parametri
- language
- str
Lingua desiderata per la generazione di output. Se questo parametro non viene specificato, il valore predefinito è "en". Lingue supportate:en - Inglese, Impostazione predefinita. es - spagnolo, ja - giapponese, pt - portoghese, zh - cinese semplificato. I valori possibili includono: 'en', 'es', 'ja', 'pt', 'zh'
- model_version
- str
Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Il valore predefinito è "latest".
- raw
- bool
restituisce la risposta diretta insieme alla risposta deserializzata
- operation_config
Override della configurazione dell'operazione.
Restituisce
TagResult o ClientRawResponse se raw=true
Tipo restituito
Eccezioni
tag_image_in_stream
Questa operazione genera un elenco di parole o tag pertinenti al contenuto dell'immagine specificata. L'API Visione artificiale può restituire tag basati su oggetti, esseri viventi, scenari o azioni trovati nelle immagini. A differenza delle categorie, i tag non sono organizzati in base a un sistema di classificazione gerarchico, ma corrispondono al contenuto dell'immagine. I tag possono contenere hint per evitare ambiguità o fornire contesto, ad esempio il tag "ascomycete" può essere accompagnato dall'hint "fungo". Sono supportati due metodi di input: (1) Caricamento di un'immagine o (2) che specifica un URL immagine. Verrà restituita una risposta riuscita in JSON. Se la richiesta non è riuscita, la risposta conterrà un codice di errore e un messaggio per comprendere cosa è andato male.
tag_image_in_stream(image, language='en', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametri
- language
- str
Lingua desiderata per la generazione di output. Se questo parametro non viene specificato, il valore predefinito è "en". Lingue supportate:en - Inglese, Impostazione predefinita. es - spagnolo, ja - giapponese, pt - portoghese, zh - cinese semplificato. I valori possibili includono: 'en', 'es', 'ja', 'pt', 'zh'
- model_version
- str
Parametro facoltativo per specificare la versione del modello di intelligenza artificiale. I valori accettati sono: "latest", "2021-04-01". Le impostazioni predefinite sono "più recenti".
- raw
- bool
restituisce la risposta diretta insieme alla risposta deserializzata
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Quando specificato, verrà chiamato con ogni blocco di dati trasmessi. Il callback deve accettare due argomenti, i byte del blocco corrente di dati e l'oggetto risposta. Se i dati sono in caricamento, la risposta sarà Nessuna.
- operation_config
La configurazione dell'operazione esegue l'override.
Restituisce
TagResult o ClientRawResponse se raw=true
Tipo restituito
Eccezioni
Azure SDK for Python