計算機視覺 API

從影像擷取豐富的資訊，以分類和處理視覺資料，並使用此 Azure 認知服務保護使用者免受不需要的內容的侵害。

此連接器適用於以下產品和區域：

服務	Class	Regions
副駕駛工作室	標準	所有 Power Automate 區域
邏輯應用程式	標準	所有 Logic Apps 區域
Power Apps	標準	所有 Power Apps 區域
Power Automate（自動化服務）	標準	所有 Power Automate 區域

連絡人
名稱	Microsoft
URL	Microsoft LogicApps 支援 Microsoft Power Automate 支援 Microsoft Power Apps 支援

連接器中繼資料
Publisher	Microsoft
網站	https://azure.microsoft.com/services/cognitive-services/computer-vision/

若要使用此整合，您需要 Azure 入口網站中的認知服務資源。您將獲得一個端點和一個用於驗證應用程式的金鑰。若要建立連線，請提供帳戶金鑰、網站 URL，然後選取 建立連線。有關連線的營運成本，請在此處深入瞭解。

您現在已準備好開始使用此整合。

已知問題與限制

請注意，作業結果可能會因為基礎認知服務 API 性質而不完整，而該性質是以機器學習和模式辨識為基礎。

與 Microsoft Entra ID 連線

若要建立與 Microsoft Entra ID 的連線，您必須將認知服務使用者角色新增至您的帳戶才能存取。若要使用此連線，您必須將與認知服務資源相關聯的唯一子網域輸入支援作業。

Microsoft Entra ID 驗證不支援的作業

使用 Microsoft Entra ID 驗證時， 僅支援 V3 動作。已取代的動作會繼續與驗證搭配 Access Key 使用， 但如果與 Microsoft Entra ID 連線搭配使用，則會失敗。

正在建立連線

連接器支援下列驗證類型：


API 金鑰	API 金鑰 (ApiKey)	所有區域	可共用
預設值 [已棄用]	此選項僅適用於沒有明確驗證類型的舊連線，並且僅用於回溯相容性。	所有區域	不可共享

API 金鑰

驗證 ID：keyBasedAuth

適用：所有地區

API 金鑰 (ApiKey)

這是可共享的連接。如果 Power App 與其他使用者共用，也會共用連線。如需詳細資訊，請參閱畫布應用程式的連接器概觀 - Power Apps |Microsoft 文件

名稱	類型	Description	為必填項目
帳戶金鑰	securestring	認知服務帳戶金鑰	對
網站 URL	字串	根網站網址（範例： https://westus.api.cognitive.microsoft.com）

預設值 [已棄用]

適用：所有地區

此選項僅適用於沒有明確驗證類型的舊連線，並且僅用於回溯相容性。

這不是可共用的連線。如果 Power App 與其他使用者共用，系統會明確提示其他使用者建立新連線。

名稱	類型	Description	為必填項目
帳戶金鑰	securestring	認知服務帳戶金鑰	對
網站 URL	字串	根網站網址（範例： https://westus.api.cognitive.microsoft.com ）。如果未指定，網站網址將預設為 'https://westus.api.cognitive.microsoft.com'。

節流限制

名稱	呼叫	續約期間
每個連線的 API 呼叫	1200	60 秒

動作

偵測物件（V3）（預覽版）	在提供的影像中產生已偵測物件的清單。
光學字元辨識（OCR）至 JSON （V3）（預覽版）	光學字元辨識（OCR）會偵測影像中的文字，並將辨識的字元擷取到機器可用的 JSON 串流中。
光學字元辨識（OCR）轉 JSON	光學字元辨識（OCR）會偵測影像中的文字，並將辨識的字元擷取到機器可用的 JSON 串流中。
光學字元辨識（OCR）轉文字	光學字元辨識（OCR）偵測影像中的文字，並將辨識的字元擷取到文字檔案中。
光學字元辨識（OCR）轉文字（V3）（預覽版）	光學字元辨識（OCR）偵測影像中的文字，並將辨識的字元擷取到文字檔案中。
分析影像	此作業會根據影像內容擷取一組豐富的視覺特徵。
分析影像（V3）（預覽版）	此作業會根據影像內容擷取一組豐富的視覺特徵。
取得感興趣區域（V3）（預覽版）	傳回影像最重要區域周圍的邊界方塊。
描述圖像	此操作以人類可讀的語言生成具有完整句子的圖像描述。
描述影像 URL （v3）（預覽版）	此作業會以人類可讀的語言產生影像 URL 的描述，其中包含完整的句子。
描述影像（V3）（預覽）	此操作以人類可讀的語言生成具有完整句子的圖像描述。
描述影像內容	此操作以人類可讀的語言生成圖像內容的描述，並帶有完整的句子。
描述影像內容（v3）（預覽版）	此操作以人類可讀的語言生成圖像內容的描述，並帶有完整的句子。
描述影像網址	此作業會以人類可讀的語言產生影像 URL 的描述，其中包含完整的句子。
標籤影像（V3）（預覽）	產生與所提供影像內容相關的單字或標籤清單。
標記圖像	產生與所提供影像內容相關的單字或標籤清單。
檢測物件	在提供的影像中產生已偵測物件的清單。
獲取感興趣的區域	傳回影像最重要區域周圍的邊界方塊。
產生縮圖（V3）（預覽版）	此作業會產生具有使用者指定寬度和高度的縮圖影像。
產生縮圖（Generate Thumbnail）	此作業會產生具有使用者指定寬度和高度的縮圖影像。
識別特定領域內容	識別圖像中的名人或地標。
辨識網域特定內容（v3）（預覽版）	識別圖像中的名人或地標。

偵測物件（V3）（預覽版）

作業識別碼：: DetectObjectsV3

在提供的影像中產生已偵測物件的清單。

參數

名稱	機碼	必要	類型	Description
資源子網域或區域	subdomainName	True	string	Azure 子網域或地理區域（例如 westus）
圖片來源	format	True	string	圖像的來源 - 包含或通過引用 url。
影像	Image	True	dynamic

傳回

身體: DetectResponse

光學字元辨識（OCR）至 JSON （V3）（預覽版）

作業識別碼：: OCRV3

光學字元辨識（OCR）會偵測影像中的文字，並將辨識的字元擷取到機器可用的 JSON 串流中。

參數

名稱	機碼	必要	類型	Description
資源子網域或區域	subdomainName	True	string	Azure 子網域或地理區域（例如 westus）
圖片來源	format	True	string	圖像的來源 - 包含或通過引用 url。
影像	Image	True	dynamic

傳回

JSON 回應: OCRJsonResponse

光學字元辨識（OCR）轉 JSON

作業識別碼：: OCRV2

光學字元辨識（OCR）會偵測影像中的文字，並將辨識的字元擷取到機器可用的 JSON 串流中。

參數

名稱	機碼	必要	類型	Description
圖片來源	format	True	string	圖像的來源 - 包含或通過引用 url。
影像	Image	True	dynamic

傳回

JSON 回應: OCRJsonResponse

光學字元辨識（OCR）轉文字

作業識別碼：: OCRTextV2

光學字元辨識（OCR）偵測影像中的文字，並將辨識的字元擷取到文字檔案中。

參數

名稱	機碼	必要	類型	Description
圖片來源	format	True	string	圖像的來源 - 包含或通過引用 url。
影像	Image	True	dynamic

傳回

身體: OCRTextResponse

光學字元辨識（OCR）轉文字（V3）（預覽版）

作業識別碼：: OCRTextV3

光學字元辨識（OCR）偵測影像中的文字，並將辨識的字元擷取到文字檔案中。

參數

名稱	機碼	必要	類型	Description
資源子網域或區域	subdomainName	True	string	Azure 子網域或地理區域（例如 westus）
圖片來源	format	True	string	圖像的來源 - 包含或通過引用 url。
影像	Image	True	dynamic

傳回

身體: OCRTextResponse

分析影像

作業識別碼：: AnalyzeImageV2

此作業會根據影像內容擷取一組豐富的視覺特徵。

參數

名稱	機碼	必要	類型	Description
語言	language		string	服務會以指定的語言傳回辨識結果。
圖片來源	format	True	string	圖像的來源 - 包含或通過引用 url。
影像	Image	True	dynamic

傳回

身體: AnalyzeResponse

分析影像（V3）（預覽版）

作業識別碼：: AnalyzeImageV3

此作業會根據影像內容擷取一組豐富的視覺特徵。

參數

名稱	機碼	必要	類型	Description
資源子網域或區域	subdomainName	True	string	Azure 子網域或地理區域（例如 westus）
語言	language		string	服務會以指定的語言傳回辨識結果。
圖片來源	format	True	string	圖像的來源 - 包含或通過引用 url。
影像	Image	True	dynamic

傳回

身體: AnalyzeResponse

取得感興趣區域（V3）（預覽版）

作業識別碼：: GetAreaOfInterestV3

傳回影像最重要區域周圍的邊界方塊。

參數

名稱	機碼	必要	類型	Description
資源子網域或區域	subdomainName	True	string	Azure 子網域或地理區域（例如 westus）
圖片來源	format	True	string	圖像的來源 - 包含或通過引用 url。
影像	Image	True	dynamic

傳回

身體: AreaOfInterestResponse

描述圖像

作業識別碼：: DescribeImageV2

此操作以人類可讀的語言生成具有完整句子的圖像描述。

參數

名稱	機碼	必要	類型	Description
最大候選人	maxCandidates		number	要傳回的候選描述數目上限。
語言	language		string	服務會以指定的語言傳回辨識結果。
圖片來源	format	True	string	圖像的來源 - 包含或通過引用 url。
影像	Image	True	dynamic

傳回

身體: DescribeResponse

描述影像 URL （v3）（預覽版）

作業識別碼：: DescribeImageURLV3

此作業會以人類可讀的語言產生影像 URL 的描述，其中包含完整的句子。

參數

名稱	機碼	必要	類型	Description
資源子網域或區域	subdomainName	True	string	Azure 子網域或地理區域（例如 westus）
最大候選人	maxCandidates		number	要傳回的候選描述數目上限。
語言	language		string	服務會以指定的語言傳回辨識結果。
圖像網址	url		url	通過 URL 引用的圖像來源。

傳回

身體: DescribeResponse

描述影像（V3）（預覽）

作業識別碼：: DescribeImageV3

此操作以人類可讀的語言生成具有完整句子的圖像描述。

參數

名稱	機碼	必要	類型	Description
資源子網域或區域	subdomainName	True	string	Azure 子網域或地理區域（例如 westus）
最大候選人	maxCandidates		number	要傳回的候選描述數目上限。
語言	language		string	服務會以指定的語言傳回辨識結果。
圖片來源	format	True	string	圖像的來源 - 包含或通過引用 url。
影像	Image	True	dynamic

傳回

身體: DescribeResponse

描述影像內容

作業識別碼：: DescribeImageContentV2

此操作以人類可讀的語言生成圖像內容的描述，並帶有完整的句子。

參數

名稱	機碼	必要	類型	Description
最大候選人	maxCandidates		number	要傳回的候選描述數目上限。
語言	language		string	服務會以指定的語言傳回辨識結果。
圖片內容	Image	True	binary	正文中圖像參考的來源。

傳回

身體: DescribeResponse

描述影像內容（v3）（預覽版）

作業識別碼：: DescribeImageContentV3

此操作以人類可讀的語言生成圖像內容的描述，並帶有完整的句子。

參數

名稱	機碼	必要	類型	Description
資源子網域或區域	subdomainName	True	string	Azure 子網域或地理區域（例如 westus）
最大候選人	maxCandidates		number	要傳回的候選描述數目上限。
語言	language		string	服務會以指定的語言傳回辨識結果。
圖片內容	Image	True	binary	正文中圖像參考的來源。

傳回

身體: DescribeResponse

描述影像網址

作業識別碼：: DescribeImageURLV2

此作業會以人類可讀的語言產生影像 URL 的描述，其中包含完整的句子。

參數

名稱	機碼	類型	Description
最大候選人	maxCandidates	number	要傳回的候選描述數目上限。
語言	language	string	服務會以指定的語言傳回辨識結果。
圖像網址	url	url	通過 URL 引用的圖像來源。

傳回

身體: DescribeResponse

標籤影像（V3）（預覽）

作業識別碼：: TagImageV3

產生與所提供影像內容相關的單字或標籤清單。

參數

名稱	機碼	必要	類型	Description
資源子網域或區域	subdomainName	True	string	Azure 子網域或地理區域（例如 westus）
圖片來源	format	True	string	圖像的來源 - 包含或通過引用 url。
影像	Image	True	dynamic

傳回

身體: TagResponse

標記圖像

作業識別碼：: TagImageV2

產生與所提供影像內容相關的單字或標籤清單。

參數

名稱	機碼	必要	類型	Description
圖片來源	format	True	string	圖像的來源 - 包含或通過引用 url。
影像	Image	True	dynamic

傳回

身體: TagResponse

檢測物件

作業識別碼：: DetectObjects

在提供的影像中產生已偵測物件的清單。

參數

名稱	機碼	必要	類型	Description
圖片來源	format	True	string	圖像的來源 - 包含或通過引用 url。
影像	Image	True	dynamic

傳回

身體: DetectResponse

獲取感興趣的區域

作業識別碼：: GetAreaOfInterest

傳回影像最重要區域周圍的邊界方塊。

參數

名稱	機碼	必要	類型	Description
圖片來源	format	True	string	圖像的來源 - 包含或通過引用 url。
影像	Image	True	dynamic

傳回

身體: AreaOfInterestResponse

產生縮圖（V3）（預覽版）

作業識別碼：: GetThumbnailV3

此作業會產生具有使用者指定寬度和高度的縮圖影像。

參數

名稱	機碼	必要	類型	Description
資源子網域或區域	subdomainName	True	string	Azure 子網域或地理區域（例如 westus）
縮圖寬度	width	True	number	產生縮圖的寬度 — 建議為 50
縮圖高度	height	True	number	產生縮圖的高度 - 建議為 50
智慧裁切	smartCropping		boolean	啟用智慧裁切的布林旗標
圖片來源	format	True	string	圖像的來源 - 包含或通過引用 url。
影像	Image	True	dynamic

傳回

產生的縮圖影像

縮圖: binary

產生縮圖（Generate Thumbnail）

作業識別碼：: GetThumbnailV2

此作業會產生具有使用者指定寬度和高度的縮圖影像。

參數

名稱	機碼	必要	類型	Description
縮圖寬度	width	True	number	產生縮圖的寬度 — 建議為 50
縮圖高度	height	True	number	產生縮圖的高度 - 建議為 50
智慧裁切	smartCropping		boolean	啟用智慧裁切的布林旗標
圖片來源	format	True	string	圖像的來源 - 包含或通過引用 url。
影像	Image	True	dynamic

傳回

產生的縮圖影像

縮圖: binary

識別特定領域內容

作業識別碼：: RecognizeDomainSpecificContentV2

識別圖像中的名人或地標。

參數

名稱	機碼	必要	類型	Description
網域模型	model	True	string	支援在影像中辨識的特定領域模型。
圖片來源	format	True	string	圖像的來源 - 包含或通過引用 url。
影像	Image	True	dynamic

傳回

身體: DomainModelResponse

辨識網域特定內容（v3）（預覽版）

作業識別碼：: RecognizeDomainSpecificContentV3

識別圖像中的名人或地標。

參數

名稱	機碼	必要	類型	Description
資源子網域或區域	subdomainName	True	string	Azure 子網域或地理區域（例如 westus）
網域模型	model	True	string	支援在影像中辨識的特定領域模型。
圖片來源	format	True	string	圖像的來源 - 包含或通過引用 url。
影像	Image	True	dynamic

傳回

身體: DomainModelResponse

定義

網域模型回應

名稱	路徑	類型	Description
名人	result.celebrities	array of object	形象中公認的名人
名人信心	result.celebrities.confidence	float	對名人形象的置信度評分
名人姓名	result.celebrities.name	string	公認名人的名字
地標	result.landmarks	array of object	圖像中已識別的地標
地標信心	result.landmarks.confidence	float	圖像具有里程碑意義的置信度分數
地標名稱	result.landmarks.name	string	已識別地標的名稱

標籤回應

名稱	路徑	類型	Description
tags	tags	array of object	從圖片分析傳回的標籤集。
標籤信賴度分數	tags.confidence	float	已識別標籤的信賴度分數。
標記名稱	tags.name	string	已識別標籤的名稱。

偵測回應

名稱	路徑	類型	Description
物件	objects	array of object	從圖片分析傳回的物件集。
物件信賴度分數	objects.confidence	float	已識別物件的信賴度分數。
物件名稱	objects.object	string	已識別物件的名稱。

AreaOfInterest回應

OCRJson回應

名稱	路徑	類型	Description
文字語言	language	string	偵測到影像文字的語言。
區域陣列	regions	array of object	傳回的文字區域。

OCRText回應

名稱	路徑	類型	Description
偵測到的文字	text	string	在分析的影像中偵測到的文字

分析回應

名稱	路徑	類型	Description
categories	categories	array of object	從圖像中識別的類別
類別名稱	categories.name	string	從影像中識別的類別名稱
類別置信度分數	categories.score	float	影像類別的信賴度分數
Captions	description.captions	array of object	從影像產生的標題清單
字幕置信度分數	description.captions.confidence	float	影像標題的信賴度分數
標題文字	description.captions.text	string	從圖像生成的文本標題
標籤名稱	description.tags	array of string	標籤名稱的集合。
tags	tags	array of object	使用信賴度分數識別的標籤。
標籤信賴度分數	tags.confidence	float	已識別標籤的信賴度分數。
標記名稱	tags.name	string	已識別標籤的名稱。

描述回應

名稱	路徑	類型	Description
Captions	description.captions	array of object	從影像產生的標題清單
字幕置信度分數	description.captions.confidence	float	影像標題的信賴度分數
標題文字	description.captions.text	string	從圖像生成的文本標題
標籤名稱	description.tags	array of string	標籤名稱的集合。

二進位

這是基本資料類型「二進位」。