文字辨識預建模型

文字辨識預建模型可從文件和影像中,將文字擷取到電腦可讀取的字元資料流。 其使用最先進的光學字元辨識 (OCR) 來偵測影像中的印刷與手寫文字。

此模型會處理影像與文件檔案,以擷取印刷或手寫文字的行。

在 Power Apps 中使用

您可以透過文字辨識器元件,在 Power Apps 中使用文字辨識預建模型。 其他資訊:在 Power Apps 中使用文字辨識器元件

在 Power Automate 中使用

如需如何在 Power Automate 中使用此模型的資訊,請參閱在 Power Automate 中使用文字辨識預建模型

支援的語言、格式和大小

您可以使用文字辨識模型掃描的檔案須具備下列特性:

  • 列印文字的語言:南非荷蘭文、阿爾巴尼亞文、安吉卡文 (天城文)、阿拉伯文、阿斯圖里亞斯文、阿瓦迪印地文 (天城文)、阿塞拜疆文 (拉丁文)、巴格利文、巴斯克文、白俄羅斯文 (斯拉夫文)、白俄羅斯文 (拉丁文)、博傑普里-印地文 (天城文)、比斯拉馬文、博多文 (梵文)、波士尼亞文 (拉丁文)、布拉傑巴文、布列塔尼文、保加利亞文、本德利文、布里亞特文 (斯拉夫文)、加泰羅尼亞文、宿霧文、查姆林文、查莫羅文、恰蒂斯加爾文 (梵文)、中文 (簡體)、中文 (繁體)、康沃爾文、科西嘉文、克里米亞韃靼文 (拉丁文)、克羅地亞文、捷克文、丹麥文、達里文、狄摩文 (天城文)、多格里文 (天城文)、荷蘭文、英文、厄爾茲亞文 (斯拉夫文)、愛沙尼亞文、法羅文、斐濟文、菲律賓文、芬蘭文、法文、弗留利文、加告茲文 (拉丁文)、加利西亞文、德文、吉爾伯特文、貢迪文 (天城文)、格陵蘭文、古隆文 (天城文)、海地克里奧爾文、哈爾比文 (天城文)、哈尼文、哈里揚維文、夏威夷文、印地文、苗族文 (拉丁文)、霍文 (天城文)、匈牙利文、冰島文、伊納里文薩米文、印度尼西亞文、國際文、因紐特文 (拉丁文)、愛爾蘭文、意大利文、日文、瀛薩里文 (天城文)、爪哇文、卡布威爾第文、克欽文 (拉丁文)、Kangri (天城文)、卡拉恰伊-巴爾卡爾文,卡拉卡爾帕克文 (斯拉夫文)、卡拉卡爾帕克文 (拉丁文)、卡舒比文、哈薩克文 (斯拉夫文)、哈薩克文 (拉丁文)、哈林文、卡西文、基切文、韓文、科爾庫文、科里亞克文、科斯拉伊文、 庫梅克文 (斯拉夫文)、庫德文 (阿拉伯文)、庫德文 (拉丁文)、庫魯克文 (梵文)、吉爾吉斯文 (斯拉夫文)、拉科塔文、拉丁文、立陶宛文、下索布文、盧勒薩米文、盧森堡文、馬哈蘇帕哈里 (梵文)、馬來文 (拉丁文)、馬耳他文、馬爾托文 (德瓦納吉里文)、馬恩島文、毛利文、馬拉地文、蒙古文 (斯拉夫文)、黑山文 (斯拉夫文)、黑山文 (拉丁文)、那不勒斯文、尼泊爾文、紐埃文、諾蓋文、北薩米文 (拉丁文)、挪威文、奧克西唐文、奧塞梯文、普什圖文、波斯文、波蘭文、葡萄牙文、旁遮普文 (阿拉伯文)、利普里亞文、羅馬尼亞文、羅曼什文、俄文、薩德里文 (天城文)、薩摩亞文 (拉丁文)、梵文 (天城文)、桑塔利文 (天城文)、蘇格蘭文、蘇格蘭蓋爾文、塞爾維亞文 (拉丁文)、夏爾巴文 (天城文)、西爾毛里文 (天城文)、斯科爾特薩米文、斯洛伐克文、斯洛文尼亞文、索馬里文 (阿拉伯文)、南薩米文、西班牙文、斯瓦希里文 (拉丁文)、瑞典文、塔吉克文 (斯拉夫文)、韃靼文 (拉丁文)、德頓文、唐米文、東加文、土耳其文、土庫曼文 (拉丁文)、圖瓦文、上索布文、烏爾都文、維吾爾文 (阿拉伯文)、烏茲別克文 (阿拉伯文)、烏茲別克文 (斯拉夫文)、烏茲別克文 (拉丁文)、沃拉普克文、瓦爾澤文、威爾士文、西弗里斯蘭文、尤卡特克瑪雅文、壯文、祖魯文
  • 手寫文字的語言:英文、中文 (簡體)、法文、德文、意大利文、日文、韓文、葡萄牙文、西班牙文
  • 格式
    • JPG
    • PNG
    • BMP
    • PDF
  • 大小:最大 20 MB
  • 對於 PDF 文件,僅處理前 2,000 頁。

模型輸出

如果偵測到文件,文字辨識模型會輸出下列資訊:

  • 結果:從輸入文字擷取的行清單。
  • 文字:包含偵測到的文字行的字串。
  • BoundingBox:代表週框方塊的四個值,使用頂部和左側位置及其寬度與高度描述。

限制

目的 限制 更新期間
文字辨識呼叫 (每個環境) 480 60 秒鐘

另請參閱

訓練:使用 AI Builder 辨識文字 (課程模組)