营养物质 - PDF OCR

使用营养文档转换器 OCR作将扫描的文档和图像转换为可搜索的可编辑 PDF。使用高级光学字符识别（OCR）技术从 PDF 无缝提取文本，以便编制索引、自动化和内容分析。

此连接器在以下产品和区域中可用：

服务	Class	区域
Copilot Studio	高级	除以下各项外的所有 Power Automate 区域： - 美国政府（GCC） - 美国政府（GCC High） - 由世纪互联运营的中国云 - 美国国防部（DoD）
逻辑应用程序	标准	除以下各项外的所有逻辑应用区域： - Azure 政府区域 - Azure 中国区域 - 美国国防部（DoD）
Power Apps	高级	除以下各项外的所有 Power Apps 区域： - 美国政府（GCC） - 美国政府（GCC High） - 由世纪互联运营的中国云 - 美国国防部（DoD）
Power Automate	高级	除以下各项外的所有 Power Automate 区域： - 美国政府（GCC） - 美国政府（GCC High） - 由世纪互联运营的中国云 - 美国国防部（DoD）

联系人
Name	营养（前穆希姆比）支持
URL	https://support.nutrient.io/hc/en-us/requests/new
Email	support+low-code@nutrient.io

连接器元数据
发布者	穆希姆比交易作为营养物质
网站	https://www.nutrient.io/low-code/
隐私策略	https://www.nutrient.io/legal/privacy/
类别	协作;内容和文件

对图像和扫描的文档执行 OCR

使用营养文档转换器通过 REST API 或自承载服务器库对图像和扫描的文件运行光学字符识别（OCR）。

OCR 功能

将图像、扫描和传真转换为可搜索的 PDF。
生成用于文本提取和 PDF 可搜索性的自动化文档工作流。

集成选项

将 OCR 功能与首选语言中的代码示例集成：

先决条件

若要使用营养文档转换器，需要一个免费或试用帐户。请参阅比较指南，了解这些帐户类型之间的差异。

入门指南

按照以下步骤开始使用营养文档转换器连接器：

通过填写此表单注册 30 天试用版。
提交表单后，将收到一封电子邮件，其中包含试用激活详细信息。
有关过程的演练，请参阅入门视频。
有关详细说明，请阅读适用于 Power Automate 的文档转换器指南。
了解 Power Automate 和逻辑应用教程，了解实际示例。

已知问题和限制

由于安全限制，无法处理受 IRM、DRM、RMS 或 AIP 解决方案保护的文档。

有关问题或帮助，请联系我们的支持团队。

限制

名称	调用	续订期
每个连接的 API 调用数	100	60 秒

操作

使用 OCR 提取文本	使用 OCR 从 PDF 文件中提取文本
转换为 OCRed PDF	对现有 PDF 文档或图像执行 OCR 以创建可搜索的 PDF

使用 OCR 提取文本

操作 ID:: ocr_text

使用 OCR 从 PDF 文件中提取文本

参数

名称	密钥	必需	类型	说明
源文件名称	source_file_name	True	string	源文件的名称，包括扩展名
源文件内容	source_file_content	True	byte	文件内容到 OCR
语言	language		enum	语言
X 坐标	x		string	X 坐标（以 Pts 为单位，1/72 英寸）
Y 坐标	y		string	Y 坐标（以磅为单位，1/72 英寸）
宽度	width		string	OCR 区域的宽度（以 Pts 为单位，1/72 英寸）
高度	height		string	OCR 区域的高度（在 Pts 中，1/72 英寸）
页码	page_number		string	页码（将空白保留至 OCR 所有页面）
Performance	performance		enum	性能（）
黑名单/允许列表	characters_option		enum	“字符”选项
字符数	characters		string	将字符加入黑名单或允许列表
使用分页	paginate		boolean	标页数
出错导致失败	fail_on_error		boolean	出错导致失败

OCRText作的响应数据

Body: ocr_operation_response

转换为 OCRed PDF

操作 ID:: ocr_pdf

对现有 PDF 文档或图像执行 OCR 以创建可搜索的 PDF

参数

名称	密钥	必需	类型	说明
源文件名称	source_file_name	True	string	源文件的名称，包括扩展名
源文件内容	source_file_content	True	byte	文件内容到 OCR
语言	language		enum	语言
Performance	performance		enum	Performance
黑名单/允许列表	characters_option		enum	“字符”选项
字符数	characters		string	将字符加入黑名单或允许列表
使用分页	paginate		boolean	标页数
区域	regions		string	将区域限制为 OCR 到一个或多个特定区域
出错导致失败	fail_on_error		boolean	出错导致失败

所有作的响应数据

Body: operation_response

定义

ocr_operation_response

OCRText作的响应数据

名称	路径	类型	说明
Out text	out_text	string	以纯文本提取的 OCRed 文本。
基文件名	base_file_name	string	没有扩展名的输入文件的名称。
结果代码	result_code	enum	作结果代码。
结果详细信息	result_details	string	作结果详细信息。

operation_response

所有作的响应数据

名称	路径	类型	说明
处理的文件内容	processed_file_content	byte	Muhimbi 转换器生成的文件。
基文件名	base_file_name	string	没有扩展名的输入文件的名称。
结果代码	result_code	enum	作结果代码。
结果详细信息	result_details	string	作结果详细信息。

通过

参数

返回

参数

返回