【RPA之家UiPath官方教程】PDF自动化
在本课程中,我们将研究PDF文档的类型以及尝试从PDF文档提取数据时可以使用的方法。
受众:RPA开发人员
学习目标
在本课程结束时,您将能够:
安装UiPath PDF活动包;
使用“读取PDF”活动,“带OCR的PDF阅读”活动和“屏幕抓取”向导从PDF提取大文本段;
从PDF文档中提取一条信息;
使用选择器从具有相同布局的多个文件中提取波动值;
使用Anchor Base活动从一系列具有相同结构的PDF文件中提取波动值。
关于本课程
介绍
PDF是共享文档的一种广泛使用的格式。 在本课程中,我们将研究PDF文档的类型以及尝试从PDF文档提取数据时可以使用的方法。 我们还将介绍处理不稳定选择器时使用的anchor base功能。
受众:RPA开发人员
课程时长:90分钟
完成课程的要求:通过最低80%的分数通过课程测验
先决条件:
变量,数据类型和控制流程
数据处理课程
Excel和数据表课程
UI互动课程
选择器课程
项目组织课程
错误和异常处理课程
调试课程
学习目标
在本课程结束时,您应该能够:
1安装UiPath PDF活动包;
2使用“读取PDF”活动,“带OCR的PDF阅读”活动和“屏幕抓取”向导从PDF提取大文本段;
3从PDF文档中提取一条信息;
4使用选择器从具有相同布局的多个文件中提取波动值;
5使用Anchor Base活动从一系列具有相同结构的PDF文件中提取波动值。
注意:本课程是使用UiPath Studio 2018.3。创建的。 最新的Community Edition版本中的某些元素可能有所不同。
注意
在开始使用本课程之前,如果您正在使用Adobe Acrobat Reader,请注意以下几点:
注意1:如果使用Adobe Reader DC Acrobat打开PDF,则可能需要采取一些步骤,才能使用UiPath studio方法提取特定元素。启动Acrobat,然后按Ctrl + K。这将打开“首选项”弹出窗口。从左侧面板的类别中选择“阅读”。验证下拉阅读顺序选项是否设置为Acrobat推荐的选项,“从文档推断阅读顺序(推荐)”,“页面与文档”:应设置为“阅读整个文档”和“在标记文档之前确认” '应取消选中。然后在左侧面板上,单击辅助功能。在“其他辅助功能选项”部分中,如果前两个框尚未选中,请选中它们:“在未指定显式制表符顺序时使用文档结构作为制表符顺序”,“启用辅助技术支持”,然后单击“确定”。
注意2:如果您仍然无法从Acrobat Reader DC打开的PDF文件中提取特定元素,请尝试使用较旧版本的Acrobat DC(任何以18开头的版本都可以使用https://www.adobe.com/devnet- docs / acrobatetk / tools / ReleaseNotesDC / index.html#)。 Acrobat DC在计算机上会自动更新到最新的可用版本。在某些最新版本(从19开始)中,可访问性可能存在问题,Adobe Reader逐渐放弃了对未标记文档的支持。遵循的步骤:
卸载当前版本的Acrobat Reader DC
安装Acrobat Reader DC的基本版本https://www.adobe.com/devnet-docs/acrobatetk/tools/ReleaseNotesDC/continuous/dccontinuous.html#dccontinuous
从18开始的任何版本安装补丁
禁用Adobe Reader自动更新https://www.wintips.org/how-to-disable-automatic-update-in-adobe-reader-dc/