【RPA之家UiPath官方教程】数据处理
数据处理
在本课程中,我们将介绍使用三种最常见的数据类型进行数据操作:字符串,列表和字典。
受众:RPA开发人员
学习目标
在本课程结束时,您应该能够:
使用最常见的.NET方法来处理String变量;
使用特定的方法实例化,填充和操作List变量;
使用特定的方法实例化,填充和操作Dictionary变量;
使用UiPath Studio中的RegEx构建器可以简化某些涉及字符串的数据处理方法。
关于本课程
描述
在本课程中,我们将介绍一些最具代表性的操作和数据处理示例。 这些将通过您在工作中会遇到的一些最常见的数据类型进行演示,即:
字符串
Lists
字典
受众:RPA开发人员
课程时间:4小时
完成课程的要求:通过最低80%的分数通过课程测验
先决条件:
基本编程知识
RPA开发人员角色课程简介
变量,数据类型和控制流程
学习目标
在本课程结束时,您将能够在UiPath Studio中执行以下操作:
1使用最常见的.NET方法来处理String变量;
2使用特定的方法实例化,填充和操作List变量;
3使用特定的方法实例化,填充和操作Dictionary变量;
4使用UiPath Studio中的RegEx构建器可以简化某些涉及字符串的数据处理方法。
注意:本课程是使用UiPath Studio 2019.7创建的。 最新的Community Edition版本中的某些元素可能有所不同。
总览
在开始之前,我们先看一些基本概念。
什么是数据操纵?
数据操纵是对数据进行修改,结构化,格式化或排序以促进其使用和增强其管理能力的过程。
我将在哪些业务场景中使用数据操纵?
网站所有者经常采用数据处理方法从其Web服务器日志中提取和查看特定信息。 这样就可以观看他们最受欢迎的页面以及访问量来源。
考虑询问公共财务或法律数据库的过程。 数据处理为信用分析人员提供了仅提取相关数据并在其他文档中使用或与其他来源的信息相关联的方法。
字符串
这些是什么?
字符串是与文本相对应的数据类型。 很难想象不涉及字符串使用的自动化方案。
每当需要捕获,处理,在应用程序之间发送或显示文本时,字符串都会派上用场(除非数据是结构化的,例如表格)。
在哪些业务场景中您最有可能遇到字典?
获取操作状态
从较大的文本部分提取相关片段
向人类用户显示信息
字符串方法
通过使用从VB.Net借用的字符串方法来完成字符串操作。 以下是RPA中最常用的一些方法:
Concat: 连接两个指定对象的字符串表示形式, 表达式:String.Concat(VarName1,VarName2)
Contains: 检查指定的子字符串是否出现在字符串中。 返回true或false, 表达式:VarName.Contains(“文本”)
Format: 将对象的值转换为字符串(并将它们插入另一个文本), 表达式:String.Format(“ {0}是{1}”,VarName1,VarName2)
IndexOf: 返回字符串中字符首次出现的从零开始的索引, 表达式:VarName1.IndexOf(“ a”)
Join: 连接集合中的元素并将其显示为String, 表达式:String.Join(“ |”,CollVarName1)
Replace: 替换字符串中所有出现的子字符串, 表达式:VarName.Replace(“原始”,“已替换”)
Split: 使用给定的分隔符将字符串拆分为子字符串, 表达式:VarName.Split(“ |” c)(index)
Substring: 使用起始索引和长度从字符串中提取子字符串, 表达式:VarName1.Substring(startIndex,length)
Lists
这些是什么?
列表(或List <T>,正如您将遇到的那样)是由相同数据类型(例如字符串或整数)的对象组成的数据结构。 每个对象在列表中都有固定的位置。 因此,可以通过索引对其进行访问。 数组是用于存储多个对象的固定大小的结构,而列表使我们可以添加,插入和删除项。
列表可以存储大量元素-名称,数字,时间坐标等。 列表提供了特定的操作方法,例如:
添加和删除项目
搜索元素
遍历项目(并对每个项目执行某些操作)
排序对象
提取项目并将其转换为其他数据类型。
您最有可能遇到列表的哪些业务场景?
存储需要进行某种配置的项目团队成员的计算机名称
收集并存储符合特定条件的发票数量
跟踪在某个时期内在某个问题上创建的票号;
适用于集合的UiPath方法
可以使用.NET方法或UiPath Studio提供的收集方法来处理列表:
--添加到集合
将项目添加到指定的集合。 它等效于List.Add()。 例如,它可以用于将新名称添加到公司名称列表中。
--从集合中删除
从指定的集合中删除一个项目,并可以输出一个布尔变量,以确认删除操作是否成功。 例如,可以使用此活动从要处理的发票清单中删除发票编号
--存在于集合中
通过输出布尔值作为结果来指示给定集合中是否存在给定项目。 我们可以使用此活动来检查客户列表是否包含特定名称。
--清空集合
清除所有项目的指定集合。 一种可能的用途是在开始新的过程的新阶段之前清空集合,该阶段将再次填充它。
字典
这些是什么?
字典(或字典<TKey,TValue>,就像您将遇到的那样)是(键,值)对的集合,其中键是唯一的。 想一想您手机中的通讯录,其中每个名字都有相应的数据(电话号码,电子邮件)。
实例化变量时,必须选择键和值的数据类型。 词典中的数据类型可以是任何受支持的变量(例如,包括词典)。
与“词典”最相关的操作是:
添加和删除(键,值)对
检索与键关联的值
将新值重新分配给现有键
在哪些业务场景中您最有可能遇到字典?
存储配置详细信息或在整个过程中需要访问的其他信息
存储员工的职称或其他相关信息
存储供应商的银行帐户
使用字典的方法
--初始化
就像在列表示例中一样,字典必须初始化。 在以下示例中,初始化是在“分配”活动中完成的。 但是,您可能还记得“列表”一章,可以在“变量面板”中完成此操作。
--新增
VarName.Add(Key,Value)–将项目添加到现有的Dictionary中。 由于“添加”不返回值,因此请使用“调用代码”活动。
--移除
VarName.Remove(Key)–从字典中删除一项。 可以在“分配”活动中使用。
--检索
VarName.Item(Key)–通过其键返回Dictionary项
VarName.Count –返回字典项数的Int32值
VarName.ContainsKey(Key)–检查具有给定键的项目在Dictionary中是否存在,并返回布尔结果
VarName.TryGetValue(Key,Value)–检查字典中是否存在具有给定键的项目,并返回布尔结果和找到的值
正则表达式构建器
它是什么?
正则表达式(REGEX,或regexp)是一种特定的搜索模式,可用于轻松匹配,定位和管理文本。 但是,创建RegEx表达式可能具有挑战性。
UiPath Studio包含一个RegEx构建器,可简化正则表达式的创建。
RegEx的典型用途包括:
输入验证
字符串解析
数据抓取
字符串操作
我将在哪些业务场景中使用RegEx?
检索遵循特定模式的文本片段,例如:
提取以特定数字开头的电话号码;
即使它们没有遵循特定的模式,也可以从批量文本中收集所有街道名称-其中一些包含“街道”,其他包含“ Rd。”,依此类推。
使用常规的String方法构建相同的表达式将花费更长的时间–例如,RegEx具有预定义的表达式来查找字符串中的所有URL。
UiPath中使用正则表达式构建器的方法:
Matches: 在输入字符串中搜索所有出现的内容,并返回所有成功的匹配项。
IsMath: 指示指定的正则表达式是否在指定的输入字符串中找到匹配项。
Replace: 用指定的替换字符串替换与正则表达式模式匹配的字符串。