欢迎光临散文网 会员登陆 & 注册

浅读检索--《“位置算符”在专利信息检索中的应用》

2022-10-09 00:09 作者:黑娃-专利检索  | 我要投稿

我的公众号原文链接:https://mp.weixin.qq.com/s/QC7tdK6pHsMfyZR9rROzpQ

本文浅读的对象,为期刊“中国科技信息”2020 年第 18 期中的检索相关文章,作者为来自国家知识产权局专利局专利审查协作北京中心的职秀娟。以下浅读、分析等均仅代表本人观点,不代表作者职秀娟观点。如有其他理解欢迎交流。


《专利审查与专利分析中的检索策略》主要阐述了,如何根据关键词之间的位置关系,并利用位置算符进行位置检索。


很多人检索都是用免费数据库,而大多数的免费数据库都没有位置算符,因此我先简单介绍一下何为“位置算符”。我平时不叫它位置算符,我更习惯说“邻近算符”、“同句算符”、“同段算符”等。举个例子(黑马数据库):

图片

这里要注意的是,每个数据库都有自己表达算符的方式,我们在一个数据库看到的算符表达方式通常不可照搬进另一数据库进行理解或直接输入检索,一般需要有一个检索式转换的过程。我这里以黑马数据库举例,一方面因为这是我近期惯用的数据库,另一方面是因为黑马这些算符和审查员S系统、国知局检索系统里的逻辑是基本一致的。我们根据这张图便可以理解审查员在检索报告中呈现的检索式的具体含义。由上图可见,位置算符和布尔算符中的and在功能上比较类似,都是用于连接前后关键词或关键词集合。不同在于连接关键词或关键词集合时所限定的其间相隔的字数/单词数的范围:1)布尔算符and限定前后关键词或关键词集合可出现在全文任意位置,并不限定其间相隔的字数/单词数。2)临近算符W、D限定前后关键词或关键词集合其间相隔的字数/单词数,且W进一步限定前后的固定顺序。3)同句算符S、同段算符P限定前后关键词或关键词集合可出现在同一句或同一段中,并不限定其间相隔的字数/单词数,但同句以句号为约束,同段以段落终止为约束。同字段算符因为不常用就不介绍了,一般来说临近算符和同句同段算符已经够用,这一块有需要的可以自行了解。
用位置算符替代本可用于连接的布尔算符and,连接关键词或关键词集合构建的检索就叫位置检索。
那么如何理解作者说的,“采用“位置算符”进行检索时,不仅仅要提取关键词,还要提取关键词之间的位置关系,并采用“邻近算符”或者“同在算符”表达关键词之间的相互远近关系[1]”?

先用文中的检索式举例,稍稍解读一下:“(皮带 2D 抽油机) AND (皮带 S 悬绳器 S (板 OR 杆) S 连接)[1]”1)从位置上初步解读:皮带和抽油机前后间隔两个字或单词,且皮带、悬绳器、板/杆、连接这四个词出现在一个句中。
2)结合检索思路解读:皮带抽油机是技术领域,而其相关或等同表达还至少包括皮带式抽油机、皮带塔式抽油机,如果仅看这两个并发散至其他可能情况,那么用2D连接的确比较合适,当然这里为了保险起见,3D、4D也并无不可,如此紧密的联系并不会带来太多噪音,但同句就未必合适了,因为其可预期的噪音就至少包括“抽油机具有XXX性质的皮带结构”,“抽油机,其具有XXX的皮带”;检索对象的主要技术方案就是通过刚性连接件连接皮带端板和悬绳器。基于结构描述的需要,皮带、悬绳器、板/杆这三者是前后顺序且直接连接的,在描述以板/杆连接时几乎必然需要提到前后位置的两个结构,因此这三个关键词出现在同一个句中的可能性很大,当然这不排除其他情况,但是查准就是首拼大概率。那这里一定需要用到“连接”这个词么,也不一定,这个词其实有点宽泛,普适性强于个性,我觉得可以不用。要注意的是,“板/杆”在很多机械结构中,也是普适性强于个性的,不到必须的时候一定要慎用。
经过以上解读可以看到,经过对检索对象的分析后,并最好结合现有技术的一定了解后,用位置算符可以较精确的表达“我们心中所想的目标文件的样子”。这就像是在做翻译工作,不同的是,用处理后的关键词、关键词集合及位置算符来翻译假设的目标文件时,需要先考虑目标文件的各种可能表达。

还是用上述文中的例子来说明:1)“皮带抽油机”的可能表达:皮带抽油机;
皮带式抽油机;
皮带塔式抽油机。
基于有限的举例,判断间隔字数/单词数大致不超过2,因此可用2D连接,但保险起见可上浮1~2个字数/单词数,于是“皮带抽油机”经翻译后的检索式可以为“皮带 2D/3D/4D 抽油机”。具体检索时再看是否需要调整算符的紧密程度。2)“通过刚性连接件连接皮带端板和悬绳器”的可能表达:通过刚性连接件连接皮带端板和悬绳器;通过板/杆连接皮带端板和悬绳器;通过板/杆连接悬绳器和皮带端板;皮带端板和悬绳器之间以板/杆连接;悬绳器和皮带端板之间以板/杆连接;皮带端板通过板/杆连接到悬绳器;悬绳器通过板/杆连接到皮带端板;皮带端板和悬绳器固定连接,连接物为板/杆。基于有限的举例,判断皮带、悬绳器、板/杆、连接这四个关键词/关键词集合之间前后位置关系并不固定,间隔字数/单词数也很难预估,但基于连接关系的表达需要,它们大概率出现在同一句中,于是“通过刚性连接件连接皮带端板和悬绳器”经翻译后的检索式可以为“皮带 S 悬绳器 S (板 OR 杆) S 连接”。具体检索时再看是否需要调整算符的紧密程度。

黑娃

许利民,思博论坛ID“黑娃”

1)景毅检索分析团队负责人、思博论坛版主及检索讲师;

2)知识产权师、检索分析师;

3)擅长无效检索、侵权检索、稳定性检索、公众意见检索、查新检索,有丰富的涉诉无效检索经验,已经手包括化工机械、医疗器械、电商产品、注塑机械等在内的许多领域专利检索;

4)有对企业、代理机构及高校的专利检索培训经验

图片


浅读检索--《“位置算符”在专利信息检索中的应用》的评论 (共 条)

分享到微博请遵守国家法律