您好, 访客   登录/注册

信息检索领域检索策略研究

来源:用户上传      作者:

  摘 要 信息检索领域文献量巨大,在实际检索中可能出现关键词难扩展、检索时噪声很大的问题。本文从CPC分类号检索、关键词扩展、非专利库检索等方面总结常规检索技巧,从多种途径提高检索效率,同时以3个案例具体分析以上策略在检索中的运用。
  关键词 信息检索 策略 效率
  一、引言
  为了快速命中对比文件,不同检索策略的总结有利于提高检索效率,例如,关键词不易扩展时,与IPC相比,CPC分类细分更加精细,能更好地表达检索要素,降低噪声,[1]而针对高校申请,在非专利库的检索变得尤为重要和有效,网络载体的非专利信息如论坛等,以及期刊论文均提供大量技术信息。[2]可见,有效运用检索策略提高检索效率是十分必要的。
  二、检索策略总结
  (一)利用CPC分类号和关键词进行检索
  充分理解申请文件之后,考虑该案件是更适合关键词检索还是分类号检索。了解CPC分类号检索的特点,与IPC相比,CPC分类更加精细,能更好地表达检索要素,降低噪声。[1]重视CPC分类号的检索,在准确确定CPC分类号的基础上,结合主要关键词进行检索,提高检索效率和准确性。
  (二)充分理解发明扩展关键词进行检索
  从权利要求和说明书中提取关键词是常用的关键词扩展方式,而对于一些申请,权利要求和说明书中均未有合适的关键词进行检索,在充分理解发明后,可利用专业知识以及对发明的理解扩展关键词进行检索,提高检索效率。
  (三)非专利库检索
  从发明构思提取出的关键词进行检索,重视对非专利文献的檢索,合理利用非专利资源,如IEEE、ACM等;借助互联网搜索功能,如Google、百度等,充分运用非专利资源,进而提高检索效率。
  三、检索实例
  以上对相关检索策略进行了总结,下面分别采用3个实际案例具体分析对应检索策略在检索中的运用。
  (一)案例一:利用CPC分类号和关键词进行检索
  1.权利要求。一种照片查找方法,应用于移动终端,其特征在于:接收用户通过查询信息查询照片的操作请求,所述查询信息包括位置信息、时间信息和类别信息中的至少一种信息;判断带有预设标签的待选择照片中是否存在与所述查询信息匹配的目标照片;若存在与所述查询信息匹配的所述目标照片,则显示所述目标照片。
  2.检索过程。第一,确定CPC分类号:通过信息检索技术领域G06F17/30下CPC查找,其中CPC分类号G06F17/30256涉及使用从图像数据库中自动获取图像内容特征的组合进行检索,体现本申请发明点。第二,构造有效检索式:G06F17/30256/CPC and(位置or地点or时间or类别or分类)。第三,可快速命中对比文件X:CN 104572905A(一种照片索引创建方法及照片搜索方法及装置)。
  (二)案例二:充分理解发明扩展关键词进行检索
  1.权利要求1。一种视频图像数据文件中关键区域信息的存储方法,包括以下步骤:第一,获得视频图像数据文件中关键区域的坐标信息。第二,将所述关键区域的坐标信息转换为位图。第三,将所述关键区域的位图作为索引数据进行存储。
  2.检索过程。第一,充分理解发明扩展关键词:发明点为位图+索引,充分理解发明发现,而申请文件中对位图的表达比较单一,通过直接检索没有检索到合适对比文件,通过分析实际方案实质可知,将坐标信息转换为位图实质是用关键区域的坐标信息对所述区块进行标识,将包含关键区域的区块标记为“1”,不包含的标记为“0”,得到关键区域位图。关键词扩展:位图—“二进制”、“0/1”。第二,构造检索式:(视频s(图像or图片))and((位图or二进制or0/1)s索引)。第三,得到对比文件1:CN101303701A(视频检索方法及装置),公开了发明点即位图+索引的存储及检索方式。
  (三)案例三:非专利库检索
  1.权利要求1。一种基于语义共鸣色彩的数据可视化方法,包括以下步骤:第一,设定一组待分配颜色的物品名词作为词汇集,根据名词的关键词获取与其相关的图片集。第二,选取合适的调色板,该调色板包括待分配颜色的物品的所有颜色。第三,产生图片并集中每幅图片的颜色直方图,根据颜色直方图中色彩的分布情况,获取调色板中的颜色在颜色直方图中出现的概率。第四,根据调色板中颜色之间的辨识度和在颜色直方图中出现的概率,将调色板中的颜色分配到词汇集中的待分配颜色的物品上,形成关键词-颜色对并显示。
  2.检索过程。本申请是一件大学申请,首先在非专利库中追踪发明人本人论文,未发现相关文献,然后转入谷歌学术,对于检索关键词的选择,说明书中申请人给出一些和申请内容相关的关键词,如“语义共鸣色”(Semantically Resonant Color)、得到每一对“颜色-词汇”组合的“共鸣分数”(Affinity Score),在谷歌学术中优先采用Semantically Resonant Color、Affinity Score进行检索,找到合适的英文对比文件,公开了本发明的发明点。
  四、结语
  在信息检索领域,应针对不同的方案制定相应的检索策略,缩小检索范围,有效地降低检索噪声,提高检索效率。总而言之,检索是一个长期积累的过程,在平常的审查过程中,要积极总结和运用不同的检索策略,多角度地开展检索工作,进一步提高检索水平和审查质量。
  (作者单位为国家知识产权局专利局专利审查协作湖北中心)
  参考文献
  [1] 王伟,等.图像领域G06K9/00的CPC分类研究[J].电视技术,2014(Z2):195-196.
  [2] 苏余鹏,等.专利检索中的非专利信息检索[J].中国科技信息,2018(10):26-27.
转载注明来源:https://www.xzbu.com/3/view-14950878.htm