使用Excel中的函数来处理专利分析数据
来源:用户上传
作者:
摘要:本文阐述了在使用excel进行专利分析时,字符截取函数--LEFT、RIGHT、MID函数以及逻辑函数IF函数条件统计函数--COUNTIF和COUNTIFS函数的使用方法和作用。通过使用上述的函数可以快速、批量地进行信息提取和初步处理,可以方便地得到年份-总专利申请量表格、年份-不同国家专利申请量表格、地域-申请量表格等,从而可以快速准确地得到统计结果、绘制可视化图表并形成专利分析报告。
关键词:专利分析;Excel;函数;数据处理
1.绪论
专利分析是目前常用的一种技术情报分析手段,是对专利文献中包含的海量但零碎的信息进行提取、分析、加工等,并利用统计学方法和分析技巧将这些信息转化为具有总揽全局及预测功能的竞争情报,从而为企业的经营者和管理者在技术研究、产品研发和服务开发中的决策提供参考[1]。本文期望通过使用excel来对专利数据库进行批量化处理能够极大地提高专利分析人员的工作效率,并减小因人工处理带来的错误。
2. 专利分析中使用到的函数
2.1信息提取和初步处理过程中的函数
提取出的专利数据库通常都会包含有专利的“标题”、“申请号”、“申请日”“分类号”、“发明人”、“申请人”、“申请人国籍”、“申请人地址”、“专利文献号”等著录项目信息。从专利的著录项目信息中可以提取出每件专利申请的年份、申请国家和专利类型,提取信息时采用字符截取函数--LEFT、RIGHT、MID函数以及逻辑函数IF函数即可实现。
LEFT函数的作用是将单元格从左起开始截取指定的字符数,使用方法为LEFT(位置单元格,截取的字符数)。RIGHT函数的作用是将单元格从右起开始截取指定的字符数,使用方法同LEFT函数。MID函数作用是从单元格中的一个字符串的中间位置开始截取出指定數量的字符。其使用方法为MID(位置单元格,指定的起始位置,截取的字符数)。IF函数可以根据指定的条件来判断其为“真”(TRUE)还是“假”(FALSE),其使用方法为“=IF(条件判断,结果为真时的返回值,结果为假时的返回值)”。
2.2数据统计过程中的函数
专利数据统计通常需要绘制专利申请量趋势图、国家申请量趋势图、地域申请量分布图等,因而需要按照年份或者其它信息对申请的国家、申请年份、申请人等信息进行统计,以先得到年份-总专利申请量表格、年份-不同国家专利申请量表格、地域-申请量表格等。统计方法除了常规使用筛选功能来计数外,还可以直接使用两个条件统计函数--COUNTIF和COUNTIFS函数。
单个条件下的统计使用COUNTIF函数,COUNTIF函数的使用方法为COUNTIF(条件区域,条件)。当要统计多个条件下的量时则要用到COUNTIFS函数,其使用方法为COUNTIFS(第一条件区域,第一条件,第二条件区域,第二条件……),该函数的条件可以为任意多个且没有顺序要求,因而可以进行更加复杂的筛选计数。
在COUNTIF和COUNTIFS中的“条件”中也可以使用通配符来实现模糊查询,即问号(?)和星号(*)。问号匹配任意单个字符,星号匹配任意一系列字符。若要查找实际的问号或星号,请在该字符前键入波形符(~)。另外,COUNTIF和COUNTIFS中的“条件”也可以为引用某个单元格的数据(跨工作表引用还需要加上“工作表名称!”)。值得说明的是,函数在引用单元格时不需要引号,而具体的某个值时必须加上引号。[2]
2.3使用实例
通过关键词和分类号检索得到的专利分析数据样本,其中包括标题、公开号(公告号)、申请号、申请日、申请人、发明人等信息。其中申请日、申请号、公开号/公告号中含有申请年份、申请类型、申请国别的信息。
申请年份和国家代码的提取均需要使用到LEFT函数,申请年份为申请日内容从左边开始起的4位数字,因此函数中“截取的字符数”为4,申请年份在E列,另取一列,在与序号1同行的单元格内键入函数表达式“=LEFT(E2,4)”,然后将该函数表达式复制到同列的其他单元格内。国家代码为公开/公告号从左边开始起两个字符,函数中“截取的字符数”为2,公开/公告号在C列,函数表达式为“=LEFT(C2,2)”。使用LEFT函数还可用于提取申请人地址中前两个字符就可以得到申请人的省份信息,以方便对中国申请的地域进行分析。
使用RIGHT函数提取出中国专利公开/公告号的最后一位,中国专利公开/公告号的最后一位为“A”时表示公开文本,最后一位为“B”时表示授权文本,此时,函数中“截取的字符数”为1,公开/公告号在C列,函数表达式为“=RIGHT(C2,1)”。
要直观地区分专利申请是国内申请还是国外申请,还可以使用逻辑函数,另取一列,输入并复制函数表达式“=IF(LEFT(C2,2)=”CN”,“国内申请”,“国外申请”)”,当C2单元格内容的前两个字母为CN时,则显示为“国内申请”,否则就会显示为“国外申请”。
区分了国内外申请后,可以对中国专利类型进行分析,由于中国专利申请号的从左数第五位数字即标示着专利类型,其中1代表发明、2代表实用新型、3代表外观设计、8代表通过PCT进入我国的发明,9代表通过PCT进入我国的实用新型,因此要获取中国专利的专利类型,只需截取专利申请号的第五位数字即可得知专利申请类型,函数表达式中“指定的起始位置”为5,“截取的字符数”为1,函数表达式为“=MID(D2,5,1)”。
使用IF函数可以直接对中国专利申请的类型进行判断输出,新的申请号编排方式下的公式为“=IF(MID(D2,5,1)="1","发明",IF(MID(D2,5,1)="2","实用新型",IF(MID(D2,5,1)="8","PCT发明",IF(MID(D2,5,1)="9","PCT实用新型",""))))”,该公式使用了嵌套公式的方式直接输出了专利申请的类型。
要统计不同年份的专利申请量时,要统计不同年份的中国的专利申请量时,其函数表达式为“=COUNTIFS(年份列:年份列,"year",国家列:国家列,”CN”)”,其中公式中的year为表示年份的数字。
3.结论
使用excel进行专利分析时,在信息提取和初步处理过程中,通过使用字符截取函数--LEFT、RIGHT、MID函数以及逻辑函数IF函数可以批量地从专利的著录项目信息中可以提取出每件专利申请的年份、申请国家和专利类型等信息。在数据统计的过程中使用条件统计函数--COUNTIF和COUNTIFS函数,可以方便地得到年份-总专利申请量表格、年份-专利申请量-国家表格、年份-专利申请量-技术功效统计表格、地域-申请量表格等。通过使用函数可以加快专利分析的数据处理过程和准确性,方便得到最终可视化图表,形成专利分析报告。
参考文献
[1]唐炜 刘细文.专利分析法及其在企业竞争对手分析中的应用.《现代情报》.2005.9.178~182
[2]Excel Home .《Excel 2010函数与函数表达式实战技巧精粹》.2014-1-1
(作者单位:1国家知识产权局专利局专利审查协作江苏中心;
2苏州知途知识产权代理事务所)
转载注明来源:https://www.xzbu.com/1/view-14738071.htm