会议专题

基于文本挖掘技术的技术层面专利组合分析方法优化--以药物专利数据为例

在分析技术层面专利组合分析方法的基础上,对技术层面专利组合分析方法进行优化.以某生物制药企业专利数据为例,采用文本挖掘技术,通过技术领域标签抽取、专利文本特征表示、专利文本聚类等流程,对专利文本所属技术领域进行划分.采用层次聚类算法中自底向上的凝聚方法,开始将每项专利作为单独的一个组,逐次合并相近的专利对象或专利组,直到所有的专利组合并为一个组,最后利用层次聚类谱系图将聚类过程及聚类结果表示出来。从层次聚类谱系图中可以看到专利文本被聚类成若干专利组团,每个组团即可代表一种技术领域,利用层次聚类谱系图可以更加科学客观的将专利划分为若干技术领域。解决了原专利组合分析方法中由于利用IPC号和专家访谈法作为技术领域的划分方法容易出现偏差的缺点.

专利组合分析法 标签抽取 偏差控制 文本挖掘

张世玉 王伟

吉林大学公共卫生学院医学信息学系,吉林 长春 130021

国内会议

第十三届全国医药信息学大会(CIMA2015)、第三届中国护理信息学大会(CNI2015)暨第十六届中日韩医药信息学联合学术会议(CJKMI2015)

上海

中文

16-20

2015-11-11(万方平台首次上网日期,不代表论文的发表时间)