会议专题

科技论文的标题识别

科技论文的结构可通过文中的小标题进行分析,但小标题的种类繁多、格式多样,给计算机的识别带来一定的困难。本文在识别有数字标号的标题时,对单纯的数字识别法进行了改进,并提出一种基于特征词的识别法,用于识别没有数字标号的标题。在此基础之上,构建了一个标题识别系统。实验结果表明,该系统能以较高的召回率和正确率有效地识别小标题。

标题识别 结构分析 小标题提取 科技论文

朱海军 张桂平 蔡东风 王炜华

沈阳航空工业学院知识工程中心,辽宁沈阳 110034

国内会议

第九届全国计算语言学学术会议

大连

中文

656-661

2007-08-06(万方平台首次上网日期,不代表论文的发表时间)