基于本体视图的特征项抽取方法研究
文本特征项抽取是提取文本语义信息的一项重要基础,但通常采取的用字、词作为特征项的显著缺点是无法表达文本的语义信息;另外,在检索过程中,一个文本也可能对应多个检索需求,针对此,本文在基于本体的智能检索框架中引入本体视图,提出一种基于本体视图的特征项抽取方法,通过利用中文信息结构抽取器对文本进行特征抽取,并进行类型映射,得到可计算的特征项。该方法比单纯的词汇信息更能体现概念信息特征,能提高检索系统的性能,提高检索的准确率和效率。
本体视图 特征项抽取 智能检索 文本语义信息 中文信息结构抽取器
胡金柱 陈俊平 卢丽君 赵东萌 张琮 王益维
华中师范大学计算机科学系 湖北 武汉 430079
国内会议
第二十二届中国(天津)”2008IT、网络、信息技术、电子、仪器仪表创新学术会议
天津
中文
135-139
2008-09-01(万方平台首次上网日期,不代表论文的发表时间)