会议专题

文本主题识别研究及应用

文本的主题识别是TDT研究计划的核心任务之一.本文研究了文本主题识别的主要算法,并分析了采用不同的文本特征包括Unigram和NGram可以改善算法的性能.同时,针对现有搜索流程的不足,提出了一个基于主题识别技术的应用模型.最后,在该应用模型的基础上设计并实现了一个原型系统.

主题识别 文本聚类 信息检索

丁秉公 黄昌宁 黄德根

大连理工大学计算机系(大连) 微软亚洲研究院(北京)

国内会议

第二届全国学生计算语言学研讨会

北京

中文

406-413

2004-08-01(万方平台首次上网日期,不代表论文的发表时间)