文本主题识别研究及应用
文本的主题识别是TDT研究计划的核心任务之一.本文研究了文本主题识别的主要算法,并分析了采用不同的文本特征包括Unigram和NGram可以改善算法的性能.同时,针对现有搜索流程的不足,提出了一个基于主题识别技术的应用模型.最后,在该应用模型的基础上设计并实现了一个原型系统.
主题识别 文本聚类 信息检索
丁秉公 黄昌宁 黄德根
大连理工大学计算机系(大连) 微软亚洲研究院(北京)
国内会议
北京
中文
406-413
2004-08-01(万方平台首次上网日期,不代表论文的发表时间)