一种运用相容语义块约简的网络话题检测方法
针对已有基于词聚类的话题检测方法存在的缺点,利用网络文档的半结构化特征提供的语义信息以及词在语义上下文的共现频率定义词之间的语义相似度,然后构建文档集的词共现语义网络,实现词之间语义关联的建模;在此基础上提出相容语义块的概念,并通过对相容语义块的构建、分裂和约简来实现对话题的检测,提出一种基于相容语义块约简的网络话题检测方法.该方法获得的结果稳定,表现话题的词集简短而富有表达力,因此十分适合于网络话题检测,实验亦说明了它的优点、有效性和可行性.
Topic detection Tolerance semantic block Word co-occurrence network Semantic similarity degree
蒙祖强 徐杨 杨俊瑶
广西大学计算机与电子信息学院 南宁530004
国内会议
第十二届中国Rough集与软计算学术会议、第六届中国Web智能学术研讨会及第六届中国粒计算学术研讨会联合学术会议
合肥
中文
35-35
2012-10-13(万方平台首次上网日期,不代表论文的发表时间)