会议专题

一种结合有监督学习的动态主题模型

针对传统主题模型存在的不足,提出一种新的结合有监督学习的动态主题模型(Supervised Dynamic Topic Model,S-DTM).该模型不仅能够随时间的变化对语言进行动态建模,而且结合有监督学习技术,在主题变分推理中加入标签约束,从而建立主题与标签之间的映射关系,提高主题的表达解释能力.通过在一个跨越25年”以自然语言处理领域的中文期刊论文为主导”的中文语料库上的实验,证明该模型相较于静态的有监督主题模型和无监督的动态主题模型,具有更好的语义解释概括能力,能更准确地反映文档的主题结构,更精确地捕捉主题-词汇概率分布的动态演化.

中文语料库 动态主题模型 监督学习技术 标签约束

蒋卓人 陈燕 高良才 汤帜 刘晓钟

大连海事大学交通运输管理学院,大连116026 北京大学计算机科学技术研究所,北京100080 Department of Information and Library Science, Indiana University Bloomington, Bloomington, IN 47405

国内会议

第三届CCF国际自然语言处理与中文计算会议

深圳

中文

367-376

2014-12-05(万方平台首次上网日期,不代表论文的发表时间)