一种结合有监督学习的动态主题模型
针对传统主题模型存在的不足,提出一种新的结合有监督学习的动态主题模型(Supervised Dynamic Topic Model,S-DTM).该模型不仅能够随时间的变化对语言进行动态建模,而且结合有监督学习技术,在主题变分推理中加入标签约束,从而建立主题与标签之间的映射关系,提高主题的表达解释能力.通过在一个跨越25年”以自然语言处理领域的中文期刊论文为主导”的中文语料库上的实验,证明该模型相较于静态的有监督主题模型和无监督的动态主题模型,具有更好的语义解释概括能力,能更准确地反映文档的主题结构,更精确地捕捉主题-词汇概率分布的动态演化.
中文语料库 动态主题模型 监督学习技术 标签约束
蒋卓人 陈燕 高良才 汤帜 刘晓钟
大连海事大学交通运输管理学院,大连116026 北京大学计算机科学技术研究所,北京100080 Department of Information and Library Science, Indiana University Bloomington, Bloomington, IN 47405
国内会议
深圳
中文
367-376
2014-12-05(万方平台首次上网日期,不代表论文的发表时间)