会议专题

基于双语主题和因子图模型的汉语-越南语双语事件关联分析

随着一带一路国家战略实施,我国与越南的交流与合作日益密切,及时掌握两国新闻事件动态意义重大.该文针对汉越双语新闻事件关联分析所面临的跨语言关联问题,研究汉越双语新闻事件关联分析方法.汉越双语新闻事件分析其实质是多语言多文本的理解问题.其主要难点是要解决多语言多文本下的新闻事件理解问题.该文提出了基于因子图模型的局部密切度传播算法.首先使用双语主题概率模型,从双语文档中获得双语主题以及主题概率分布.然后基于新闻事件的文本相似度构建事件因子图模型,在因子图上对相互关联的事件使用局部密切度传播算法计算某一主题下所有相互关联的事件间的影响力.最后得到不同主题下事件间的影响力拓扑图.实验结果表明该文提出的方法相比相似度计算和词语共现的方法取得了不错效果.

汉越双语新闻事件 事件关联 多语言文本 双语主题 因子图

唐莫鸣 朱明玮 余正涛 王吉地 高盛祥

昆明理工大学信息工程与自动化学院,云南昆明650500

国内会议

第十六届全国计算语言学学术会议暨第五届基于自然标注大数据的自然语言处理国际学术研讨会

南京

中文

1-10

2017-10-13(万方平台首次上网日期,不代表论文的发表时间)