会议专题

基于游记文本的游客游览行程重构

  [目的]基于大量的游记文本和景点信息,实现游客游览行程的重构.[方法]结合TF-IDF和Word2Vec,提出一种基于文本相似度的命名实体识别方法识别景点;提出一种基于马尔可夫性、先验知识和空间特征的模型重构游客的游览行程.[结果]本文所提景点识别方法的查全率达90.72%,查准率达89.65%,F值为0.9018,明显优于条件随机场方法,重构的游客游览行程与真实行程相似度达83.27%.[局限]景点识别方法一定程度上依赖于景点信息库的完整性.[结论]本文所提景点识别方法可自动化识别景点,且游览行程重构达到了较佳的效果.

命名实体识别 文本相似度 马尔可夫性 行程重构

高原 施元磊 张蕾 曹天奕 冯筠

西北大学经济管理学院 西安710127 西北大学信息科学与技术学院 西安710127

国内会议

第二届数据分析与知识发现学术研讨会

兰州

中文

165-172

2019-07-10(万方平台首次上网日期,不代表论文的发表时间)