急性白血病相关基因的文本挖掘分析
为了寻找通过文本挖掘获取医学文献中的有益信息进而用于解释生物数据的方法,本文以急性白血病为例,通过主题词和自然语言两种途径以疾病与基因的共现关系为基础进行聚类分析,挖掘基因与疾病之间的关系,基本实现发现基因与疾病之间的联系,可根据主题词的树状结构对疾病进行精细分类和调整,但该方法所获得的相关基因较少,不利于对疾病与基因关系的全面了解。如果结合自然语言处理提取基因概念,将会使结果更加准确。
急性白血病相关基因 主题词 自然语言 聚类分析 文本挖掘 树状结构
闫雷 崔雷
中国医科大学信息管理与信息系统(医学)系 110001
国内会议
银川
中文
108-113
2006-09-01(万方平台首次上网日期,不代表论文的发表时间)