面向主题的GEO基因表达数据集自动分类方法研究
本文针对GEO数据库中人类肿瘤疾病相关数据的获取问题进行研究,建立以一个对肿瘤疾病类型的表示和分类方法。进一步能够根据相关的检索条件,获得所需的基因表达数据。该项工作对于利用GEO数据库进行人类肿瘤疾病的相关研究具有十分重要的意义。对于GEO相关数据集的分类和查询涉及到自然语言处理和文本挖掘问题。采用了数据集的相关PubMed信息和主题模型的内容表示和分类方法能够有效的提高数据集分类和查询的性能,对于CEO数据集的有效利用具有重要的意义。
人类肿瘤疾病 基因综合表达库 分类方法 文献检索
徐超 李姣
中国医学科学院医学信息研究所
国内会议
北京
中文
220-222
2013-10-16(万方平台首次上网日期,不代表论文的发表时间)