基因轉錄體分析及次世代定序技術之挑戰
基因转录体分析系针对生物体全部基因进行表现内容研究,旨在探究与比较细胞在特定组织、阶段与条件下的基因表现序列、表现程度与功能等,是基因体科学研究的重要课题。对於快速增加的转录体表现序标帜列(Expressed Sequence Tags,EST)资料等,需要整合式的自动化生物资讯平台来协助生物学家进行快速与有效的转录体分析。因此,我们开发出Bio301-EST序列注解分析系统(http://bio301.iis.sinica.edu.tw/),提供序列清理、组合(assembly)、相似序列资料库搜寻、Gene Ontology(GO)功能注解、统计分析报表、GO图形化操作介面、Microarray探针序列自动筛选以及比较不同EST序列库(library)之间的功能差异。实验测试结果显示,Bio301提供可靠的功能性比较分析结果;同时,Bio301已经累积服务来自台湾、大陆与澳洲(Australia)共计~140专案,~60万EST序列。近来,随者次世代高通量定序技术的进步与落实,愈来愈大量的转录体序列不断增加,且一次实验产量从先前的百万硷基对(base pair)提升到百亿硷基对,造成转录体资料处理分析极大的挑战。我们已经建构了雏形系统,开始协助生物学家进行数个台湾特有物种的高通量定序转录体分析研究。
基因转录体分析 序组合 基因功能注解 高通量定序 生物资讯
何建明 張育榮 林文鐽 陳彥臣 陳建智
中央研究院 資訊科學研究所 植物暨微生物學研究所
国内会议
丽江
中文
266-272
2009-09-14(万方平台首次上网日期,不代表论文的发表时间)