会议专题

带通配符的多序列模式挖掘

带有通配符的多序列模式挖掘在文本检索、网络安全、生物科学等领域中具有很重要的作用.通过挖掘多序列模式,能够透彻地了解序列之间的联系,这在各个领域中具有重要的现实意义.在已有的工作中,随着多序列集长度的增大,挖掘的规模呈现指数级增长.本文研究这样一个问题:给定多条序列s1,…,sn、支持度阈值和间隔约束,从多序列中挖掘所有出现次数不小于给定支持度阈值的频繁序列模式,并且要求模式中任意两个相邻元素在序列中的出现位置满足用户定义的间隔约束.设计了一个有效的算法M-OneOffMine,模式在序列中的出现满足one-off条件,即模式的任意两次出现都不共享序列中同一位置的字符.在生物DNA序列上的实验结果表明,M-OneOffMine算法比相关的序列模式挖掘算法具有更好的时间性能.

Multiple sequence Gap constraints Wildcards One-off condition Frequent patterns

马晓文 胡学钢 谢飞

合肥工业大学计算机与信息学院 合肥230009 合肥工业大学计算机与信息学院 合肥230009;合肥师范学院计算机科学与技术系 合肥230601

国内会议

第十二届中国Rough集与软计算学术会议、第六届中国Web智能学术研讨会及第六届中国粒计算学术研讨会联合学术会议

合肥

中文

140-140

2012-10-13(万方平台首次上网日期,不代表论文的发表时间)