会议专题

多维数据立方体与信息抽取的集成

数据挖掘已经成为提升行业竞争力的重要的信息技术,它综合运用机器学习以及信息科学的理论与技术,挖掘隐藏大量数据背后的模式与知识,为业务决策提供有意义的参考信息.目前仍存在许多遗留的信息系统,其中大量的业务规则是以自然语言描述的形式存储在数据库中的.在这类遗留系统上进行数据挖掘,就必须解决如何从这些不规则的自然语言描述中抽取信息的问题.我们讨论了如何从自然文本中抽取业务规则,为了将这些信息存储在多维数据立方体中,我们提出了一种利用多维索引建立多维数据立方体的方法.

数据挖掘 多维数据立方体 信息抽取 B树 正则表达式

万海平 朱强生 何华灿 周延泉

北京邮电大学,信息学院,北京,100876

国内会议

第四届全国搜索引擎和网上信息挖掘学术研讨会(SEWM2006)

济南

中文

73-76

2006-07-21(万方平台首次上网日期,不代表论文的发表时间)