会议专题

TEXEM:一种基于实体的邮件任务提取策略

在信息化飞速发展的今天,电子邮件的使用正在变得越来越频繁,而且其应用场合也在不断扩展,目前世界上很大一部分、并且越来越多的商业和个人往来都是通过电子邮件完成的.电子邮件的作用正在被人们不断拓展,特别是它作为任务管理和协作管理的重要工具和手段,被人们广泛使用。但是由于电子邮件数量越来越大,其设计初衷只是单纯的通信手段,具有轻量性和随意性等特点,因此当前的邮件管理工具很难有效地组织和管理人们的大量邮件信息,更重要的是它们不能很好地完成邮件任务管理等扩展任务.提出了一种基于实体的邮件任务提取框架——TEXEM,充分考虑电子邮件中的结构信息,将邮件通过实体聚类的方法转化为任务的集合,并对用户任务重要性进行评估,使用户不再单纯依靠毫无结构的纯文本内容来处理邮件,以起到辅助用户邮件处理过程、提高邮件管理效率的作用。

任务提取 实体识别 电子邮件处理 聚类 任务管理 TEXEM

张相於 陈继东 李玉坤 孟小峰

中国人民大学信息学院 北京 100872 易安信中国实验室 北京 100084

国内会议

第二十五届中国数据库学术会议(NDBC2008)

桂林

中文

508-513

2008-10-24(万方平台首次上网日期,不代表论文的发表时间)