XML统一文本自动处理描述接口
使用尽可能多的特征准确的描述文本、尽可能选择有代表性的特征才能最大程度上改善文本处理系统的性能.如果文本特征处理程序(包括分词程序,词性、语法标注程序,主题分析、结构分析程序)都以一种统一的规范来输出其处理结果,这样,其特征处理结果就可以被方便的使用,从而做到研究成果的共享.基于这种思想,我们提出并实现了XML统一文本自动处理描述接口.
文本特征 元数据 文本标注 XML 文本自动处理
苏贵洋 李建华 马颖华
上海交通大学信息安全学院(上海)
国内会议
上海
中文
1-9
2004-11-01(万方平台首次上网日期,不代表论文的发表时间)