会议专题

基于句类的因特网语言知识处理

因特网的蓬勃发展,首先较好地解决了不同信息资源的传输与显示,使用户可以自由便捷地浏览各种信息。这是对表层信息的加工和利用。随着网上信息的迅速增长。信息除了供用户浏览之外,还需要满足计算机自动处理的要求,随之产生了XML,以表达网页中的数据结构,为自动处理提供基础。这标志着网上信息的处理从表层进入深层。在万维网联盟的支持和倡导下,语义网行动(SemanticWeb Activity)也随即开始了。语义网行动试图提供一种手段,通过给网上的信息增加特殊信息,辅助计算机完成自动处理,提供更准确、有效的服务,即XML提供了因特网上深层信息的表示方法,而语义网行动则是要利用这一方法建立深层表示的规范和与之相应的处理技术。这里高质量的机器翻译和生成(语境生成和主题要点提取)是核心。 HNC的句类和语义块理论力求揭示句子内语义块之间的各种关联,以句类知识的形式给出处理所需的信息。因此,HNC这一深入自然语言本体的语句结构表示体系能够比较好地、显式地提供自然语言语句深层结构的信息,从而为实现语义网行动的目标提供必要的基础。本文还说明了以句类和语义块作为翻译的中枢和基本单位,可以建立新的机器翻译机制。

语言知识处理 语义网 语境生成 主题要点提取 自然语言处理 语境处理 语义块 句类 概念层次网络 机器翻译

张全

中国科学院声学研究所,北京,100080

国内会议

第二届HNC与语言学研讨会

北京

中文

465-476

2003-09-20(万方平台首次上网日期,不代表论文的发表时间)