中文叙词表本体概念定义注释的自动构建研究
中文叙词表本体(Onto Thesaurus)融合了叙词表与本体,是一种同时具备二者特征的知识组织系统。“中文叙词表本体共建共享系统”(OTCSS)是中文叙词表本体的配套系统。本文在充分借鉴“定义抽取”已有研究成果的基础之上,设计了面向综合性中文叙词表本体的叙词概念定义抽取方法以及基于OTCSS的定义注释自动构建框架,获得了良好的实验效果,即将应用于实际的OTCSS系统。其中,基于“高频词与句子向量”和“TFIDF向量”两种定义抽取算法提出的二维相对量的融合算法,能够更有效地抽取出前两种方法的良好结果,有效信息提高比一般可达到60%。
中文叙词表本体 定义抽取 定义注释 向量空间模型 二维相对量
田金凤 曾新红
深圳大学计算机与软件学院 深圳 518060 深圳大学图书馆 深圳518060 深圳大学计算机与软件学院 深圳 518060
国内会议
杭州
中文
16-28
2011-11-17(万方平台首次上网日期,不代表论文的发表时间)