基于偏向相似性的自然语言关联和聚类研究
聚类按关联进行分类,关联和聚类分析的基础是相似性计算.通常相似性是指绝对相似性,具有对称性.但自然语言研究中发现大部分规律都是偏向的,具有不对称性,需要用偏向的思路来考察不对称的关联和聚类策略:以类似条件概率的概率蕴涵指标来描写特征间的不对称关联,并在此基础上定义优势关系、紧密关系、控制中心、中途岛等关联特性;基于偏向相似性的聚类策略,从而能更好地处理语言本体研究中的“假性孤立点”、数据稀疏问题和家族象似性类型的聚类.
自然语言处理 偏向相似性 关联分析 聚类分析
陈振宁 陈振宇
浙江大学,浙江省杭州市,310058 复旦大学,上海市,200433
国内会议
第十五届全国计算语言学学术会议(CCL2016)暨第四届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD-2016)
烟台
中文
1-10
2016-10-14(万方平台首次上网日期,不代表论文的发表时间)