花园幽径模式行进错位的量化研究:计算语言学视角
本文讨论了花园幽径模式行进错位过程中的困惑商指数.非对称性信息断层的存在导致解码呈现否定之否定的螺旋上升态势.行进错位的潜在效应幅度可通过困惑商指数得到测定.基于大数据语料库统计方法和在线剖析器分析方法,测算出优选结构困惑商指数介于(-∞,1”;非优选结构困惑商指数介于”1,2”;两结构临界值分别为0.72和1.28;歧义域为”0.72,1.28”.结论认为,多结构频数差异是导致困惑商指数变化的根本;行进错位的幅度和非对称性信息补偿的强度均与困惑商指数相关;基于统计的困惑商指数可对局部歧义的复杂句结构提供前瞻性解码信息.
复杂句结构 花园幽径模式 行进错位 局部歧义 困惑商指数
杜家利 于屏方
广东外语外贸大学词典中心,广州,广东,510420;南京大学外国语学院,南京,江苏,210093 广东外语外贸大学中国语言文化学院,广州,广东,510420
国内会议
中国中文信息学会2015学术年会(CIPS2015)暨第十四届全国计算语言学学术会议(CCL2015)、第三届基于自然标注大数据的自然语言处理国际学术研讨会(NLP-NABD2015)
广州
中文
1-11
2015-11-13(万方平台首次上网日期,不代表论文的发表时间)