一种基于循环神经网络的古文断句方法
提出一种基于循环神经网络的古文自动断句方法。该方法采用一种基于Gated Recurrent Unit(GRU)的双向循环神经网络进行古文断句。在解码过程中,算法不仅利用神经网络输出的概率分布,还进一步引入状态转移概率和长度惩罚以提高断句准确率。在大规模古籍语料上的实验结果表明,所提方法能够取得比传统方法更高的断句F1值。
古汉语 断句 循环神经网络
王博立 史晓东 苏劲松
厦门大学智能科学与技术系,厦门 361005 厦门大学智能科学与技术系,厦门 361005;厦门大学两岸关系和平发展协同创新中心,厦门 361005;福建省类脑计算技术及应用重点实验室,厦门 361005 厦门大学软件学院,厦门 361005
国际会议
第五届自然语言处理与中文计算会议(NLPCC-ICCPOL2016)
昆明
中文
1-7
2016-12-02(万方平台首次上网日期,不代表论文的发表时间)