会议专题

因特网语料自动下载分析软件的设计

随着计算机应用的发展和普及,特别是因特网的普及,获取语料、建立大规模语料库变得越来越容易.本文讨论了如何从因特网上下载语料,如何解析HTML页面并提取出其中对语料库有用的语料数据的方法.

语料库 网页下载 HTML 因特网 下载分析软件

朱凯 周杰 何婷婷

华中师范大学计算机科学系(武汉)

国内会议

第一届学生计算语言学研讨会

北京

中文

293-298

2002-08-01(万方平台首次上网日期,不代表论文的发表时间)