自然语言处理云平台
自然语言处理技术是计算机科学与语言学的交叉学科,是人工智能的一大分支,主要解决机器理解人类语言的技术问题.该技术应用比较广泛,典型应用有语音识别、文本挖掘、情感分析、语义分析等.研究使用自然语言处理技术需要熟悉各种机器学习、人工智能算法,不仅提高了一般开发者对自然语言处理技术的使用门槛,而且严重影响了技术推广.本文的NLP云平台的大数据基础架构,借鉴了现有海量处理技术的云端服务架构。通过HDFS文件系统,存储大规模训练语料;采用MapReduce算法进行离线模型训练;Hive.Hbase实现原始语料初加工和存储;Spark一方面可以解决流计算、实时计算等业务场景的问题,另一方面作为大数据平台的统一基础架构平台。
自然语言处理 云平台 创新理念
李文 程华良 彭耀 温明杰 肖威清 张陈斌 陈宗海
中国科大-象形大数据商业智能联合实验室,安徽合肥,中国,230031;安徽象形信息科技有限公司,安徽合肥,中国,230031 安徽中烟工业有限责任公司合肥卷烟厂,安徽合肥,中国,230027 中国科大-象形大数据商业智能联合实验室,安徽合肥,中国,230031;中国科学技术大学自动化系,安徽合肥,中国,230027
国内会议
福州
中文
399-402
2014-10-01(万方平台首次上网日期,不代表论文的发表时间)