会议专题

知识自动化方法初探:从交通信号控制和互联网问诊平台

本文从物理过程和信息过程各选取一个领域,物理过程的交通信号控制和信息过程的互联网问诊,初探了可实现知识自动化的方法。总结而言,主要是两种方法或技术:协同过滤和词嵌入。仔细分析,对于物理过程中大量的难捕捉、难描述、难量化的因素,在有大数据的情况下,可通过协同过滤方法,利用相似群体的信息,以结果为导向,建模时忽略其因素本身却保证不丢弃其影响。从这一层面来讲,可以对很多物理过程的情况利用协同过滤实现知识自动化,而无需过多的人工介入,去收集信息、处理信息、分析信息、建模信息、实施控制。对于信息过程,由于描述的多样性,一般算法很难自动智能认知;在大数据量的情况下,很多机器学习算法都表现出了一定的自动化特性,但一般研究中监督学习居多,而监督学习则需要标记,现实生活中的大部分数据又是没有标记的。词嵌入无需标记,从表层看是一种无监督学习;深入洞察其原理可发现,其实词嵌入是一种自监督的学习过程。因为大量的文本,大量的上下文信息,和独特的训练技巧,使得它可利用自身的信息作为标记进行内在自监督外在无监督的学习,从而实现了互联网问诊平台的知识自动化,其方法、思想可尝试用于实现其他更多信息过程的知识自动化。

交通信号控制 互联网问诊平台 知识自动化 协同过滤 词嵌入算法

赵一飞 施小博

中国科学院自动化研究所复杂系统管理与控制国家重点实验室 北京,中国 青岛智能产业技术研究院智慧健康所 青岛,中国

国内会议

第七届社会计算会议

福州

中文

1-5

2015-12-11(万方平台首次上网日期,不代表论文的发表时间)