会议专题

从文献中获取数据及判据知识资源的方法研究

资源获取是构建故障诊断分布式资源环境的重要前提,获取分散的诊断资源可以实现资源共享从而挖掘出更利于决策的知识.目前已有大量研究成果在科研文献中进行了报导.但文献大多是PDF文件格式,为此研究从文献中提取数据的方法有重要意义.利用像素比例法来计算曲线采样点的数据值,采用了随机扫描法快速分割表格中的单元格,研究了基于像素点数和百分比值的字符识别方法,实现了趋势曲线图的数据提取以及数据表格的识别.实验结果表明,该方法能有效实现从文献中提取数据信息资源,为分布式资源环境的建立奠定了坚实的基础.同时也可应用于其它领域的数据资源获取.

机械设备 故障诊断 资源获取 曲线数据 单元格划分 字符识别

饶慧 严新平 刘杰

武汉理工大学能源与动力工程学院 可靠性工程研究所(REI),湖北 武汉 430063

国内会议

2010年全国油液监测技术会议

青岛

中文

1-9

2010-09-17(万方平台首次上网日期,不代表论文的发表时间)