基于机器学习方法的患者隐私信息匿名化技术研究
在医疗行业中有大量的宝贵数据有待挖掘,然而基于相关规定,为保护患者的隐私信息不泄露,要对患者受保护信息进行匿名化处理才可以提供给外部研究人员.为解决传统人工识别受保护信息的方法不仅浪费人力、效率低下,而且常常出现错误识别的问题,本文提出了一种基于条件随机场的命名实体识别方法.命名实体识别模型由150份出院小结和和丰富的特征集训练而成.实验显示该模型在识别患者受保护信息方面有出色的表现.该方法在保护患者隐私的同时,最大化地减少了匿名化对医疗文档临床医用价值的影响.
患者隐私 匿名化技术 条件随机场 命名实体识别
李泽南 周天舒 李鹏飞 尹巍巍 李劲松
浙江大学生物医学工程与仪器科学学院,310027,杭州市浙大路38号
国内会议
珠海
中文
1-7
2016-05-27(万方平台首次上网日期,不代表论文的发表时间)