面向全样本用户的收视特征提取算法与优化
数字电视机顶盒可收集到电视用户的频道收视行为数据.而通过采集的收视数据提取用户收视特征,贴上对应标签,可提高电视广告精准化投放所需的基础信息.当收视行为数据为全样本用户时,需要提取收视特征的高速处理算法.本文首先提出了对用户收视特征提取的初始算法,可用于在小样本环境下验证与改善数据分析流程.然后在初始算法上进行基于数据读取方式、数据类型、数据表结构三方面的优化,提升后的数据处理效率约为初始算法的17倍.新的高效数据预处理算法能够快速的实现收视特征提取,为全样本环境下的用户标签分析奠定基础,有效缩短了数据挖掘过程的迭代周期.
数字电视 收视特征 算法优化 数据预处理
张帆 陈征 颜金尧
中国传媒大学计算机与网络中心
国内会议
合肥
中文
265-269
2015-10-01(万方平台首次上网日期,不代表论文的发表时间)