会议专题

針對連續型數值屬性標籤建構客製化之決策樹分類系統

決策樹是眾多資料分類技術中,相當受歡迎的一種分類方法,主要是因為決策樹分類方法所探 勘出來的規則有較佳的可讀性。在過去的研究中,有關連續型數值屬性標籤之決策樹分類系統可以分為三種, 第一種是利用回歸樹分類法去預測單一數值資料,第二種是利用資料前處理的方式,將連續型數值資料預先 做離散化,再進一步的套用在分類方法中,第三種是透過決策樹長成的過程中依據數值型資料分佈的情形進 行動態的數值區間切割。然而,過去的方法存在著相當程度的限制,並且在現實生活中有許多的情況並不適合用過去的分類方法 來進行分類或預測的工作,因此本研究將開發一新型之決策樹演算法,可同時考量資料在不同情境中會有不 同分布的情況之下,進一步的將專家知識納入決策樹的建構過程當中,並透過智慧型動態離散化方法將數值 屬性資料做客製化的切割,以有效解決上述演算法中所面臨的問題。最後透過實驗結果呈現本研究所提之方 法能夠在兼顧分類規則的正確率以及明確度之條件下,挖掘出具有決策力且符合決策者需求的分類規則。

Data Mining Classification Decision Tree Discretization

胡筱薇

輔仁大學資訊管理學系,台灣新北市

国内会议

第十七届海峡两岸信息管理发展与策略学术研讨会

南京

中文

1-11

2011-09-01(万方平台首次上网日期,不代表论文的发表时间)