進階搜尋


 
系統識別號 U0026-0812200912072157
論文名稱(中文) 應用資料探勘技術分析車輛燃料之消費行為
論文名稱(英文) Applying data mining techniques in analysis the consumption behaviors of vehicle fuel
校院名稱 成功大學
系所名稱(中) 工業與資訊管理學系專班
系所名稱(英) Department of Industrial and Information Management (on the job class)
學年度 94
學期 2
出版年 95
研究生(中文) 陳旗明
研究生(英文) Chyi-ming Chen
電子信箱 jc80367@ms57.hinet.net
學號 r3793113
學位類別 碩士
語文別 中文
論文頁數 137頁
口試委員 口試委員-黃信豪
指導教授-吳植森
口試委員-蔡長鈞
中文關鍵字 車輛燃料的消費行為  資料探勘  資料庫中發掘知識  顧客關係管理  決策樹歸納法  叢集分析 
英文關鍵字 Customer Relationship Management  Cluster Analysis  Decision Tree Induction  Data Mining and Knowledge Discovery in Databases  Data Mining  Consumption Behaviors of Vehicle Fuel. 
學科別分類
中文摘要 摘要

處於今日經營環境急遽變化與激烈競爭的環境中,企業深深體認到,能過瞭解顧客之需求並提供滿足顧客需求的產品或服務,以提高顧客忠誠度,企業方能保持競爭優勢;而建立顧客關係以留住顧客、創造企業利潤,則是現今企業熱切關心投入的議題。國內油品市場自2001年開放進口以來,油品業者之間競爭日益激烈,導致其獲利日益壓縮。若業者欲企圖建立永續的競爭優勢,除了積極開發新顧客外,與舊有顧客維持長久的關係,能提供滿足顧客需求的產品外,提供額外的管理服務,已日益顯得重要。
本研究以國內最大油品業者的客戶車隊其車輛燃料的消費資料為分析對象。首先,應用叢集技術以k-mean演算法將25,651個案例分成13群集。其次,以決策樹歸納分類技術之C4.5演算法做分類後並萃取分類規則或模式,其分類正確率高達97.2%以上,而每一群集之分類規則以”if……then”表示,這些規則亦即為顧客的車輛燃料消費行為或模式。所得到的這些資訊或知識能夠儲存在企業的模式庫中,供交易處理系統驗證顧客的車輛燃料消費行為是否正常,如果不符其消費模式時能及時警示並再作核對,以減少油品業者之服務人員錯誤的資料輸入或客戶異常消費行為,做好顧客的車輛管理服務,以及企業內部管理決策上例如人力資源分配的智慧應用。




英文摘要 Abstract

Today enterprises have realized that learning about the requirements of the customers and providing the customers with required products and services to improve the faith of the customers are two major activities to keep their advantages of competition. Establishing relationship with the customers to maintain them and create profits is the major concerns of the enterprises. Since decontrol the limitation of imports in domestic oil market in 2001, the competition between the oil operators have been increasingly intense, which increasingly shrank the profits of the enterprises. If the operators intend to establish sustainable competitive advantages, actively developing new customers, maintaining long-term relationship with the customers, as well as providing the customers with satisfactory products and extra management services to the customers, are required to serve that goal.
This study adopts the fuel consumption data of vehicle fleets of customers of the biggest domestic oil operators as the target of analysis. First, the study classifies 25,651 cases in 13 groups using k-mean algorithm of Cluster Analysis. Second, the C4.5 algorithm of decision trees induction technology is used for the classification to extract the rules or modes of classification. The tree models reach correctness rates exceeding 97.2%. The classification rule of each group is represented by ”if……then”. These rules are just the consumption behaviors or modes of vehicle fuel of the customers. The information or knowledge obtained in this way can be stored in the mode database of the enterprises for the transaction handling system to verify if the consumption behaviors of vehicle fuels of the customers are normal. Thus, in case they are not conforming to the consumption modes, the system can give alarm and check again so as to reduce the wrong inputting of data by the service personnel of the oil operators or the abnormal consumption behaviors of the customers. The system provides fine vehicle management for the customers and provides intelligent application of internal management decisions of enterprises such as allocation of human resources.




論文目次 目錄表
摘要…………………………………………………………………………………….Ⅳ
Abstract…………………………………………………………………………………Ⅴ
誌謝…………………………………………………………………………………….Ⅵ
目錄表………………………………………………………………………………….Ⅶ
表目錄………………………………………………………………………………….Ⅹ
圖目錄………………………………………………………………………………….XII
第一章 緒論…………………………………………………………………………….1
第一節 研究背景………………………………………………………………….1
第二節 研究動機………………………………………………………………….2
第三節 研究目的………………………………………………………………….3
第四節 研究架構………………………………………………………………….3
第五節 研究流程………………………………………………………………….4
第六節 研究範圍與限制………………………………………………………….5
第二章 文獻探討……………………………………………………………………….7
第一節 顧客關係管理…………………………………………………………….7
2.1.1顧客關係管理的定義…………………………………………………8
2.1.2企業引進顧客關係管理的原因及目的………………………………8
2.1.3顧客關係管理的循環…………………………………………………9
第二節 資料探勘………………………………………………………………...11
2.2.1資料庫中發掘知識…………………………………………………..11
2.2.2資料探勘……………………………………………………………..13
2.2.3資料探勘的定義……………………………………………………..13
2.2.4資料探勘之功能……………………………………………………..14
2.2.5資料探勘的方法……………………………………………………16
2.2.6資料探勘的步驟.………...…………………………………………19
2.2.7資料探勘的應用……………………………………………………20
第三節 叢集分析..……………………………………………………………...23
2.3.1.叢集分析的定義.……………………………………………….….23
2.3.2 常見的叢集分析方法…..……………………………………….…25
第四節 分類法………………………………………………….………………31
2.4.1 主要的分類方法……………………………………………………32
2.4.2 決策樹歸納法………………………………………………………34
2.4.3 決策樹歸納演算法…………………………………………………36
第五節 資料探勘與資料倉儲系統……………………………………………..39
第六節 車輛燃料的消費行為…………………………………………………..43
2.6.1 國內油品市場簡介…………………………………………………43
2.6.2車輛燃料的消費型態……………………………………………….44
2.6.3車隊卡的消費服務流程…………………………………………….45
第七節 小結……………………………………………………………………..51
第三章 研究方法…………………………………………………………………….52
第一節 研究方法架構………………………………………………………….52
第二節 資料的蒐集與前處理………………………………………………….53
3.2.1 資料的蒐集….……………………………………………………..54
3.2.2資料前處理….……………………………………………………...55
第三節 資料探勘應用軟體WEKA的簡介.…………………………………..61
第四節 叢集化分析…………………………………………………………….63
第五節 決策樹歸納法………………………………………………………….64
第六節 小結……………………………………………………………..……...65
第四章 研究結果分析與探討………………………………………………………66
第一節 車輛燃料消費行為的叢集分析………………………………………66
4.1.1 車輛燃料消費行為的叢集分析…………………………………..66
4.1.2 叢集模式…………………………………………………………..73
第二節 決策樹歸納分類法……………………………………………………75
第三節 由決策樹萃取分類規則………………………………………………80
第五章 結論與未來研究方向………………………………………………………84
第一節 結論……………………………………………………………………84
第二節 未來研究方向與建議…………………………………………………84
















表目錄
表2.1學者、專家或廠商對顧客關係管理的定義……………………………….8
表2.2電子交易種類適用對象……………………………………………………45
表3.1原始顧客車輛燃料消費交易資料表………………………………………55
表3.2資料處理後顧客車輛之燃料消費交易資料表……………………………60
表3.3資料化約後顧客車輛之燃料消費交易資料表……………………………61
表3.4資料轉換後顧客車輛之燃料消費交易資料表……………………………63
表3.5叢集分析結果顧客車輛之燃料消費行為資料表…………………………64
表3.6決策樹歸納分類法實驗之資料集其屬性-資料類型-屬性值或描述表…65
表4.1a 叢集分析k-Means演算法以N=5實驗結果……………………………68
表4.1b 叢集分析k-Means演算法以N=6實驗結果……………………………69
表4.1c 叢集分析k-Means演算法以N=7實驗結果……………………………69
表4.1d 叢集分析k-Means演算法以N=8實驗結果……………………………70
表4.1e 叢集分析k-Means演算法以N=9實驗結果……………………………70
表4.1f 叢集分析k-Means演算法以N=10實驗結果…………………………...71
表4.1g 叢集分析k-Means演算法以N=11實驗結果…………………………..71
表4.1h 叢集分析k-Means演算法以N=12實驗結果…………………………..72
表4.1i 叢集分析k-Means演算法以N=13實驗結果…………………………...72
表4.2每一叢集模式其群集中心屬性統計量……………………………………74
表4.3 叢集結果每一案例所屬群數資料表……………………………………...75
表4.4決策樹歸納法以C4.5演算法實驗其資料集之屬性-資料類型-屬性值
或描述表……………………………………………………………………76
表4.5試驗結果交叉驗證資料表………………………………………………….79
表4.6試驗結果分類正確率資料表………………………………………………79
表4.20車輛燃料的消費行為的每一群組其規則數目…………………………..82
附錄(表4.7a cluster_0規則表……表4.19b cluster_12規則表)……………….89


















圖目錄
圖 1.1 研究流程圖………………………………………………………………….4
圖 2.1顧客關係管理的四大循環過程…………………………………………….10
圖 2.2資料庫中知識發掘程序的概觀步驟組成………………………………….12
圖 2.3 在資料集合{a,b,c,d,e}上的凝聚和分裂階層叢集………………………...26
圖 2.4分類樹……………………………………………………………………….29
圖 2.5 三層前向式類神經網路架構圖……………………………………………31
圖 2.6 分類方法的技術……………………………………………………………32
圖 2.7 概念購買電腦的決策樹,指出顧客是否可能購買電腦………………....34
圖2.8 資料探勘系統結構………………………………………………………….39
圖2.9 資料倉儲架構及概略圖…………………………………………………….41
圖 2.10車隊卡服務處理流程圖…………………………………………………...47
圖 2.11加油站車隊卡服務處理流程(卡機連線異常)…………………………48
圖 2.12車隊卡服務處理流程(簽單列印不成功)………………………………49
圖2.13車隊卡服務處理流程(事後作業)……………………………………….50
圖3.1研究方法架構………………………………………………………………...53
圖3.2資料減量前原始顧客車輛燃料之消費資料的屬性………………………...56
圖3.3資料減量後去除部分重覆或與研究目的無關後的屬性…………………...57
圖3.4補正前錯誤的資料…………………………………………………………...57
圖3.5補正後正確的資料…………………………………………………………...58
圖3.6里程數資料輸入錯誤………………………………………………………...59
圖3.7補正後正確的里程數資料…………………………………………………...59
圖3.8 WEKA的主程式介面以及程式主畫面圖………………………………….62
圖4.1 N=5實驗中以及實驗結果畫面圖…………………………………………...67
圖4.2 N=13實驗中以及實驗結果畫面圖……………………………………….68
圖4.3分類方法之演算法選擇畫面………………………………………………77
圖4.4j48演算法(C4.5演算法)演算法參數設定畫面………………………….78
圖4.5進行實驗中以及實驗結果其畫面…………………………………………78
圖4.6車輛燃料的消費行為之決策樹的外觀……………………………………80
圖4.7車輛燃料的消費行為之部分決策樹示意圖………………………………81
參考文獻 參考文獻

中文

何玉麗(2004).自由消費˙消費自「油」──油品市場自由化與消費者權益.「能源報導」月刊,93年05月. 10.15,2005.from http://www.tier.org.tw/energymonthly/recent3.asp.
羅南.史威福(Ronald S. Swift) 著,賴士奇..等合譯,”深化顧客關係管理”,遠擎管理顧問公司,2001.
遠擎管理顧問公司編著,”顧客關係管理深度解析-執行以客戶為中心的企業轉型策略”,遠擎管理顧問公司,2001.
中國石油股份有限公司簡介. 10.11,2005. from http://www.cpc.com.tw/aboutcpc/transales.htm.

英文

Anderson,K.and Kerr,C. (2002).Customer relationship management. Mcgraw-Hill Companies,Inc.
Berry,M.J.A.and Linoff,G.(1997).Why data mining?.in Berry,M.J.A.and Linoff,G.(Ed.) Data mining techniques:for marketing,sales,and customer support.1-16.New York USA:John Wiley & Sons Inc.
Berry,M.J.A. and Linoff,G.S.(2000).Mastering data mining,the art and science of customer relationship management. New York USA:John Wiley & Sons Inc.
Bose,I.and Mahapatra,R.K. (2001). Business data mining – a machine learning perspective. Information & Managemen, 39, 211-225.
Carbone,P.(1997). Data mining or knowledge discovery in databases: an
overview. Data management handbook, New York: Auerbach Publications.
Fayyad, U., Piatetsky-Shapiro, G., and Smyth, P. (1996). From data mining to knowledge discovery in databases. AI Magazine,17,37-55.
Fayyad, U., Piatetsky-Shapiro, G. and Smyth, P. (1996). The KDD process for extracting useful knowledge from volumes of data. Communication of ACM,39, 11,27-34.
Fayyad, U.and Stolorz,P.(1997).Data mining and KDD: promise and challenges. Future Generation Computer Systems ,13, 99-115.
Frawley,W.J., Piatetsky-Shapiro, G.and Matheus,C.J.(1991).Knowledge
discovery in databases:an overview. AAAI/MIT press.
Fisher,D.(1987).Improving inference through conceptual clustering. AAAI Conf.,Seattle,WA,461-465.
Golfarelli, M.,and Rizzi, S., (1999). Designing the data warehouse: key step and crucial issues. Journal of Computer Science and Information Management, 2,3.
Han,J.and Kamber,M.(2000).Introduction.in Han,J.and Kamber,M.,Data mining:Concepts and techniques.1-36.USA:Morgan Kaufmann.
Han,J.(2001) Data mining:Concepts and techniques. San Diego USA:Academic Press.
Hui,S.C.and Jha,G.(2000).Data mining for customer service support. Information & Managemen, 38, 1-13.
Inmon,W.H. (2002). Building the Data Warehouse. 31-77,3thed. New York:John Willey &Sons.
Mingers, J. (1989). An empirical comparison of selection measures for decision-tree induction. Machine Learning, 3,319-342.
Michaud,P. (1997). Clustering techniques. Future Generation Computer Systems ,13, 135-147.
Quinlan,J.R.(1979), Discovering rules from large collections of examples: a case study. In Michie, D., editor, Expert Systems in the Microelectronic Age. Edinburgh Scotland:Edinburgh University Press.
Quinlan,J.R.(1993). C4.5:Programs for Machine Learning. San Mateo CA: Morgan Kaufmann.
Rajagopalan,B. and Krovi,R.(2002).Benchmarking data mining algorithms.Database Management,13,25-35.
Shaw,J.M., Subramaniam,C., Tan,G.W. and Welge,M.E. (2001). Knowledge management and data mining for marketing. Decision Support Systems, 31,127-137.
Swift,R.S.(2001),Accelerating customet relationships:using CRM and relationship technolongies. Prentice Hall,Inc.
The University of Waikato,WEKA soft.05.03.,2006. from http://www.cs.waikato.ac.nz/ml/weka/
Tiwana, A. (2000)The essential guide to knowledge management:e-business and CRM applications. Upper Saddle River, NJ: Prentice Hall.
Turban,E.and Aronson,J.E. (2001).Data management:warehousing,access and visualization in.decision support systems and intelligent systems. 128-164,6thed, USA:Prentice Hall.
Wayland, R.E. and Cole, P.M. (1997). Customer connections: new trategies for growth. Boston:Harvard Business school.
Witten,I.H.and Frank,E.(2000).What’s it all about?in Witten,I.H.and Frank,E.,Data mining:practical machine learning tools and techniques with java implementations.1-36.USA:Morgan Kaufmann.
Zadeh,L.A. (1965). Fuzzt sets. Information and Control,8,338-353.
Zait,M.and Messatfa,H. (1997). A comparative study of clustering methods. Future Generation Computer Systems ,13,149-159.
論文全文使用權限
  • 同意授權校內瀏覽/列印電子全文服務,於2007-08-18起公開。
  • 同意授權校外瀏覽/列印電子全文服務,於2009-08-18起公開。


  • 如您有疑問,請聯絡圖書館
    聯絡電話:(06)2757575#65773
    聯絡E-mail:etds@email.ncku.edu.tw