進階搜尋


 
系統識別號 U0026-0812200913441119
論文名稱(中文) 應用資料探勘技術於升學考試之分析
論文名稱(英文) Applying Data Mining Techniques to the Analysis of College Admission
校院名稱 成功大學
系所名稱(中) 工程科學系專班
系所名稱(英) Department of Engineering Science (on the job class)
學年度 95
學期 2
出版年 96
研究生(中文) 黃信誠
研究生(英文) Hsin-Cheng Huang
電子信箱 n9793103@ccmail.ncku.edu.tw
學號 n9793103
學位類別 碩士
語文別 中文
論文頁數 94頁
口試委員 口試委員-王永心
指導教授-黃悅民
口試委員-王宗一
口試委員-陳英一
口試委員-陳瑞茂
中文關鍵字 資料探勘  補習班  關聯規則  貝氏機率分類  決策樹 
英文關鍵字 Data Mining  Cram schools  Decision Tree  Naïve Bayes Classifier  Association Rule 
學科別分類
中文摘要 現行的教育制度下,學生所面臨的多元入學環境與壓力更甚以往,常使得學生在入學方式上捉襟見朏。多元入學的推薦甄選方式中有著篩選出學生特殊表現的優點,而與傳統聯考相同的統一入學測驗則有著較具公平性的好處。本研究使用資料探勘(Data Mining)中的關聯規則(Association Rule)、貝氏機率分類(Naïve Bayes Classifier)與決策樹(Decision Tree)三種技術,針對高職資訊科學生在四技二專統一入學測驗中的表現、在學時與考試科目相關的學科表現與是否參與校外補習來加以分析其錄取國立科技大學的重要因素。藉著資料探勘的方法,能使教師在升學輔導的過程中,針對不同的學生特質予以不同的輔導策略,以使學生在複習課業上較有效率。此外,我們也以同一個資料庫加以探討上述三種不同的資料探勘技術之間的差異性與優缺點,並試圖找出最適合擬訂學生課業輔導方向相關問題的分析法則。
本研究證實,上述三種資料探勘技術均能正確地歸納出專業科目(電路學、微處理機原理、實習課程)與數學是錄取國立科技大學的最重要因素,而參與校外補習則具有最大的貢獻度。在三種資料探勘技術的比較上:(1)關聯規則最適合應用於成績或評分方面資料行呈現高度相依性的資料庫,相當適用於教育領域認知科學上的分析與歸納。(2)貝氏機率分類較重視預測資料行個別屬性的獨立特性,且分類速度快,正確性高。(3)決策樹模型容易產生可理解的規則,且對於較重要的資料(愈靠近根節點的子節點)可以清晰地解讀,幾乎適用於所有分類有關的問題,但樣本數過大時,易造成修剪決策樹上的困難。
英文摘要 The current multiple college-entrance education system has brought students much more stress than ever. While the recommendation screening test makes students with special abilities and performances stand out, the unified entrance examination is found to be a lot fairer. In this study, we analyze the influence of students’ entrance examination result of the University of Science and Technology, scholastic performance and attendance of cram schools on their admission to national scientific and technical universities, with the aid of Association Rule, Naïve Bayes Classifier and Decision Tree in Data Mining. Data Mining enables teachers to adopt different enhanced learning strategies to help students with different learning styles, so that students can learn in a more efficient way. Moreover, based on the same database, we also analyze the difference and similarities, advantages and disadvantages between these three Data Mining techniques so as to find out the most appropriate analyze rule dealing with issues concerning supplementary lessons.
The study proves that all the three data mining techniques lead to the result that specialized subjects (circuitry, microprocessor principle, experimental curriculum) and math are the most important factors determining whether a student can be admitted to national scientific and technical universities, and the attendance of cram schools contributes the most. The comparison between the three techniques shows: (1)Association Rule is most suited to be applied to this database with highly correlated scoring data attribution. It is best used in analyzing and inducting recognition science (in the field of education). (2)Naïve Bayes Classifier makes a better prediction concerning the independent features of data’s individual properties. It also makes a quicker and more precise classification. (3)Decision Tree generates more comprehensible rules and clearly interprets important data (the subtree come near the root). It can be applied to almost all studies involving classification, only some difficulties may arise cutting decision tree when there are too many samples.
論文目次 中文摘要 I
英文摘要 II
誌謝 III
目錄 IV
表目錄 VII
圖目錄 IX
第一章 緒論 1
1.1 研究背景與動機 1
1.1.1技職教育分析 1
1.1.2 資料探勘應用於教育 2
1.2 研究目的 4
1.3 研究範圍與限制 5
第二章 文獻探討 8
2.1 四技二專統一入學測驗 8
2.1.1 現行的多元入學方案說明 8
2.1.2 98學年度多元入學招生改進方案說明 8
2.2 影響升學表現的初始因素 10
2.2.1 以是否補習來分析升學表現 10
2.2.2 以高職入學時的入學分數分析未來升學表現: 12
2.3 資料探勘(Data Mining) 13
2.3.1 資料探勘的定義 13
2.3.2 資料探勘技術的定位 14
2.3.3 知識發現(KDD)的過程 14
2.3.4資料探勘的模型 17
2.4 關聯規則 (Association Rule)分析 19
2.4.1關聯規則的定義 19
2.4.2關聯規則的歩驟 21
2.4.3 Apriori演算法 21
2.5 資料分類法(classification) 25
2.5.1決策樹 (Decision Tree)分析 26
2.5.2 貝氏機率分類法(Naïve Bayes Classifier)分析 30
第三章 研究方法 33
3.1 研究架構圖 33
3.2 資料搜集與整合 33
3.2.1 資料前置處理 33
3.2.2 資料轉換 36
3.3 以不同的資料探勘技術加以分析歸納 40
3.4資料探勘技術之評估 41
第四章 分析與歸納 42
4.1 作業環境 42
4.2以貝氏分類法進行資料探勘 42
4.2.1 以『錄取大學』為預測資料行探勘學生特質 42
4.2.2 探勘『各考試學科之間』屬性強弱的相關性 47
4.2.3 以學生『是否參與補習』評估本貝氏機率分類模型 49
4.3 以關聯規則進行資料探勘 51
4.3.1以『錄取大學』為購物籃探勘學生特質 51
4.3.2 以『考試學科表現為優』為購物籃探勘之間的相關性 60
4.4 以決策樹進行資料探勘 64
4.4.1 以『錄取大學』為預測資料行的決策樹模型: 64
4.4.2 探勘『各考試學科之間』的相關性 68
4.4.3 預測『是否參與校外補習』 72
4.5 不同資料探勘技術之模型評估與分析 73
4.5.1以『是否補習』為預測資料行的模型評估 74
4.5.2以『國文』考科為預測資料行的模型評估 75
4.5.3以『英文』考科為預測資料行的模型評估 76
4.5.4以『數學』考科為預測資料行的模型評估 77
4.5.5以『專業科目一』考科為預測資料行的模型評估 78
4.5.6以『專業科目二』考科為預測資料行的模型評估 79
4.5.7以『資訊能力』為預測資料行的模型評估 80
4.5.8以『錄取大學』為預測資料行的模型評估 81
4.5.9 綜合評分 82
第五章 結論與未來展望 84
5.1 升學考試分析之結論 84
5.2 三種資料探勘技術應用於本資料庫之優缺點比較: 85
5.3 就本資料庫的適用度加以比較: 86
5.4 依電腦上進行部署資料庫的運算時間長短做比較: 87
5.5 系統的不確定性: 89
5.6 未來展望 90
參考文獻 92
參考文獻 [1].快樂工作人雜誌,"Cheers 2006年求職指南",95.5.23
[2].李德治、鄧安生,"以算數平均數應用在門檻值制定之研究",科學與工程技術期刊第一卷第一期,民國九十四年
[3].周錚瑋,"擷取使用者最有興趣的關聯式法則-以資管系學生成績資料分析為例",私立中國文化大學資訊管理研究所,2002
[4].孫清山、黃毅志,"補習教育、文化資本與教育取得","台灣社會學刊",1996。
[5].高等技職教育的定位與發展,"http://www.sinica.edu.tw/info/edu-reform/farea2/tsy2_36.html"
[6].技專校院招生策進會,"http://www.techadmi.edu.tw/"
[7].梁俊明,"ART 在教育資料探勘的應用",國立臺灣師範大學資訊教育研究所碩士論文,2002
[8].許佩玲,"大學生學業成就之預測及其相關的研究",國立政治大學教育研究所,1981
[9].陳正道,"影響學生學業表現相關因素之探討—以亞東技術學院工業管理系為例",元智大學工業工程與管理研究所碩士論文,2001
[10].單文經,"以大學入學考試成績、讀書方法、求知欲預測大學一年級學生的學業成就",1992
[11].楊東麟、洪明傳,"資料探勘在資料倉儲的應用",資訊與教育雜誌,AUG2001
[12].楊哲智,"以聯招考生選填志願挖掘系所關聯性之研究",元智大學工業工程與管理研究所,2004
[13].廖南雁、王寶墉、張慧美、張紹華、林淑蓉,"影響本校外語學業成就之相關因素研究",文藻學報,1995
[14].樓玉玲,"以資料挖掘技術分析政大通識課程",國立政治大學資訊管理研究所碩士論文,1998
[15].蔡利旻、陳正傑、林督閔、楊東麟,"資料採礦應用於教育決策資訊系統之實作",逢甲大學資訊工程學系,2004
[16].蔡宗欽,"使用多屬性關聯規則改善天真貝氏分類器之研究",南台科技大學工業管理研究所碩士學位論文,2005
[17].鄭宇麟,"樹狀貝氏分類器狄氏分配先驗分配之合理性",國立成功大學工業與管理研究所,2005
[18].羅淇,"補習與教育成就",淡江大學產業經濟學系碩士論文,2003
[19].Berson A.and S.J.Smith,"Data Warehousing,Data Mining and OLAP",McGraw-Hill,New York,1997
[20].Chen Hsiao-Hui,"Shadow Education in Taiwan:Study of Parental Investment and Educational Achievement",University of Oxford,Department of Sociology,M.Phil.Thesis,2002
[21].Domingos P. and M.Pazzani,"On The Optimality of The Simple Bayesian Classifier Under Zero-One Loss",Machine Learning,1997.
[22].Jing Luan,"Data Mining and Knowledge Management – A System Analysis for establishing a Tiered Knowledge Management Model",2001
[23].Jing Luan,"Data Mining as Driven by Knowledge Management in Higher Education-Persistence Clustering and Prediction",2002
[24].Philip Morse,"Right from the start-helping students pass the HSEE",2001
[25].Russell Stuart,Peter Norvig,"Learning Decision tree",1995
[26].Stevenson David L. and Baker、David P.,"Shadow Education and Allocation in Formal Schooling: Transition to University in Japan",American Journal of Sociology,1992.
[27].Yopundich E.F.,"An Examination of Nonacademic Factors in community College Student Perforence.",University of San Francisco,1990.
論文全文使用權限
  • 同意授權校內瀏覽/列印電子全文服務,於2008-07-17起公開。
  • 同意授權校外瀏覽/列印電子全文服務,於2010-07-17起公開。


  • 如您有疑問,請聯絡圖書館
    聯絡電話:(06)2757575#65773
    聯絡E-mail:etds@email.ncku.edu.tw