進階搜尋


   電子論文尚未授權公開,紙本請查館藏目錄
(※如查詢不到或館藏狀況顯示「閉架不公開」,表示該本論文不在書庫,無法取用。)
系統識別號 U0026-2006201610415300
論文名稱(中文) 統計資料的收集和分析方式上的初探
論文名稱(英文) A Preliminary Study on the Statistical Data Collection and Analysis
校院名稱 成功大學
系所名稱(中) 統計學系
系所名稱(英) Department of Statistics
學年度 104
學期 2
出版年 105
研究生(中文) 熊鴻
研究生(英文) Hung Hsiung
學號 r26031040
學位類別 碩士
語文別 中文
論文頁數 42頁
口試委員 指導教授-溫敏杰
口試委員-陳文意
口試委員-吳宗正
口試委員-吳國龍
中文關鍵字 統合分析  尺度轉化  模糊理論  P值 
英文關鍵字 Meta-Analysis  dimension transformation  fuzzy theorem  P-value 
學科別分類
中文摘要 在統計研究上,資料收集以及P值(P-value)是常見的兩個問題。本研究針對這兩個問題分別去探討:
1.同一問卷若設計成不同尺度,所得的結果是否會不同?
2.在統合分析(Meta-Analysis)中,如何簡單且近似的估計P值。
第一個問題主要探討的問題是,如何把不同尺度資料都轉化到同一尺度、哪種尺度是最好的評量尺度都是值得探討的問題。本研究一開始透過給同一批受試者填寫同樣題目不同尺度的問卷,觀察他們的填答狀況變化並且找出對應方式並且從3個尺度中找出問卷評量最適合的尺度。結果顯示,為當尺度改變的時候,填答者填答的狀況也更為左偏。一般來說,尺度提升的時候,填答者給的分數平均也會變高,所以如果想要明確區分出使用者喜好,使用5分量表是較好的;如果單純希望填答結果偏向樂觀,則使用100分量表是較好的。本研究使用模糊理論建構模糊歸屬函數,建立了一個對照表來顯示不同尺度資料轉化時的狀況。
第二個問題裡,當使用統合分析時,如何估計P值。傳統上來說都是使用Peto法或是MH法,此兩種方法都是將未計算到的資料直接忽視,或是使用某些數值插補運算 (Peto-CC法、MH-CC法等) ,但插補前後所得P值均與真實值仍有落差。Liu et al. (2014) 提出了一種稱為CDF法 (Confidence Distribution Functions) 的統合分析,把前面的資料整合在一起,透過數學運算整合稱以得出更近似的P值。此方法提供了P值更近似的估算法,但由於使用時需要大量的數學運算,使得其他非數理統計背景的研究學者較不易使用,因此本研究在此提出簡單的估計方法,並驗證此方法與CDF法的估值結果差距不大。在閱讀相關文獻時,可以直接使用此簡單的估計法來針對文獻中給的Peto法或是MH法自行估計出一個近似真實P值的數值。
英文摘要 Through the Development of statistical study, data collection and analysis are very important topics. With the era of big data, statisticians developed many ways about data mining, the situation of data insufficient will be less and less in the future, the new issue is, how to get useful information from those data? On medical research, Meta-Analysis is a common statistical method. First, to explore the theme of the same or similar topics in the past papers. Second, to choice data which can be used, Third, to analysis them. This way offer a very big help in some rare diseases which are difficult to collect. In order to fully use all data, we need to find a way to change dimension to merge Questionnaires of different dimensions and find a ways to support people of different backgrounds to estimate P-value easily. That’s the two points of this thesis.
論文目次 第壹章、緒論 1
第一節 研究動機 1
第二節 研究目的 3
第三節 研究流程 5
第貳章、問卷尺度轉化方法介紹 6
第一節 動態時間校正法介紹 6
第二節 模糊理論 8
第參章、P值估法介紹 10
第一節 Peto法與MH法介紹與比較 10
第二節 CDF法介紹 16
第肆章、研究方法 17
第一節 收集問卷並建立模糊轉化模型 17
第二節 使用新的估值法與CDF法做比較 18
第伍章、資料收集與方法討論 19
第一節 收集資料 19
第二節 收案過程 20
第三節 研究問卷信度分析 21
第四節 分析 22
第陸章、研究結果 23
第一節 問卷資料分析 23
第二節 建立模糊函數以轉化不同尺度並與動態時間校正對照 29
第三節 新估值法與CDF法比較 32
第柒章、結論 35
第一節 結論 35
第二節 研究限制 36
第三節 未來研究方向與建議 37
參考資料 38

附錄
附錄一 5分量表問卷 40
附錄二 7分量表問卷 41
附錄三 100分量表問卷 42

表目錄
表1-1 糖尿病治療藥物對心肌梗塞影響的資料 3
表1-2 Study 49653/011放入2 × 2表中 3
表2-1 七分尺度與五分尺度之間各點的距離值 6
表2-2 七分尺度與五分尺度間各點最小累積距離值 7
表3-1 糖尿病治療藥物對心肌梗塞影響的資料 12
表3-2 Fleiss分析阿斯匹靈的使用對於心臟病致死有無影響的資料 12
表3-3 Fleiss資料的勝算比與信賴區間 13
表3-4 Armitage and Berry抽菸對肺癌有無影響的資料 14
表3-5 Armitage and Berry抽菸對肺癌有無影響的資料 study1 14
表3-6 Peto法和MH法的比較 15
表3-7 Avandia data和Promotion data的分析結果 16
表5-1 三種尺度量表之信度分析 21
表6-1 5分量表填答狀況 25
表6-2 7分量表填答狀況 25
表6-3 100分量表填答狀況 25
表6-4 不同尺度經動態時間校正化為5分量表後的T值檢
定結果 26
表6-5 5分量表、7分量表及100分量表第1題的填答的相
關係數表 26
表6-6 5分量表、7分量表及100分量表第2題的填答的相
關係數表 26
表6-7 5分量表、7分量表及100分量表第3題的填答的相
關係數表 27
表6-8 5分量表、7分量表及100分量表第4題的填答的相
關係數表 27
表6-9 5分量表、7分量表及100分量表第5題的填答的相
關係數表 27
表6-10 5分量表、7分量表及100分量表第6題的填答的相
關係數表 27
表6-11 5分量表、7分量表及100分量表第7題的填答的相
關係數表 27
表6-12 5分量表、7分量表及100分量表第8題的填答的相
關係數表 28
表6-13 5分量表、7分量表及100分量表第9題的填答的相
關係數表 28
表6-14 5分量表、7分量表及100分量表第10題的填答的相
關係數表 28
表6-15 5分量表、7分量表及100分量表第11題的填答的相
關係數表 28
表6-16 5分量表、7分量表及100分量表第12題的填答的相
關係數表 28
表6-17 7分量表對應到5分量表結果比較 30
表6-18 100分量表對應到5分量表結果比較 30
表6-19 三種量表第1題動態時間校正後的填答的相關係數 31
表6-20 三種量表第1題模糊轉化後的填答的相關係數 31
表6-21 Avandia data的分析結果 32
表6-22 統合分析範例資料分析結果 33

圖目錄
圖1-1 研究架構圖 5
圖2-1 使用動態時間校正轉化7分量表對應到5分量表的狀況 7
圖2-2 使用動態時間校正轉化100分量表對應的5分量表的狀況 7
圖4-1 問卷研究流程 17
圖5-1 問卷收案過程 20
圖6-1 三種尺度第1題到第3題填答狀況 23
圖6-2 三種尺度第4題到第6題填答狀況 23
圖6-3 三種尺度第7題到第9題填答狀況 24
圖6-4 三種尺度第10題到第12題填答狀況 24
圖6-5 第1題完整填答的54份分析狀況 29
圖6-6 7分量表對應5分量表模糊歸屬函數圖 30
圖6-7 100分量表對應5分量表模糊歸屬函數圖 30
參考文獻 林原宏、楊慧玲 (2002)‧模糊語意量表與傳統量表計分之模擬比較分析‧第四屆華
人心理學家學術研討會暨第六屆華人心理與行為科際學術研討會,台北市。
徐村和 (1998)‧模糊德菲層級分析法‧模糊系統學刊,第四卷第一期,59-72。
Armitage, P., Berry, G., & Matthews, J. N. S. (2008). Statistical methods in medical research. Example 15.6, Page516, John Wiley & Sons.
Berndt, D. J., & Clifford, J. (1994). Using Dynamic Time Warping to Find Patterns in Time
Series. In KDD workshop, Vol. 10, No. 16, 359-370.
Bradburn, M. J., Deeks, J. J., Berlin, J. A., & Russell Localio, A. (2007). Much ado about
nothing: a comparison of the performance of meta‐analytical methods with rare events. Statistics in medicine, Vol. 26, No. 1, 53-77.
Fleiss, J. L. (1993). Review papers: The statistical basis of meta-analysis.Statistical methods in medical research, Vol. 2, No. 2, 121-145.
Haldane, F. D. M. (1980). General relation of correlation exponents and spectral properties
of one-dimensional fermi systems: Application to the anisotropic s= 1/2 Heisenberg chain. Physical Review Letters, Vol. 45, No. 16, 1358-1362.
Liu, D., Liu, R. Y., & Xie, M. G. (2014). Exact meta-analysis approach for discrete data
and its application to 2×2 tables with rare events. Journal of the American Statistical Association, Vol. 109, No. 508, 1450-1465.
Mantel, N., & Haenszel, W. (1959). Statistical Aspects of the Analysis of Data From
Retrospective Studies of Disease. Journal of the National Cancer Institute, Vol. 22, No. 4, 719-748.
Nissen, S. E., & Wolski, K. (2007). Effect of rosiglitazone on the risk of myocardial
infarction and death from cardiovascular causes. New England Journal of Medicine, Vol. 356, No. 24, 2457-2471.
Parasuraman, A., Zeithaml, V. A., & Berry, L. L. (1988). SERVQUAL: A multiple-item
scale for measuring consumer perceptions of service quality. Journal of Retailing, Vol. 64, No. 1, 12-40.
Peto, R., & Peto, J. (1972). Asymptotically Efficient Rank Invariant Test Procedures.
Journal of the Royal Statistical Society. Series A (General), Vol. 135, No. 2, 185-
207.
Zadeh, L. (1965). Fuzzy sets. Information and Control, Vol. 8, No. 3, 338-353.
論文全文使用權限
  • 同意授權校內瀏覽/列印電子全文服務,於2021-06-01起公開。


  • 如您有疑問,請聯絡圖書館
    聯絡電話:(06)2757575#65773
    聯絡E-mail:etds@email.ncku.edu.tw