進階搜尋


下載電子全文  
系統識別號 U0026-1908201913363900
論文名稱(中文) 結合多變量相似與地理加權之房價預測模型
論文名稱(英文) Integrated covariate correlative and geographically weighted model for house price prediction
校院名稱 成功大學
系所名稱(中) 測量及空間資訊學系
系所名稱(英) Department of Geomatics
學年度 107
學期 2
出版年 108
研究生(中文) 陳柏宏
研究生(英文) Po-Hung Chen
電子信箱 s0923176979@gmail.com
學號 P66064112
學位類別 碩士
語文別 中文
論文頁數 97頁
口試委員 指導教授-朱宏杰
口試委員-張巍勳
口試委員-張升懋
口試委員-周嘉辰
中文關鍵字 地理加權迴歸  機器學習  房價預估 
英文關鍵字 Geographical Weighted Regression  Machine learning  house price prediction 
學科別分類
中文摘要 房價預測由於影響房價高低的原因非單一因子所造成,政府政策、經濟增長以及土地使用等因子都可能影響地區房價波動,其議題始終具挑戰性。考量其空間異質性,本研究將使用地理加權回歸(GWR)了解房價與因素間之相關性。地理加權回歸能透過允許迴歸係數在空間上的變化掌握空間異質性的影響與探索數據生成過程中的空間不穩定性。此外,本研究提出了CWR(Covariate Weighted Regression) 模型,延伸了原始GWR 權重計算方式,並結合最近鄰法(KNN),利用其運算迴歸成果之係數進行房價推估。在假設房價除了受到外部因子影響之外,房屋本身的屬性為影響價格的主要因素之下,迴歸權重參數調整之依據可利用房屋之間相似程度提供,透過資料的空間屬性計算其歐幾里得與高斯衰減函數獲得對應之權重矩陣。量化分析實驗中,採用了CWR 模型、原始GWR 模型並配合兩種不同的估算策略及機器學習模型種驗證模型表現,如:迴歸樹,除了透過視覺化差值分布圖及預測成果的相關係數圖了解樣本於各模型的預測成果之外,亦透過均方根誤差進行結果比較。結果顯示,本研究所發展之CWR 及CWR-KNN 模型在多數情況下優於迴歸樹之表現,在僅運用雙主要變數屋齡及面積的情況,於北屯區大樓房價預測案例中較迴歸樹模型改善7.9% 及8.2% 的均方根誤差。再者,考慮到房屋屬性的相似性並給予權重調整,結合本研究方法之CWR 模型亦能有效改善原始GWR模型之預測精度,為房價估價領域增添了一有效估計的方式。
英文摘要 House prices are affected by numerous reasons. Government policies, economic growth, and land use may cause regional housing price fluctuations. Thus, the housing price estimation problem will be challenging. This study aims to provide simple and efficient ways to estimate house prices. The normal regression model may not the best choice for estimation due to different house prices and heterogeneities in space. This paper proposed a covariate weighted regression (CWR) house price estimation model, which is an extended geographically weighted regression (GWR), under the conditions of various districts and house types. The GWR and the machine learning models are simultaneously used to verify the model performance and evaluate practical applications of datasets from actual selling prices of real estate and house price information websites. Results show that the proposed model has better performance than machine learning models in most of cases. Compared with the proposed model, in which only house age and building floor area are considered, the RMSE of machine learning and GWR models can be improved by 8.2% and 4.5%, respectively. Therefore, CWR can effectively reduce estimation errors from traditional spatial regression models and provide novel and feasible models for house price estimation.
論文目次 摘要i
英文延伸摘要ii
誌謝vi
目錄vii
表目錄xi
圖目錄xiii
第一章緒論1
1.1 前言. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 研究動機. . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 研究背景. . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.4 論文架構. . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5 研究流程. . . . . . . . . . . . . . . . . . . . . . . . . . . 9
第二章文獻回顧10
2.1 屋齡、面積、興趣點對於房價影響. . . . . . . . . . . . . 10
2.2 利用實價登錄資訊進行房價推估. . . . . . . . . . . . . . 11
2.3 房價推估之相關模型介紹. . . . . . . . . . . . . . . . . . 12
第三章研究方法15
3.1 資料前處理. . . . . . . . . . . . . . . . . . . . . . . . . . 15
3.1.1. 刪除不合理之房屋交易. . . . . . . . . . . . . . . 16
3.1.2. 門牌號碼去區段化. . . . . . . . . . . . . . . . . . 17
3.1.3. 門牌地址進行座標轉換. . . . . . . . . . . . . . . 18
3.1.4. 屋齡計算. . . . . . . . . . . . . . . . . . . . . . . 19
3.1.5. 依房型分類. . . . . . . . . . . . . . . . . . . . . . 20
3.2 因子篩選. . . . . . . . . . . . . . . . . . . . . . . . . . . 21
3.2.1. 流程介紹. . . . . . . . . . . . . . . . . . . . . . . 21
3.2.2. 因子相關性分析. . . . . . . . . . . . . . . . . . . 24
3.3 漸進梯度迴歸樹(Gradient Boosting Regression Tree) . . . 26
3.4 地理加權回歸(Geographically Weighted Regression) . . . . 27
3.5 時空地理加權回歸(Geographically and Temporal Weighted
Regression) . . . . . . . . . . . . . . . . . . . . . . . . . . 28
3.6 多變量加權回歸(Covariate Weighted Regression) . . . . . 29
3.7 時空多變量加權迴歸(Covariate and Temporal Weighted
Regression) . . . . . . . . . . . . . . . . . . . . . . . . . . 30
3.8 測試樣本迴歸係數推求及KNN 策略之房價推估. . . . . 31
3.8.1. 測試樣本迴歸係數推求. . . . . . . . . . . . . . . 31
3.8.2. KNN 策略之房價推估. . . . . . . . . . . . . . . . 33
第四章實驗結果與分析35
4.1 實驗資料與區域. . . . . . . . . . . . . . . . . . . . . . . 35
4.1.1. 實驗區域. . . . . . . . . . . . . . . . . . . . . . . 35
4.1.2. 實價登錄資訊. . . . . . . . . . . . . . . . . . . . 36
4.1.3. 興趣點(Point Of Interest) . . . . . . . . . . . . . . 38
4.1.4. 路網及土地使用分區資訊. . . . . . . . . . . . . . 39
4.2 CWR 模型房價預估表現結果. . . . . . . . . . . . . . . . 41
4.2.1. CWR 模型與CWR-KNN 於房價預估表現結果. . 41
4.2.2. 雙主要變數於各模型表現比較. . . . . . . . . . . 42
4.2.3. 多變數於各模型表現比較. . . . . . . . . . . . . . 53
4.3 KNN 策略對於模型表現之影響評估. . . . . . . . . . . . 69
4.3.1. KNN 取樣點數對CWR-KNN 影響評估. . . . . . 69
4.3.2. KNN 以實際距離為估算策略對CWR-KNN 影響
評估. . . . . . . . . . . . . . . . . . . . . . . . . 70
4.4 CWR 權重配比對房價預估影響之重要性. . . . . . . . . 73
4.4.1. CWR 及CWR-KNN 模型之最佳權重配比值. . . 73
4.4.2. 僅使用實際距離或屬性相似度之結果差異. . . . 74
4.5 CTWR 之時間考量對房價影響之重要性. . . . . . . . . . 76
4.6 重疊位址對於房價預估模型之影響. . . . . . . . . . . . . 78
4.7 實際案例應用-房屋仲介網資訊應用於本研究模型之預估
成果. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
第五章結論與建議83
參考文獻84
附錄A 完整因子表88
附錄B 特徵分布表89
B.1 各區屋齡分布圖. . . . . . . . . . . . . . . . . . . . . . . 89
B.2 各區面積分布圖. . . . . . . . . . . . . . . . . . . . . . . 92
B.3 各區房屋價格分布圖. . . . . . . . . . . . . . . . . . . . . 95
參考文獻 Bitter, C., Mulligan, G., & Dall’erba, S. (2007). Incorporating spatial variation in housing attribute prices:a comparison of geographically weighted regression and the spatial expansion method. Journal ofGeographic System, 9, 7-27.
Chu, H., Huang, B., & Lin, C. (2015). Modeling the spatio-temporal heterogeneity in the pm10-pm2.5 relationship. Atmospheric Environment, 102, 176-182.
Dudani, S. (1976). The distance-weighted k-nearest-neighbor rule. IEEE Trans. Syst. Man Cybern., 6, 325-327.
Fix, E., & Hodges, J. (1951). Discriminatory analysis, nonparametric discrimination: Consistency properties. Technical Report.
Fotheringham, A. S., & Charlton, C., M. E.and Brunsdon. (1998).
Geographically weighted regression:a natural evolution of the
expansion method for spatila data analysis. Environment and
Planning A, 30, 1905-1927.
Friedman, J. (2001). Greedy function approximation: a gradient boosting
machine. The Annals of Statistics, 29(5), 1189-1232.
Fotheringham, A. S., Brunsdon, C., & Charlton, M. (2002). Geographically
Weighted Regression: The Analysis of Spatially Varying Relationships.
John Wiley & Sons, 13.
Foody, G. M. (2003). Geographical weighting as a further refinement
to regression modeling: An example focused on the ndvi-rainfall
relationship. Remote Sening of Enviroment, 88, 283-293.
Huang, B., Wu, B., & Barry, M. (2010). Geographically and temporally
weighted regression for modeling spatio-temporal variation in house
prices. International Journal of Geographical Information Science,
24(3), 383-401.
Jozwik, A. (1983). learning scheme for a fuzzy k-nn rule. Pattern Recognition
Letters., 1, 287-289.
Liu, J., Yang, Y., Xu, S., Zhao, Y., Wang, Y., & Zhang, F. (2016). A
geographically temporal weighted regression approach with travel
distance for house price estimation. Entropy, 18(8), 303.
Moranton, A. B. (2003). A hedonic valuation of urban green areas. Landscape
and Urban Planning of Political Economy, 82, 34-5.
Nguyen, N., & Cripps, A. (2001). Predicting Housing Value: A Comparison
of Multiple Regression Analysis and Atrificial Neural Networks.
The Journal of Real Estate Reserch, 22(3), 313-336.
Natekin, A., & Knoll, A. (2013). Gradient boosting machines, a tutorial.
Frontiers in Neuro robotics, 7(21).
Pagourtzi, E., Assimakopoulos, V., Hatzichristos, T., & French, N. (2003,
August). Real estate appraisal: a review of valuation methods.
Journal of Property Investment and Finance, 21(4), 383-401.
P’aez, A. (2006). Exploring contextual variations in land use and transport
analysis using a probit model with geographical weights. Journal of
Transport Geography, 14, 167-176.
王聰仁(2014),「不動產交易實價登錄之研究」(碩士論文)。淡江大學
公共行政學系公共政策碩士在職專班。
王子豪(2014),「運用特徵價格法與實質選擇權在都市更新事業概要
審議期間之投資可行性評估」(碩士論文),國立成功大學都市
計畫學系研究所。
冉怡瑄(2010), 「應用迴歸樹演算法於房地產估價之研究」(碩士論
文)。長庚大學資訊管理研究所。
任立斌(2018),「應用特徵選取進行股價預測與獲利可能性之研究」
(碩士論文),國立中興大學資訊管理學系碩士班。
江燮珍(2016),「以時空地理加權迴歸模式建立衛星影像遙測水庫水
質之研究」(碩士論文),成功大學測量及空間資訊學系碩士班。
李嘉淵(2005),「應用演化式類神經網路、灰關聯分析及類神經模糊於不動產估價之研究」(碩士論文),朝陽科技大學財務金融學
系研究所。
周怡君(2017),「便利值多少-便利商店帶給鄰近居民的價值或損害」
(碩士論文),國立臺灣大學農業經濟學系研究所。
林英彥(2003),「不動產估價(第十版)」,文笙書局。
林素菁(2004), 「台北市國中小明星學區邊際願意支付之估計」, 住
宅學報, 13(1), 15-34。
林英彥(2004),「不動產估價(第十版)」,文笙書局。
林昭妏(2014),「實價登錄之類神經網路估價模型-以高雄市農16 及美
術館區大樓為例」(碩士論文),長榮大學土地管理與開發學系
研究所。
林崇翔(2018),「使用GBRT 預測短期國道交通路況」(碩士論文)。國
立交通大學資訊科學與工程學系研究所。
翁淑貞(1992),「台北都會區空氣污染對住宅價格影響之研究-應用特
徵價格法」(碩士論文),國立中興大學法商學院都市計畫究所。
張仲霆(2016),「車聯網之應用: 基於點集拓樸學比對及knn 最近鄰居
法之車輛合作定位系統」(碩士論文),國立臺灣大學電機工程
學系碩士班。
張哲文(2017),「實價登錄資料庫結合類神經網路推估房地產市價」
(碩士論文),國立中興大學土木工程學系研究所。
陳惠珍(2014),「影響台中市法拍房地產拍定價格因素之研究」(碩士
論文),朝揚科技大學財務金融系研究所。
陳勇勝(2016),「實施房地合一課徵所得稅之探討」(碩士論文)。臺灣
大學經濟學研究所學位論文碩士班。
彭宴玲(2005),「台北市綠地效益之評價-特徵價格法之應用」(碩士論
文),中國文化大學景觀學系研究所。
黃于祐(2008),「台北市房價影響因素之空間分析-地理加權回歸方法
之應用」(碩士論文),台北大學都市計畫學系研究所。
廖豐進(2014),「實價登錄後臺中市住宅價格之研究」(碩士論文)。國
立台中科技大學財務金融系碩士班。
劉玉婷(2009),「應用迴歸分析及類神經網路建構不動產估價模型-以
台中市住宅為例」(碩士論文),國立雲林科技大學營建工程學
系研究所。
劉時序(2012),「類神經網路應用於法拍不動產估價」(碩士論文)。國
立中興大學土木工程學系研究所。
賴碧瑩(2009),「現代不動產估價理論與實務」,智勝文化。
謝孟勳(2017),「實價登錄資料庫結合類神經網路推估房地產市價」
(碩士論文),國立中興大學土木工程學系研究所。
蘇京皓(2003),「特徵價格法與地理資訊系統之應用-以輸變電設施
對住宅價格影響為例」(碩士論文),國立臺北大學地政學系研
究所。
論文全文使用權限
  • 同意授權校內瀏覽/列印電子全文服務,於2019-12-31起公開。
  • 同意授權校外瀏覽/列印電子全文服務,於2019-12-31起公開。


  • 如您有疑問,請聯絡圖書館
    聯絡電話:(06)2757575#65773
    聯絡E-mail:etds@email.ncku.edu.tw