系統識別號 U0026-0309201510440600
論文名稱(中文) 以文字探勘方法建構專利地圖並探測潛力技術機會之研究
論文名稱(英文) Constructing patent map and detecting potential technological opportunities using text mining techniques
校院名稱 成功大學
系所名稱(中) 資訊管理研究所
系所名稱(英) Institute of Information Management
學年度 103
學期 2
出版年 104
研究生(中文) 夏平倫
研究生(英文) Ping-Lun Hsia
學號 R76021118
學位類別 碩士
語文別 中文
論文頁數 38頁
口試委員 指導教授-王惠嘉
中文關鍵字 文字探勘  專利地圖  資訊檢索 
英文關鍵字 Text mining  Patent map  Information retrieval 
中文摘要 當專利權受到侵害時,專利權人可向侵權人要求賠償所受到的損失,因此企業若捲入專利侵權案,往往需付出龐大的時間與金錢作為代價。而隨著知識經濟時代的到來,企業間的競爭其實就是智慧財產權的競爭,先行占領未來有潛力或可能成為熱門技術領域之專利權,即可幫助企業取得未來競爭優勢。因此,專利在商場上的重要性絕對不可小覷。然而,隨著科技的快速發展以及時間的累積,專利文件的數量非常龐大。如何有效的管理龐大數量的專利文件,已是目前炙手可熱議題。
英文摘要 The patentee can get the reparation for loss while the patents are infringed. If a company gets embroiled in legal disputes for patent infringement, significant losses in time and costs can occur. With the arrival of knowledge-based economy, Companies compete for the Intellectual Property Rights frequently. Occupying the patents of potential technological fields in advance will assists a company in acquiring competitive advantage in the future. As a result, patents play an important role in the marketplace. With the advance of science and technology, the amount of patent grows larger as time goes on. How to manage the considerable patents effectively is currently an important issue.
Patent map is the visualization of the results of statistical analysis applied to patent documents. This study proposes a method for constructing patent map and recommending technological vacancy. When companies are formulating research and development strategies, patent map allows them to distinguish the patent similarity and assists them in avoiding developing similar technique. The recommendation function assists companies in assessing whether to occupy technological vacancy in advance for acquiring competitive advantage in the future.
One feature of this study is the method of dimension reduction of the terms. In text mining, the sparse matrix generated by the considerable terms usually costs a lot of computational resource. Dimension reduction of the terms will save storage spaces and increase execution efficiency.
論文目次 第1章 緒論 1
1.1 研究背景與動機 1
1.2 研究目的 3
1.3 研究範圍 3
1.4 研究流程 4
1.5 論文大綱 5
第2章 文獻探討 6
2.1 自然語言處理 6
2.1.1 語意網 – WordNet 6
2.1.2 詞性標記 8
2.1.3 字根還原 8
2.1.4 停用字 9
2.2 資訊檢索 9
2.3 多維尺度 11
2.4 分群演算法 13
2.4.1 分割式分群法 13
2.4.2 階層式分群法 14
2.4.3 分群效度評估 15
第3章 研究方法 17
3.1 研究架構 17
3.2 文件收集與前處理模組 19
3.3 字詞相似度計算與字詞分群模組 21
3.4 文件相似度計算模組 23
3.5 多維尺度降維模組 24
3.6 文件離群程度計算模組 25
第4章 系統建置與驗證 27
4.1 系統建置 27
4.2 實驗設計與實驗結果分析 27
4.2.1 資料集 27
4.2.2 實驗一:探討語意網對專利檢索效果之影響 28
4.2.3 實驗二:探討離群程度較高之專利文件 29
第5章 結論與未來研究方向 33
5.1 研究成果 33
5.2 未來研究方向 34
