系統識別號 U0026-1708202011211100
論文名稱(中文) 應用BERT模型執行TRL分級
論文名稱(英文) TRL Labeling by BERT Model
校院名稱 成功大學
系所名稱(中) 工程科學系
系所名稱(英) Department of Engineering Science
學年度 108
學期 2
出版年 109
研究生(中文) 丁士珉
研究生(英文) Shin-Min Ting
學號 N96071106
學位類別 碩士
語文別 中文
論文頁數 56頁
口試委員 指導教授-王明習
中文關鍵字 技術成熟度  自然語言處理  機器學習  雙向變形編碼器語言表示模型 
英文關鍵字 Technical Readiness Level (TRL)  Natural Language Processing (NLP)  Machine Learning  Bidirectional Encoder Representations from Transformer (BERT) 
中文摘要 技術成熟度(Technical Readiness Level, TRL)是一項用來評估技術發展程度的指標,其評估方式大致分為由研發人員自行評估或是由外部相關領域專家來評估兩種,但同一評估目標的分級可能因為評估者的背景而有差異,評測者也必須經過閱讀大量資料後,才能夠給予評測目標一個合適的分級,因此需要耗費大量的時間與人力資源,所以本研究想透過近年來蓬勃發展的電腦技術來節省寶貴的人力,也希望能產生更客觀的分級結果。本研究使用由Google開發、在自然語言處理(Natural Language Processing, NLP)領域取得頂尖成績的雙向變形編碼器語言表示模型(Bidirectional Encoder Representations from Transformers, BERT)來進行,內容為根據評測者所評測的簡單評述來給予技術成熟度分級的實驗,隨著時間推進與技術成熟度分級的推廣,未來將會有更多的評測資料可供機器學習(Machine Learning)使用。本研究使用經外部專家評測後的資料,擷取項目名稱、學科領域類別、計畫內容簡述等項目來訓練模型,並讓模型產生對於該計畫之技術成熟度等級的預測。我們得到的成果顯示簡述的書寫方式對於預測目標有很大的影響,從我們所蒐集到的資料中,得到75%左右的精確度。
英文摘要 Technical Readiness Level (TRL) is a criterion to measure the developing stage of one technology or project. The measurement comes in two ways, one is done by developing group themselves and the other is done by external professionals with relative domain knowledge. However, the level given to the exact same technology may vary by estimator’s background, and the estimators may have to examine a lot of paper or data to determine the level of the project. The measurement is time consuming and requires precious human resources. In this study, it is tried to use computer to do the TRL leveling job, to save time and/or human resources and provide an objective measurement. The Bidirectional Encoder Representations from Transformer (BERT) model is applied as the core component for this study. The BERT model is proposed by Google and achieves state-of-the-art performance in natural language processing domain. The training and testing data comes from the results of professional expert evaluation for project results. Each evaluation result includes a brief summary which state about the developed techniques, the maturity of the developed method for applying the result to different phase of the relative application. In this study, 1163 data is collected, 960 for training and 203 for testing. From the experimental results show, the accuracy of the proposed method is around 75%.
論文目次 摘要 ii
目錄 viii
圖目錄 x
表目錄 xii
第一章 緒論 1
1.1 研究背景與動機 1
1.2 研究目的 1
1.3 論文架構 2
第二章 相關資料探討 3
2.1 技術成熟度 3
2.2 預測方法 5
2.2.1 自然語言處理 5
2.2.2 類神經網路之概述 6
2.2.3 注意力機制 12
2.3 相關文獻探討 26
第三章 研究方法 29
3.1 數據集與預先處理流程 29
3.2 實驗流程與預訓練模型結構 32
3.3 實際訓練與測試過程 34
第四章 實驗結果與討論 36
4.1 實驗環境 38
4.2 實驗結果與數據 38
4.2.1 原始資料測試 39
4.2.2 新增描述語句實驗 42
4.2.3 刪去描述不足資料實驗 46
4.3 實驗結果討論 49
第五章 結論與未來展望 51
參考文獻 52
