呂育道臺灣大學:資訊工程學研究所賴怡玲Lai, Yi-LingYi-LingLai2010-05-172018-07-052010-05-172018-07-052009U0001-3006200916011100http://ntur.lib.ntu.edu.tw//handle/246246/183385增強式學習法具有與環境互動及延遲報酬兩大特色,適合應用在決策控制系統的問題上,因此本研究採用增強式學習法來建立臺灣股價指數期貨的當沖交易策略。在系統設計上,我們嘗試了三種不同的狀態定義方式、採用Q-learning及SARSA兩種不同的演算法,另外也針對停損、停利點的設置進行討論。檢測其可用性,我們採用2004年1月1日至2008年6月30日之臺灣股價指數期貨歷史資料進行學習訓練及績效檢測。Learning from interacting with environment and delayed reward are the two most important features of reinforcement learning. Because of these two characteristics, reinforcement learning is suitable for control problems. This thesis adopts reinforcement learning to establish several Taiwan stock index future intra-day trading strategies. We design three different definitions of state and use Q-learning and SARSA to implement reinforcement learning. In addition, we discuss the effect of setting maximum acceptable loss and minimum acceptable profit. o verify the usability of our strategies, we use real historical data for back testing and then examine the performance of the trading strategies.口試委員會審定書 i謝 ii文摘要 iiibstract iv一章 緒論 1.1研究動機 1.2研究目的 1.3論文架構 2二章 背景知識 3.1行為財務學 3.2交易策略 4.3技術分析 4.3.1 K線 5.3.2移動平均線 5.3.3平均交易量 6.4增強式學習法 6.4.1時間差分法 7.4.2 SARSA 8.4.3 Q-learning 9三章 研究方法 10.1系統設計 10.1.1狀態 10.1.2動作 10.1.3報酬 11.1.4價值函數 11.2實驗設計 11.2.1實驗資料 11.2.2交易環境設定 11.2.3實驗模型設計 12四章 實驗結果與分析 13.1各模型績效一覽表 13.2各模型績效比較分析 18五章 總結與展望 22.1結論 22.2未來展望 22考文獻 24application/pdf542923 bytesapplication/pdfen-US交易策略當日沖銷臺股期貨機器學習增強式學習法SARSAQ-learningTrading strategyIntra-day tradingTaiwan stock index futureMachine learningReinforcement Learning使用增強式學習法建立臺灣股價指數期貨當沖交易策略Using Reinforcement Learning to Establish Taiwan Stock Index Future Intra-day Trading Strategiesthesishttp://ntur.lib.ntu.edu.tw/bitstream/246246/183385/1/ntu-98-R96922117-1.pdf