國立臺灣大學電機工程學系暨研究所張時中2006-07-252018-07-062006-07-252018-07-062004-07-31http://ntur.lib.ntu.edu.tw//handle/246246/7965本報告總結第二年在本計畫的支持下的研 究進展,包含三項工作:(1) 結合排序佳化模擬與 策略疊代求解派工問題馬可夫決策模型的快速演 算法研發; (2)研究增強式學習應用在派工問題 的馬可夫決策模型求解的可能性,著重在有設置 時間之單一機台派工問題,及可調速率之生產機 台問題; (3)透過文獻回顧推估全球運籌資訊服務 體系加入資訊服務網路可能帶來的潛在效益與成 本降低,進而評估全球運籌資訊服務對電子業整 體市場之潛在效益。The second year of research includes three tasks (1) development of fast simulation for solving the Markov decision process formulation of dispatching problem by combining ordinal optimization and policy iteration, (2) investigation of applicability of re-enforcement learning to Markov decision process formulation of dispatching problems, and (3) niche assessment by literature survey of logistic information application service provider for electronics industry.application/pdf150275 bytesapplication/pdfzh-TW國立臺灣大學電機工程學系暨研究所派工馬可夫決策過程增強式學習時 變全球運籌資訊服務體系資訊服務網路以模擬進行排序佳化的方法研究及其於生產排程之應用(2/3)Simulation-based Ordinal Optimization Methods with Applications to Production Scheduling(2/3)reporthttp://ntur.lib.ntu.edu.tw/bitstream/246246/7965/1/922212E002060.pdf