日本一区二区三区久久精品,欧美一区二区三区婷婷月色,.xyz国产精品,中文字幕精品视频在线

學(xué)術(shù)活動(dòng)

學(xué)術(shù)報告 《強化學(xué)習概述及其應用范例》

活動(dòng)時(shí)間: 活動(dòng)地點(diǎn): 發(fā)布時(shí)間:2017年10月29日 16:17

報告時(shí)間:2017年10月30日(周一)10:00

報告地點(diǎn):東校區信息館401學(xué)術(shù)報告廳

報告題目:《強化學(xué)習概述及其應用范例》

報告人簡(jiǎn)介:黃國勝,美國西北大學(xué)計算機工程博士,國立中山大學(xué)電機工程學(xué)系教授,臺灣系統學(xué)會(huì )理事、臺灣機器人學(xué)會(huì )理事、臺灣自動(dòng)控制學(xué)會(huì )理事、IEEE Trans. on Cybernetics, Associate Editor及IEEE Trans. on Mechatronics, Technical Editor。研究領(lǐng)域:智能機器人及智能系統。在IEEE Transactions FS, IE, II, SMC-A, B ,NNLT等國際期刊發(fā)表論文70余篇。

內容簡(jiǎn)介:強化學(xué)習是機器學(xué)習中的一個(gè)領(lǐng)域,強調如何基于環(huán)境而行動(dòng),以取得最大化的預期利益。其靈感來(lái)源于心理學(xué)中的行為主義理論,即有機體如何在環(huán)境給予的獎勵或懲罰的刺激下,逐步形成對刺激的預期,產(chǎn)生能獲得最大利益的習慣性行為。這個(gè)方法具有普適性,因此在其他許多領(lǐng)域都有研究,例如博弈論、控制論、運籌學(xué)、信息論、仿真優(yōu)化、多主體系統學(xué)習、群體智能、統計學(xué)以及遺傳算法。強化學(xué)習和標準的監督式學(xué)習之間的區別在于,它并不需要出現正確的輸入/輸出對,也不需要精確校正次優(yōu)化的行為。強化學(xué)習更加專(zhuān)注于在線(xiàn)規劃,需要在探索(在未知的領(lǐng)域)和遵從(現有知識)之間找到平衡。本次報告將簡(jiǎn)介強化學(xué)習的基本概念以及其在報告人的研究團隊所應用范例。希望在聽(tīng)講后能對強化學(xué)習有初步理論概念,激發(fā)在此研究興趣。

Reinforcement learning (RL) is an area of machine learning inspired by behaviorist psychology, concerned with how software agents ought to take actions in an environment so as to maximize some notion of cumulative reward. The problem, due to its generality, is studied in many other disciplines, such as game theory, control theory, operations research, information theory, Reinforcement learning differs from standard supervised learning in that correct input/output pairs are never presented, nor sub-optimal actions explicitly corrected. Instead the focus is on on-line performance, which involves finding a balance between exploration (of uncharted territory) and exploitation (of current knowledge).The theme of this speech will deliver a preliminary concept of RL and introduction to its applications implemented by the speaker’s laboratory. It is expected that the audiences can acquire rapidly the insights into the researches on RL and the inspiration as well.

信息科學(xué)與工程學(xué)院

2017年10月29日