求真百科歡迎當事人提供第一手真實資料,洗刷冤屈,終結網路霸凌。

強化學習的數學原理英文版檢視原始碼討論檢視歷史

事實揭露 揭密真相
前往: 導覽搜尋

來自 孔夫子網 的圖片

強化學習的數學原理英文版》,作者趙世鈺,責編郭賽,定價118.00,ISBN號9787302658528,出版社清華大學出版社,版印次1版 1次,開本16開,裝幀平裝,頁數301,出版時間2024-07,印刷時間2024-07。

清華大學出版社成立於1980年6月,是教育部主管、清華大學主辦的綜合性大學出版社[1]。清華社現年出版圖書、音像製品、電子出版物等近3000種,銷售規模和綜合實力以及在高等教育教材市場、科技圖書市場、館配圖書市場占有率均名列前茅[2]

內容簡介

本書從強化學習最基本的概念開始介紹,將介紹基礎的分析工具,包括貝爾曼公式和貝爾曼最優公式,然後推廣到基於模型的和無模型的強化學習算法,最後推廣到基於函數逼近的強化學法。本書強調從數學的角度引入概念、分析問題、分析算法,並不強調算法的編程實現。本書不要求讀者具備任何關於強化學習的知識背景,僅要求讀者具備一定的概率論和線性代數的知識。如果讀者已經具備強化學習的學習基礎,本書可以幫助讀者更深入地理解一些問題並提供新的視角。

本書面向對強化學習感興趣的本科生、研究生、研究人員和企業或研究所的從業者。

作者介紹

趙世鈺,西湖大學工學院AI分支特聘研究員,智能無人系統實驗室負責人,國家海外高層次人才引進計劃青年項目獲得者;本碩畢業於北京航空航天大學,博士畢業於新加坡國立大學,曾任英國謝菲爾德大學自動控制與系統工程系Lecturer;致力於研發有趣、有用、有挑戰性的下一代機器人系統,重點關注多機器人系統中的控制、決策與感知等問題。

參考文獻

  1. 我國出版社的等級劃分和分類標準,知網出書,2021-03-01
  2. 企業簡介,清華大學出版社有限公司