人機混合智能系統自主性理論和方法
《人機混合智能系統自主性理論和方法》,趙雲波,康宇,朱進 著,出版社: 科學出版社。
書籍是用文字、圖畫和其他符號,在一定材料上記錄各種知識,清楚地表達思想,並且制裝成卷冊的著作物[1],為傳播各種知識和思想,積累人類文化的重要工具。它隨着歷史的發展,在書寫方式、所使用的材料和裝幀形式[2],以及形態方面,也在不斷變化與變更。
目錄
內容簡介
人的智能和AI賦能的機器智能在自動化控制領域的共融共存形成了「人機混合智能系統」這一新型的系統形式和智能形式。一方面,這類系統所代表的系統結構形式是傳統自動化控制系統應對AI賦能的機器智能變革的必然發展形勢;另一方面,它所代表的智能形式也成為AI未來發展的重要甚至是終極形式。在本《人機混合智能系統自主性理論和方法》,我們試圖拋磚引玉,對這一全新而重要的研究領域提供初步但系統性的思考。《人機混合智能系統自主性理論和方法》共分10章,第1章首先討論了人工智能時代人機系統的新發展,然後分別介紹人機混合智能系統的自主性基本理論(第I部分,包括第2~5章)和設計方法(第Ⅱ部分,包括第6~10章),涵蓋了人機混合智能系統的自主性定義、邊界判定、各種介入控制和共享控制方法等重要內容。
目錄
前言
第1章 人工智能時代人機系統的新發展 1
1.1 面向自動化控制的人機系統 1
1.1.1 系統、機器和人 1
1.1.2 人機系統典型例子 3
1.1.3 研究人機系統的必要性 5
1.1.4 人機系統相關研究領域 6
1.2 人工智能時代的人機混合智能系統 8
1.2.1 人工智能技術的未來展望 8
1.2.2 弱人工智能與人機混合智能系統 11
1.2.3 人機混合智能系統的典型例子和場景 15
1.2.4 人機混合智能系統中人的位置 20
1.3 人機混合智能系統的研究挑戰 21
1.3.1 作為關鍵核心的自主性 21
1.3.2 人機混合智能系統及其自主性的相關研究 22
1.3.3 人機混合智能系統研究面臨的挑戰 28
1.3.4 學術界和政府關注 29
1.4 本章小結 30
第I部分 人機混合智能系統自主性理論
第2章 人機混合智能系統基於空間和邊界概念的自主性描述框架 33
2.1 人機混合智能系統的自主性及其邊界 33
2.1.1 人機混合智能系統的智能與自主性的一般討論 33
2.1.2 人機混合智能系統的自主性空間 36
2.1.3 人機混合智能系統的自主性邊界 39
2.2 自主性空間和自主性邊界的擴展 41
2.2.1 自主性絕對邊界 42
2.2.2 自主性相對空間和相對邊界 43
2.3 人與機器自主決策的聯合形式表示 44
2.4 本章小結 45
第3章 人機混合智能系統基於自主性聯合空間和聯合邊界的設計框架.46
3.1 人機混合智能系統的基本控制策略和設計框架 46
3.1.1 人機混合智能系統的基本控制策略:介入控制和共享控制 46
3.1.2 人機混合智能系統的基本設計框架:自主性聯合空間和聯合邊界 49
3.2 人在環上:人機混合智能系統的介入控制 52
3.2.1 機器(單向)介入控制 52
3.2.2 人的(單向)介入控制 53
3.2.3 人機切換(雙向介入)控制 54
3.3 人在環內:人機系統中人與機器的共享控制 56
3.3.1 基本共享控制 56
3.3.2 擴展共享控制 57
3.4 本章小結 58
第4章 自主性邊界:深度學習不確定性的定量刻畫 59
4.1 面向人機混合智能系統的深度學習不確定性的定量刻畫 59
4.2 基於貝葉斯模型刻畫深度學習不確定性的幾種代表性方法 61
4.2.1 Probabilistic backpropagation方法 61
4.2.2 Bayes by backprop方法 63
4.2.3 MC dropout方法 65
4.3 模型不確定性在強化學習中的應用 66
4.3.1 通過量化模型不確定性促進深入探索 67
4.3.2 通過量化模型不確定性實現動態避障 68
4.4 本章小結 69
第5章 自主性邊界:不同場景下的典型判定及應用 70
5.1 介入控制下的自主性邊界典型判定及應用 70
5.1.1 機器介入人:利用自主性邊界的判定優化機器對人的*小干預 70
5.1.2 人介入機器:利用自主性邊界的判定優化強化學習算法 74
5.2 共享控制下的自主性邊界典型判定及應用 77
5.2.1 共享控制中的自主性邊界判定 77
5.2.2 基於仲裁機制的人機共享控制 79
5.2.3 利用自主性邊界優化基於仲裁機制的人機共享控制 80
5.3 本章小結 82
第II部分 人機混合智能系統設計方法
第6章 人在環上:人的認知提升機器智能 85
6.1 利用人的認知特性提升機器學習算法性能的基本思想 85
6.2 利用人的認知心理模型提升機器智能 86
6.2.1 樸素貝葉斯算法介紹 87
6.2.2 利用人的認知特性的拉普拉斯平滑模型對樸素貝葉斯算法性能的提升 89
6.2.3 利用人的認知特性的鬆散對稱模型對樸素貝葉斯算法性能的提升 91
6.2.4 引入鬆散對稱模型提升基於拉普拉斯平滑的樸素貝葉斯算法的性能 94
6.3 利用人的生理認知特性提升機器智能 96
6.3.1 目標識別任務中人的生理認知特性測量 96
6.3.2 利用人腦視覺神經的活動特點改進支持向量機算法 97
6.4 本章小結 100
第7章 人在環上:人的介入增強AI系統可靠性 101
7.1 增強AI系統可靠性的必要性和重要性.101
7.1.1 對AI系統可靠性的要求 101
7.1.2 現有技術框架難以從本質上保證AI系統的可靠性 103
7.2 人的介入增強AI系統可靠性的思路和方法框架 104
7.2.1 人的介入增強AI系統可靠性的基本思路 104
7.2.2 人的介入增強AI系統可靠性的基本框架 105
7.3 人的介入提升珍珠分揀準確性 107
7.3.1 方法和實驗設置 107
7.3.2 獨立網絡模型的搭建及訓練.108
7.3.3 基於人的分歧介入方法的珍珠分揀實驗結果 109
7.4 本章小結 109
第8章 人在環內:基於POMDP的共享自主 110
8.1 POMDP模型及其求解 110
8.1.1 POMDP模型表示 110
8.1.2 POMDP模型求解 112
8.2 基於POMDP的人機共享自主典型實例 113
8.2.1 利用POMDP實現汽車車道保持的共享自主 114
8.2.2 利用POMDP實現智能學習輔助系統的共享自主 116
8.3 過度信任和缺乏信任在基於POMDP的共享控制框架下的解釋 118
8.4 本章小結 120
第9章 人在環內:基於強化學習的共享控制 121
9.1 強化學習和深度強化學習基本知識 121
9.1.1 強化學習基本知識 121
9.1.2 深度強化學習基本知識 124
9.2 基於強化學習的共享控制典型方法 127
9.2.1 基於DQN的無須先驗知識的共享控制方法 127
9.2.2 基於SAC的無須預先訓練的共享控制方法 129
9.2.3 基於AC的無須動態模型的共享控制方法 132
9.3 基於強化學習的共享控制實例 134
9.4 本章小結 136
第10章 人在環內:人機序貫決策的共享控制 138
10.1 序貫決策的基本概念.138
10.2 人機序貫決策問題的典型場景.141
10.2.1 「人參與問題」的人機序貫決策 141
10.2.2 「人介入方法」的人機序貫決策 142
10.3 基於POMDP方法求解「人參與問題」的人機序貫決策問題 143
10.3.1 「人參與問題」的人機序貫決策問題的POMDP框架概述 143
10.3.2 人機系統的POMDP框架實現駕駛輔助系統中的「車道保持」 145
10.4 基於MPC方法求解「人參與問題」的人機序貫決策問題 147
10.4.1 「人參與問題」的人機序貫決策問題的MPC框架概述 147
10.4.2 人機系統的MPC框架實現輔助駕駛系統中的「車輛變道」 148
10.5 基於RL方案求解「人介入方法」的人機序貫決策問題 150
10.5.1 「人介入方法」的人機序貫決策問題的RL框架概述 150
10.5.2 人機系統的RL框架實現倒立擺系統性能的提升 152
10.6 本章小結 154
參考文獻 155
索引 167
插圖目錄 169
表格目錄171
算法目錄 172
定義列表 173
例子列表 174
參考文獻
- ↑ 作品、著作物與版權,道客巴巴,2014-11-09
- ↑ 書籍裝幀設計的分類及藝術表現形式,豆丁網,2016-08-14