组学机器学习
内容简介
人工智能驱动的组学挖掘是数据驱动的生物医学研究的支撑技术。组学测序技术逐步向多尺度、跨模态、有扰动等方向发展,但体现出的高维度、高噪声、多模态、标记稀缺等特点,成为制约其有效挖掘的瓶颈。《组学机器学习》面向生命组学数据特点,较为系统和深入地对组学机器学习的主要研究范式、适用场景、分析方法、理论思想进行介绍。结合相应组学挖掘的具体研究案例,向读者展示组学人工智能驱动的生命健康交叉研究的绚烂图景。
目录
- 部分 组学机器学习导论
第1章 组学机器学习概述 3
1.1 组学概述 3
1.2 组学机器学习 6
1.3 本章小结 8
参考文献 10
第二部分 组学的表征学习
第2章 组学的表征——度量13
2.1 度量学习 13
2.2 案例一:基于参考单细胞转录组进行细胞类型识别的度量学习 17
2.3 案例二:整合多个参考单细胞组进行细胞类型识别的度量学习 34
2.4 案例三:药物基因组的度量学习 47
2.5 本章小结 58
参考文献 58
第3章 组学的表征——嵌入66
3.1 嵌入66
3.2 案例:CRISPR功能基因组的嵌入学习72
3.3 本章小结 83
参考文献 84
第4章组学的表征——多模态整合 87
4.1多模态整合87
4.2案例:单细胞RNA-seq和单细胞ATAC-seq多模态整合 95
4.3本章小结 114
参考文献114
第三部分 组学的弱监督学习
第5章 组学的不完备监督——半监督学习 123
5.1 半监督学习 123
5.2 案例:抗癌药物组合预测的半监督学习 127
5.3 本章小结 138
参考文献138
第6章 组学的不完备监督——迁移学习141
6.1 迁移学习 141
6.2 案例一:基因编辑系统优化设计的迁移学习146
6.3 案例二:药物小分子设计的迁移学习 158
6.4 本章小结 166
参考文献167
第7章 组学的不完备监督——元学习 171
7.1 元学习171
7.2 案例:抗原 -TCR识别的元学习 175
7.3 本章小结 186
参考文献187
第8章 组学的不完备监督——主动学习190
8.1 主动学习 190
8.2 案例:基于主动学习的化学反应定量建模 198
8.3 本章小结 208
参考文献208
第四部分 组学的隐私计算
第9章 组学的隐私保护——联邦学习 217
9.1 联邦学习 217
9.2 案例一:药物小分子定量构效关系建模的联邦学习 220
9.3 案例二:单细胞组学整合的联邦学习 225
9.4 本章小结 233
参考文献 234
总结与展望 237
术语表 239
参考文献
- ↑ 什么是时代的知识结构——汤胜天,搜狐,2016-11-04
- ↑ 陈丹青:何谓人文素质教育? ,搜狐,2017-11-24