统计分析查看源代码讨论查看历史
《统计分析》,副标题:以R语言为工具,出版社: 北京大学出版社,ISBN:9787301323427。
北京大学出版社年出版新书约1000种,重印书2700余种次,出版物已覆盖人文科学、社会科学、自然科学[1]和工程技术各领域。现有产品中,大中专教材占35%,学术图书占45%,一般图书占20%。在文史哲、法学、经济管理、学术普及、汉语教学等出版领域具有比较明显的优势和特色[2]。
内容简介
本书围绕经典的统计方法与R语言工具,从基本的统计描述分析方法出发,讲解了参数估计与假设检验、线性回归、逻辑回归、降维分析方法,每一章重点介绍一种经典方法或统计模型,对其基本定义、模型形式、统计方法的推导与解读等都给出了细致的讲解。此外,为了将理论与实践紧密结合,本书每一章均提供了不同业务场景下的R语言编程实例,帮助读者练习巩固。本书适合相关学科本科生及研究生,以及对数据分析及建模感兴趣的读者。
作者介绍
朱雪宁,复旦大学大数据学院助理教授。博士毕业于北京大学光华管理学院商务统计系,后于宾州州立大学(Pennsylvania State University)从事博士后研究工作。狗熊会创始团队成员、《R语千寻》专栏负责人;统计之都核心成员、编辑部主编。研究上关注社交网络数据分析、高维数据分析等问题。
目录
OO章 统计分析与R语言
1.1 统计分析简介
1.1.1 了解数据及业务问题
1.1.2 数据清洗与预处理
1.1.3 数据描述及探索性分析
1.1.4 模型构建及解读
1.2 R语言简介
1.2.1 为何要使用R语言
1.2.2 R语言的下载与安装
1.2.3 R语言的使用
1.2.4 工具包
1.3 本章小结
1.4 本章习题
第二章 R语言中的数据管理及预处理
2.1 基本数据类型
2.1.1 数值型
2.1.2 字符型
2.1.3 逻辑型
2.1.4 因子型
2.1.5 时间型
2.2 数据结构
2.2.1 向量
2.2.2 矩阵
2.2.3 数组
2.2.4 数据框
2.2.5 列表
2.3 数据的读入及写出
2.3.1 直接输入数据
2.3.2 从带分隔符的文本文件中导入数据
2.3.3 导入Excel数据
2.3.4 逐行读入数据
2.3.5 数据的写出
2.4 数据集管理及预处理
2.4.1 了解数据概况
2.4.2 变量类型转换
2.4.3 时间型数据的操作
2.4.4 数据集合并
2.4.5 数据缺失、异常
2.5 本章小结
2.6 本章习题
第三章 基本统计分析
3.1 基本描述统计量
3.1.1 频数统计
3.1.2 均值
3.1.3 分位数
3.1.4 方差、标准差
3.1.5 协方差与相关系数
3.1.6 OO值、OO值
3.1.7 峰度和偏度
3.2 汇总分析
3.2.1 交叉列联表
3.2.2 描述统计量的分组统计
3.3 本章小结
3.4 本章习题
第四章 数据描述与可视化
4.1 统计表格
4.1.1 变量说明表
4.1.2 分组统计表
4.2 数据可视化基础
4.2.1 统计图形
4.2.2 柱状图
4.2.3 饼图
4.2.4 直方图
4.2.5 折线图
4.2.6 箱线图
4.2.7 散点图
4.2.8 相关系数图
4.3 数据可视化进阶
4.3.1 ggplot2包
4.3.2 交互可视化
4.4 本章小结
4.5 本章习题
第五章 参数估计与假设检验
5.1 总体、样本和样本量
5.1.1 总体
5.1.2 样本
5.1.3 统计量
5.2 参数估计
5.2.1 矩估计
5.2.2 OO似然估计
5.2.3 区间估计
5.3 假设检验
5.3.1 假设检验的基本步骤
5.3.2 假设检验的p值
5.3.3 假设检验问题的基本类型
5.3.4 正态总体的假设检验
5.4 单因素方差分析
5.4.1 单因素方差分析的基本思路
5.4.2 实例分析
5.5 本章小结
5.6 本章习题
第六章 线性回归
6.1 模型形式
6.2 模型理解
6.2.1 回归系数的理解
6.2.2 定性变量转换及回归系数理解
6.2.3 交互项的解读
6.2.4 σ2的理解
6.3 基本假定
6.4 回归参数的估计
6.4.1 普通OO二乘估计
6.4.2 OO似然估计
6.5 假设检验
6.5.1 回归系数的t检验
6.5.2 回归方程的F检验
6.6 模型评价
6.7 回归诊断
6.7.1 异方差
6.7.2 强影响点
6.7.3 多重共线性
6.7.4 正态性
6.8 变量选择
6.8.1 逐步回归法
6.8.2 信息准则
6.9 模型实现
6.9.1 R语言中的基本函数
6.9.2 实例分析
6.10 小结
6.11 本章习题
第七章 逻辑回归
7.1 模型形式
7.2 模型估计
7.2.1 参数估计
7.3 模型评价
7.3.1 准确率、OO率及召回率
7.3.2 ROC曲线和AUC值
7.4 实例分析
7.5 本章小结
7.6 本章习题
第八章 降维分析
8.1 主成分分析
8.1.1 主成分分析原理
8.1.2 主成分个数选择
8.1.3 样本的主成分及主成分得分
8.1.4 R语言中的主成分分析
8.2 因子分析
8.2.1 正交因子模型
8.2.2 模型估计
8.2.3 因子得分
8.2.4 因子分析和主成分分析的异同
8.2 因子分析
8.2.1 正交因子模型
8.2.2 模型估计
8.3 小结
8.4 本章习题
参考文献
- ↑ 第十讲科学学派_图文,豆丁网,2016-10-18
- ↑ 规模现状,北京大学出版社