統計分析檢視原始碼討論檢視歷史
《統計分析》,副標題:以R語言為工具,出版社: 北京大學出版社,ISBN:9787301323427。
北京大學出版社年出版新書約1000種,重印書2700餘種次,出版物已覆蓋人文科學、社會科學、自然科學[1]和工程技術各領域。現有產品中,大中專教材占35%,學術圖書占45%,一般圖書占20%。在文史哲、法學、經濟管理、學術普及、漢語教學等出版領域具有比較明顯的優勢和特色[2]。
內容簡介
本書圍繞經典的統計方法與R語言工具,從基本的統計描述分析方法出發,講解了參數估計與假設檢驗、線性回歸、邏輯回歸、降維分析方法,每一章重點介紹一種經典方法或統計模型,對其基本定義、模型形式、統計方法的推導與解讀等都給出了細緻的講解。此外,為了將理論與實踐緊密結合,本書每一章均提供了不同業務場景下的R語言編程實例,幫助讀者練習鞏固。本書適合相關學科本科生及研究生,以及對數據分析及建模感興趣的讀者。
作者介紹
朱雪寧,復旦大學大數據學院助理教授。博士畢業於北京大學光華管理學院商務統計系,後於賓州州立大學(Pennsylvania State University)從事博士後研究工作。狗熊會創始團隊成員、《R語千尋》專欄負責人;統計之都核心成員、編輯部主編。研究上關注社交網絡數據分析、高維數據分析等問題。
目錄
OO章 統計分析與R語言
1.1 統計分析簡介
1.1.1 了解數據及業務問題
1.1.2 數據清洗與預處理
1.1.3 數據描述及探索性分析
1.1.4 模型構建及解讀
1.2 R語言簡介
1.2.1 為何要使用R語言
1.2.2 R語言的下載與安裝
1.2.3 R語言的使用
1.2.4 工具包
1.3 本章小結
1.4 本章習題
第二章 R語言中的數據管理及預處理
2.1 基本數據類型
2.1.1 數值型
2.1.2 字符型
2.1.3 邏輯型
2.1.4 因子型
2.1.5 時間型
2.2 數據結構
2.2.1 向量
2.2.2 矩陣
2.2.3 數組
2.2.4 數據框
2.2.5 列表
2.3 數據的讀入及寫出
2.3.1 直接輸入數據
2.3.2 從帶分隔符的文本文件中導入數據
2.3.3 導入Excel數據
2.3.4 逐行讀入數據
2.3.5 數據的寫出
2.4 數據集管理及預處理
2.4.1 了解數據概況
2.4.2 變量類型轉換
2.4.3 時間型數據的操作
2.4.4 數據集合併
2.4.5 數據缺失、異常
2.5 本章小結
2.6 本章習題
第三章 基本統計分析
3.1 基本描述統計量
3.1.1 頻數統計
3.1.2 均值
3.1.3 分位數
3.1.4 方差、標準差
3.1.5 協方差與相關係數
3.1.6 OO值、OO值
3.1.7 峰度和偏度
3.2 匯總分析
3.2.1 交叉列聯表
3.2.2 描述統計量的分組統計
3.3 本章小結
3.4 本章習題
第四章 數據描述與可視化
4.1 統計表格
4.1.1 變量說明表
4.1.2 分組統計表
4.2 數據可視化基礎
4.2.1 統計圖形
4.2.2 柱狀圖
4.2.3 餅圖
4.2.4 直方圖
4.2.5 折線圖
4.2.6 箱線圖
4.2.7 散點圖
4.2.8 相關係數圖
4.3 數據可視化進階
4.3.1 ggplot2包
4.3.2 交互可視化
4.4 本章小結
4.5 本章習題
第五章 參數估計與假設檢驗
5.1 總體、樣本和樣本量
5.1.1 總體
5.1.2 樣本
5.1.3 統計量
5.2 參數估計
5.2.1 矩估計
5.2.2 OO似然估計
5.2.3 區間估計
5.3 假設檢驗
5.3.1 假設檢驗的基本步驟
5.3.2 假設檢驗的p值
5.3.3 假設檢驗問題的基本類型
5.3.4 正態總體的假設檢驗
5.4 單因素方差分析
5.4.1 單因素方差分析的基本思路
5.4.2 實例分析
5.5 本章小結
5.6 本章習題
第六章 線性回歸
6.1 模型形式
6.2 模型理解
6.2.1 回歸係數的理解
6.2.2 定性變量轉換及回歸係數理解
6.2.3 交互項的解讀
6.2.4 σ2的理解
6.3 基本假定
6.4 回歸參數的估計
6.4.1 普通OO二乘估計
6.4.2 OO似然估計
6.5 假設檢驗
6.5.1 回歸係數的t檢驗
6.5.2 回歸方程的F檢驗
6.6 模型評價
6.7 回歸診斷
6.7.1 異方差
6.7.2 強影響點
6.7.3 多重共線性
6.7.4 正態性
6.8 變量選擇
6.8.1 逐步回歸法
6.8.2 信息準則
6.9 模型實現
6.9.1 R語言中的基本函數
6.9.2 實例分析
6.10 小結
6.11 本章習題
第七章 邏輯回歸
7.1 模型形式
7.2 模型估計
7.2.1 參數估計
7.3 模型評價
7.3.1 準確率、OO率及召回率
7.3.2 ROC曲線和AUC值
7.4 實例分析
7.5 本章小結
7.6 本章習題
第八章 降維分析
8.1 主成分分析
8.1.1 主成分分析原理
8.1.2 主成分個數選擇
8.1.3 樣本的主成分及主成分得分
8.1.4 R語言中的主成分分析
8.2 因子分析
8.2.1 正交因子模型
8.2.2 模型估計
8.2.3 因子得分
8.2.4 因子分析和主成分分析的異同
8.2 因子分析
8.2.1 正交因子模型
8.2.2 模型估計
8.3 小結
8.4 本章習題
參考文獻
- ↑ 第十講科學學派_圖文,豆丁網,2016-10-18
- ↑ 規模現狀,北京大學出版社