統計圖形檢視原始碼討論檢視歷史
統計圖形,又稱為統計圖、統計學圖形、圖解方法、圖解技術、圖解分析方法或圖解分析技術,是指統計學領域當中用於可視化定量數據的信息圖形。有時,人們也把統計圖形與各種統計學表格統稱為統計圖表或統計學圖表。
概述
統計學與數據分析過程可大致分為兩個組成部分:定量分析方法(Quantitative techniques)和圖解分析方法(graphical techniques)。定量分析方法是指那套產生數值型或表格型輸出的統計學操作程序;比如,包括假設檢驗、方差分析、點估計、可信區間以及最小二乘法[1]回歸分析。這些手段以及與此類似的其他技術方法全都頗具價值,屬於是經典分析方面的主流。
另一方面,還有一大套我們一般稱之為圖解分析方法的統計學工具。這些工具包括散點圖、直方圖、概率圖、殘差圖(residual plot)、箱形圖、塊圖以及雙標圖。探索性數據分析(Exploratory data analysis,EDA)就密切地依賴於這些手段以及與此類似的其他技術方法。圖解分析操作程序不僅僅是在EDA背景下才使用的工具;在檢驗假設、模型選擇、統計模型驗證、估計量(estimator)選擇、關係確定、因素效應判定以及離群值檢出方面,此類圖解分析工具還可以作為最佳捷徑,用來深入認識數據集。此外,優質的統計圖形還可以作為一種令人信服的溝通手段,用來向他人傳達存在於數據之中的基本訊息 。
圖解式統計學方法具有四個方面的目標:⑴ 探究數據集的內容;⑵ 用於發現數據之中的結構;⑶ 檢查統計學模型之中的假設;⑷ 溝通傳達分析結果。
如果不採用統計圖形,也就會喪失深入認識數據基礎結構之一個或多個方面的機會。
歷史
三維餅圖示例:歐盟各國擁有歐盟農田的百分比[2]。
統計圖形的起源可以追溯到人們最早試圖分析數據的活動,而如今這種技術方法已經成為科學發展的關鍵手段之一。早在十八世紀,人們就採用了許多為我們當前所熟悉的統計製圖手段和形式,如二維地圖、示意地圖、條圖以及坐標紙。人們對於下列四個問題的關注推動了統計圖形技術方法的發展:
- 十七世紀和十八世紀期間的空間組織問題。
- 十八世紀期間和十九世紀早期的離散比較問題。
- 十九世紀期間的連續分布問題。
- 十九世紀和二十世紀期間的多變量分布與相關問題。
自1970年代以來,隨着計算機圖形學及其相關技術方法的復興,統計圖形目前已經東山再起,再度成為一種重要的分析工具。
視頻
統計圖形 相關視頻
參考文獻
- ↑ 什麼是最小二乘法? ,搜狐,2019-05-30
- ↑ PPT圖表美化教程八:三維餅圖的設計和優化,搜狐,2020-06-19