6,509
次編輯
變更
時間序列
,無編輯摘要
[[File:時間序列.gif | thumb | 300px | 時間序列 <br> [https://www.itread01.com/content/1545002647.html 原圖鏈接] ]]
'''時間序列'''(英語:time series)是一組按照時間發生先後順序進行排列的數據點序列。
*通常一組時間序列的時間間隔為一恆定值(如1秒,5分鐘,12小時,7天,1年),因此時間序列可以作為離散時間數據進行分析處理。
*時間序列廣泛應用於數理統計、信號處理、模式識別、計量經濟學、數學金融、 [[ 天氣預報 ]] 、 [[ 地震預測 ]] 、腦電圖、控制工程、航空學、通信工程以及絕大多數涉及到時間數據測量的應用科學與工程學。
*時間數列是指將某一現象所發生的數量變化,依時間的先後順序排列,以揭示隨著時間的推移,這一現象的發展規律,從而用以預測現象發展的方向及其數量。
===時間序列的組成因素與作用===
*時間序列能夠構成,是因為現象的發展變化是多種因素影響的綜合結果,由於各種因素的作用方向和影響程度不同,使具體的時間序列呈現出不同的變動形態。
*時間序列分析的任務就是要正確地確定時間序列的性質,對影響時間序列的各種因素加以分解和測定,以便對未來的狀況作出判斷和預測。這些因素按照性質可以劃分為:長期趨勢、季節變動、循環變動和不規則變動。<ref name="每日頭條">{{cite web |url=https://kknews.cc/education/39zyp2o.html | title= 每天一點統計學——時間序列分析概論 | language=zh | date=2017-03-22 | publisher=每日頭條 | author=數據分析和挖掘 | accessdate=2020-09-24}}</ref>
===時間序列資料的特性===
*對於時序資料的特點的分析,會從資料的寫入、查詢和儲存這三個維度來闡述,通過對其特點的分析,來推演對時序資料庫的基本要求。
*資料寫入的特點:
**寫入平穩、持續、高併發高吞吐:時序資料的寫入是比較平穩的,這點與應用資料不同,應用資料通常與應用的訪問量成正比,而應用的訪問量通常存在波峰波谷。
**寫多讀少:時序資料上95%-99%的操作都是寫操作,是典型的寫多讀少的資料。
**實時寫入最近生成的資料,無更新:時序資料的寫入是實時的,且每次寫入都是最近生成的資料,這與其資料生成的特點相關,因為其資料生成是隨著時間推進的,而新生成的資料會實時的進行寫入。
**資料寫入無更新,在時間這個維度上,隨著時間的推進,每次資料都是新資料,不會存在舊資料的更新,不過不排除人為的對資料做訂正。
*資料查詢和分析的特點:
**按時間範圍讀取:通常來說,你不會去關心某個特定點的資料,而是一段時間的資料。所以時序資料的讀取,基本都是按時間範圍的讀取。
**最近的資料被讀取的概率高:最近的資料越有可能被讀取,以監控資料為例,你通常只會關心最近幾個小時或最近幾天的監控資料,而極少關心一個月或一年前的資料。
**多精度查詢:按資料點的不同密集度來區分不同的精度,例如若相鄰資料點的間隔週期是10秒,則該時序資料的精度就是10秒,若相鄰資料點的時間間隔週期是30秒,則該時序資料的精度就是30秒。時間間隔越短,精度越高。
**精度越高的資料,能夠還原的歷史狀態更細緻更準確,但其儲存的資料點會越多。
**多維分析:時序資料產生自不同的個體,這些個體擁有不同的屬性,可能是同一維度的,也可能是不同維度的。
*資料儲存的特點
**資料量大:拿監控資料來舉例,如果我們採集的監控資料的時間間隔是1s,那一個監控項每天會產生86400個數據點,若有10000個監控項,則一天就會產生864000000個數據點。在物聯網場景下,這個數字會更大。整個資料的[[規模]],是TB甚至是PB級的。
**冷熱分明:時序資料有非常典型的冷熱特徵,越是歷史的資料,被查詢和分析的概率越低。
**具有時效性:時序資料具有時效性,資料通常會有一個儲存週期,超過這個儲存週期的資料可以認為是失效的,可以被回收。<ref name="ITREAD01.COM">{{cite web |url=https://www.itread01.com/content/1545002647.html | title= 每天一點統計學——時間序列分析概論 | language=zh | date=2018-12-17 | publisher=ITREAD01.COM | author= | accessdate=2020-09-24}}</ref>
==参考來源==
{{Reflist}}
[[Category:500 社會科學總論]]