Movatterモバイル変換

時間序列

出自維基百科，自由嘅百科全書

喺數學上，時間序列（參見英文：time series）係處理數據嗰陣成日用到嘅概念，指一列若干個數據值，當中每個值都掕住一個數值，表示嗰一件數據值喺時間上係第幾個發生嘅。例如經濟學上分析股價（或者第啲經濟指標），一列數值紀錄咗每日收市嗰陣嘅道指，又或者醫療做分析，一列數據紀錄病人每秒嘅腦電活動。用圖像化嘅方式表達嘅話，時間序列通常會畫成趨勢圖，當中打戙軸係變緊嗰個變數而打橫軸係時間。

時間序列其中一個重要特徵，就係有天然嘅次序，按時間分先後。一般嘅數據，淨係喺某一個時間點量度咗若干位受試者，原則上會假設抽樣過程做到統計獨立，所以啲數據個案與個案之間唔會話有乜嘢「天然嘅次序」；相比之下時間序列本質上就要分次序，而「可以做咩推論」呢點又受制於數據喺時間上嘅先後，譬如依家要做因果關係嘅推論，就冇得話某件數據會引致佢打前嗰啲數據出現變化，因為喺時間上因必定發生喺果之前。

喺統計學上，時間序列可以用好多方法分析，但係由於時間序列有種種獨特性質，好多普通用開嘅分析方法都處理唔嚟，於是統計學界就開發咗一啲特殊方法嚟分析時間序列數據，例如係自迴歸模型呀噉。

基本概論

[編輯]

睇埋：統計獨立、自相關同受試內設計

定義上，一條長度為 m 嘅時間序列，係一個有次序嘅實數數據列：

T=(t_{1},t_{2},\dots ,t_{m})

當中 t₁ 係第一個時間點，t₂ 係第二個時間點... 等等^[1]。而一條長度為 n 嘅子序列^[2]就係指由序列 T 當中抽出連續 $n {\displaystyle n}$ 咁個元素而成嘅，即係：

T_{i,n}=(t_{i},t_{i+1},\dots ,t_{i+n-1})

，其中

1\leq i\leq m-n+1

換句話說，子序列係一啲根據原有次序排列，中間可能略去咗部分元素嘅數據序列^[3]。統計學有好多技術可以用嚟分析數據，由數據當中搵出規律同埋變數之間嘅關係。

要分析時間序列，統計師要面對一條基本嘅難題：時間序列本質上就唔係彼此獨立嘅；如果話兩個個案（或者數據點）彼此獨立，即係話其中一個個案出咩數值，唔會影響另外嗰個出咩數值，例如由全世界嘅人當中隨機抽兩個人出嚟再度佢哋身高，抽第一個人得出咩數值，唔會影響抽第二個人得出咩數值；但係本質上，時間序列就係睇緊某個個案喺指定時間之中嘅變化（例如睇住同一個人嘅身高變化）而個個案喺某個時點嘅數值，原則上實會同佢之前或者之後嘅數值有相關；同時好多傳統嘅統計學方法，譬如係線性迴歸噉，本身就假設數據點之間係互相獨立嘅。如果直接用呢啲方法分析時間序列，就好有可能會得出唔可靠嘅推論。因此，時間序列分析需要有一套獨特嘅理論同技術，專門處理數據點之間存在自相關嘅情況^[4]。

分析方法

[編輯]

時間序列數據可以用好多唔同類嘅統計模型嚟分析。

自迴歸

[編輯]

内文：自迴歸模型

自迴歸模型可以用嚟分析時間序列數據。假想有個自迴歸模型，序迾^[5]係p 咁多，定義上呢個模型可以以下嘅式描述：

X_{t}=\sum _{i=1}^{p}\varphi _{i}X_{t-i}+\varepsilon _{t}

當中 $\varphi _{1},\ldots ,\varphi _{p}$ 係模型嘅參數，而 $\varepsilon _{t}$ 係白雜訊^[6]^[7]。用日常用語講，條式以 $X_{t}$ 做應變數，而預測佢嘅變數就係 $X_{t-1}$ （前一個時間點嘅 $X {\displaystyle X}$ ）、 $X_{t-2}$ （再前一個時間點嘅 $X {\displaystyle X}$ ）... 一路至 $X_{t-p}$ －用個變數喺之前嘅時間點嘅值，預測佢依家嗰刻嘅值。條式又可以用褪後操作符B 寫做

X_{t}=\sum _{i=1}^{p}\varphi _{i}B^{i}X_{t}+\varepsilon _{t}

要行噉嘅自迴歸模型，數據集就要整到每行橫行表示某個時間點嘅值，並且有p 咁多條直行，表示嗰一個值之前嗰p 個時間點量度到嘅值。好似噉嘅自迴歸模型，只可以分析一個變數點樣隨時間變化，而更進階嘅變體仲有得模擬多個變數點樣互相影響或者預測對方嘅變化，例如向量自迴歸（VAR）就將自迴歸模型嘅概念廣義化，同時考慮多個唔同變數嘅變化^[8]^[9]，當中有兩個變數，序迾 = 1 嘅 VAR 模型就可以用矩陣寫成：

{\begin{bmatrix}y_{1,t}\\y_{2,t}\end{bmatrix}}={\begin{bmatrix}c_{1}\\c_{2}\end{bmatrix}}+{\begin{bmatrix}a_{1,1}&a_{1,2}\\a_{2,1}&a_{2,2}\end{bmatrix}}{\begin{bmatrix}y_{1,t-1}\\y_{2,t-1}\end{bmatrix}}+{\begin{bmatrix}e_{1,t}\\e_{2,t}\end{bmatrix}}

矩陣呢個概念可以用嚟表示線性映射^{[註 1]}。喺上便條式當中，

{\begin{bmatrix}a_{1,1}&a_{1,2}\\a_{2,1}&a_{2,2}\end{bmatrix}}{\begin{bmatrix}y_{1,t-1}\\y_{2,t-1}\end{bmatrix}}

乘出嚟會係：

y_{1,t}=c_{1}+a_{1,1}y_{1,t-1}+a_{1,2}y_{2,t-1}+e_{1,t}\,

y_{2,t}=c_{2}+a_{2,1}y_{1,t-1}+a_{2,2}y_{2,t-1}+e_{2,t}.\,

由手上數據嗰度估計 $a_{1,1}$ 等參數嘅值，就可以得知啲變數之間有咩關係，以及有幾強嘅關係。

增長曲線

[編輯]

内文：增長曲線

增長曲線係一種圖像表示方法，描述某個變數（例如健康狀況、行為表現等）點樣隨時間變化。以學生嘅閱讀能力為例，如果每年測一次分數，就可以畫出一條曲線反映佢哋嘅成績點樣一年一年噉變化。唔同人可能會有唔同形狀嘅曲線，有啲一路升、有啲升完又跌、有啲基本不變。

增長曲線噉嘅思考，可以用（例如）潛在增長模型（LGM）嚟分析，潛在增長模型呢種統計模型可以用數學式簡單寫成：

y_{it}=\alpha _{i}+\beta _{i}\cdot t+\epsilon _{it}

呢條式表示第i 個人喺第t 個時間點嘅觀察值 $y_{it}$ 等於：

佢自己嘅起始水平 $\alpha _{i}$ （即係intercept），
加上斜率 $\beta _{i}$ 乘以時間（反映增長速率），
再加上誤差 $\epsilon _{it}$ 。

呢種模型常見於教育學同心理學：例如研究學生喺若干年內嘅閱讀能力（或者其他能力）嘅發展呀噉。

技術化啲講，呢種模型可以用結構方程式模型（SEM）噉嘅形式嚟諗。譬如設定兩個潛在變數代表 $\alpha$ 同 $\beta$ ，然後將每一個可觀察變數（包括第一、二、三個時間點... 等量度到嗰個變數值）對應落去，每一個可觀察變數對 $\alpha$ 嘅負荷量固定為 1 咁多，同時每個可觀察變數對 $\beta$ 嘅負荷量就隨時間改變，例如 0 1 2... 等，當中第 n 個時間點嘅可觀察變數數值嘅負荷量設定為 (n-1) 咁多。呢類模型喺教育學、心理學、公共衞生等嘅社科中零舍常見，因為呢啲領域好多時只係收集到幾個時間點嘅重複量度^[10]。

畫做圖像

[編輯]

睇埋：趨勢圖

統計師同相關嘅人員想將時間序列用視覺化噉表達出嚟，通常都會用到趨勢圖，趨勢圖嘅做法係打橫軸設做時間點，將每個觀察點嘅數值按時間順序排好，打戙軸就代表研究緊嗰個變數，將每個點用線連起嚟，展示變數隨住時間過去而變化嘅情況。透過趨勢圖，研究者可以直觀噉睇整體走勢，例如睇吓變化趨勢係上升定下跌、有冇出現明顯嘅轉折點、數據有冇季節性嘅規律或者不規則波動^[11]。

好似下圖噉（想像研究緊嘅係道指每日收市嗰時嘅數值）：

領域應用

[編輯]

時間序列分析喺唔少領域上都會用到。

睇埋

[編輯]

文獻

[編輯]

歐美文獻：

（英文） Li, Y., Williams, L., Muth, C., Heshmati, S., Chow, S. M., & Oravecz, Z. (2025).A growth of hierarchical autoregression model for capturing individual differences in changes of dynamic characteristics of psychological processes (PDF).Structural Equation Modeling: A Multidisciplinary Journal, 32(2), 237-250.
（英文） Zolhavarieh, Seyedjamal; Aghabozorgi, Saeed; Teh, Ying Wah (2014). "A Review of Subsequence Time Series Clustering".The Scientific World Journal. 2014: 312521，講到攞時間序列數據嚟做聚類分析。

參考

[編輯]

註釋：

↑不過，唔同領域對矩陣嘅用法都有啲唔同。

引用咗嘅來源：

↑Rodpongpun S, Niennattrakul V, Ratanamahatana CA. Selective subsequence time series clustering.Knowledge-Based Systems. 2012;35:361-368.
↑英文：subsequence
↑Gorbenko A, Popov V. On the longest common subsequence problem.Applied Mathematical Sciences. 2012;6(113–116):5781-5787.
↑Time series methods, APES，佢哋噉講："Time-series analysis is more tricky than one would assume at first glance. The reason is that often time series are analysed wrongly and people got used to that. In a time series, consecutive data points are typically not independent."
↑英文：order
↑Box, George E. P. (1994).Time series analysis : forecasting and control (英文). Gwilym M. Jenkins, Gregory C. Reinsel (第3版). Englewood Cliffs, N.J.: Prentice Hall. p. 54.ISBN 0-13-060774-6.OCLC 28888762.
↑Shumway, Robert H. (2000).Time series analysis and its applications (英文). David S. Stoffer. New York: Springer. pp. 90–91.ISBN 0-387-98950-1.OCLC 42392178. 原先內容歸檔喺2023-04-16. 喺2022-09-03搵到.
↑Katris, C. (2021). Unemployment and Covid-19 impact in Greece: A vector autoregression (VAR) data analysis.Engineering Proceedings, 5(1), 41，呢篇文用向量自迴歸模型（擴充版嘅自迴歸模型）分析希臘嘅失業率喺新冠疫情影響下嘅變化。
↑Hatemi-J, A. (2004). "Multivariate tests for autocorrelation in the stable and unstable VAR models".Economic Modelling. 21 (4): 661-683.
↑Burt, K. B., & Obradović, J. (2013). The construct of psychophysiological reactivity: Statistical and psychometric issues.Developmental Review, 33(1), 29-57.
↑Chambers, John; William Cleveland; Beat Kleiner; Paul Tukey (1983).Graphical Methods for Data Analysis. Duxbury.

外拎

[編輯]

維基同享有多媒體嘅嘢：
時間序列

（英文）乜嘢係自迴歸模型？，IBM SPSS，講解點樣用自迴歸模型分析時間序列數據。

統計學

收集數據（數據集）

抽樣

量度

操作化同層次連續同離散變數（離散化）、分類變數共同方法變異（哈曼測試）時間同空間解像度靈敏度同特異度時間序列名次天花板同地板效應次數數據刪失
信度效度	評分者間同評分者內信度重測試信度內部一致度卡隆巴系數建構效度效標效度分歧效度內容效度聚合效度表面效度

實驗

第啲方法

描述統計學

連續數據

集中趨勢	平均 Mean（算術 ·幾何 ·調和） Median Mode
離散程度	方差同標準差全距百分位數（四分位距）變異系數離散指數協方差矩陣
分佈形狀	動差（偏度 ·峰度）標準誤差中央極限定理

相關概念

總體統計量獨立同分佈實證分佈函數重抽樣（自助抽樣法）損失函數效率統計距離特徵值同特徵向量頑健統計再現
概率分佈	離散定連續對稱概率質量函數同概率密度函數累計函數常態分佈（鐘形線）頻率分佈抽樣分佈（順序統計量 ·充分統計量）聯合分佈
學派詮釋	頻率學派推論貝葉斯推論貝葉斯統計（先驗 ·後驗）

假說檢定

估計理論

平均比較

學生 t 測試（獨立樣本 ·配對樣本） Z 測試 F 測試統計自由度多重比較問題（邦佛朗尼校正）等分散性同異分散性
ANOVA	單因子雙因子重複量數多變量協方差分析

統計模型

控制、中介、調節、混淆同壓制變數參數單變量同多變量分析模型標明同選擇多組分析約束可解釋變異敏感度分析插值同外推混合物可詮釋度
適合度	適合度指標卡方檢定赤池資訊量準則貝葉斯資訊量準則 RMSEA SRMR CFI

迴歸分析同相關技術

基礎	殘差同誤差固定效應、隨機效應同混合模型多重迴歸模型（多重共線性）普通最小二乘法殘差平方和均方誤差標準誤差決定系數線性迴歸（簡單線性）
進階模型	非線性迴歸分析 Sigmoid 函數邏輯迴歸一般線性模型泊淞迴歸分析自迴歸模型逐步迴歸多變量適應性迴歸模型
相關技術	生還分析（函數 ·失效率 ·K-M 估計量 ·Log-rank 測試同比例危機）結構方程同通徑分析（量度同結構模型 ·修改指數 ·量度不變特性 ·交叉滯後）等級線性模型

第啲常用嘅分析技術

因素分析	可觀察變數同潛在變數（心理建構）潛在變數模型降維因素結構因素負荷量探索型同確定型主成份分析卡隆巴系數張量分解結構方程式模型
時間序列	平穩過程馬可夫鏈時域（自相關 ·交叉相關）頻域（傅利葉分析）格蘭傑因果關係
拉雜技術	探索分析高氏 kappa 獨立成份分析聚類分析統計分類線性判別分析點過程（點場）麥倫瑪測試非參數統計學（MWU 測試）事後分析元分析

應用（誤用）

自然科學	統計力學生物統計學（生物資訊科學 ·臨床試驗 ·傳染病學）
社會科學	社會統計學（精算學 ·經濟測量學 ·人口統計學 ·心理測量學）地圖學市場調查語言學
工程科技	工程統計學（可靠度工程）機械學習統計分類偏好學習擬亂數產生異常檢測推薦系統自然語言處理數據探勘

數學主題
統計學類

睇傾改複雜系統
顧名思義係指複雜嘅系統，變化難以預測
重要概念	複雜同簡單組合爆發創發同自我組織動態系統適應系統可進化整體主義同還原論自然形態規律
重要例子	生命同生物細胞神經細胞同系統－包括腦（尤其係人腦）種群生態系統（關鍵物種）自然氣候組織社會經濟體（金融市場 ·國際經濟）城市現代基礎建設進階電腦軟件地球星系宇宙
非線系統	微分方程（常同偏）時間序列混沌理論（臨界過渡 ·吸引子）分岔理論
網絡理論	網絡科學中心度網絡規律細世界網絡神經網絡、社會網絡同電腦網絡
集體行為	社會動力學超生物大群行為集體智能集體行動集體意識羊群心理同步集體意會
系統理論	Feedback 自指頑健同容錯可擴縮度體内平衡自生系統同自我複製多穩態系統動力學模控學
運算相關	運算複雜度電腦模擬（個體為本模型）機械學習（人工神經網絡）進化運算（遺傳演算法）最佳化（全局最佳化 ·粒子群最佳化 ·蟻群最佳化演算法）格仔自動機（生命棋）
相關領域	系統科學資訊理論運算理論博弈論地球科學（地形學）生物學（系統生物學 ·進化發育生物學）進化博弈論社會科學（理性選擇理論）工程學控制理論人工智能進化機械人學人工生命
拉雜相關奧坎剃刀、調節效應同不充分決定論 ·碎形 ·隨機 ·熵 ·耗散系統 ·滲流 ·有限理性 ·窮舉搜尋 ·生成藝術

由「https://zh-yue.wikipedia.org/w/index.php?title=時間序列&oldid=2319738」收

屬於1類：

數據

屬於2隱類：

[8]ページ先頭