時(shí)間序列是將統(tǒng)一統(tǒng)計(jì)值按照時(shí)間發(fā)生的先后順序來(lái)進(jìn)行排列,時(shí)間序列分析的主要目的是根據(jù)已有數(shù)據(jù)對(duì)未來(lái)進(jìn)行預(yù)測(cè)。
一個(gè)穩(wěn)定的時(shí)間序列中常常包含兩個(gè)部分,那么就是:有規(guī)律的時(shí)間序列+噪聲。所以,在以下的方法中,主要的目的就是去過(guò)濾噪聲值,讓我們的時(shí)間序列更加的有分析意義。
時(shí)間序列分析中ts()函數(shù)的基本語(yǔ)法是 -
timeseries.object.name <- ts(data, start, end, frequency)
以下是所使用的參數(shù)的描述 -
data是包含在時(shí)間序列中使用的值的向量或矩陣。
start以時(shí)間序列指定第一次觀察的開(kāi)始時(shí)間。
end指定時(shí)間序列中最后一次觀測(cè)的結(jié)束時(shí)間。
frequency指定每單位時(shí)間的觀測(cè)數(shù)。
除了參數(shù)“data”,所有其他參數(shù)是可選的。
拿到一個(gè)時(shí)間序列之后,我們首先要對(duì)其穩(wěn)定性進(jìn)行判斷,只有非白噪聲的穩(wěn)定性時(shí)間序列才有分析的意義以及預(yù)測(cè)未來(lái)數(shù)據(jù)的價(jià)值。
所謂平穩(wěn),是指統(tǒng)計(jì)值在一個(gè)常數(shù)上下波動(dòng)并且波動(dòng)范圍是有界限的。如果有明顯的趨勢(shì)或者周期性,那么就是不穩(wěn)定的。一般判斷有三種方法:
在R語(yǔ)言中,DF檢測(cè)是一種檢測(cè)穩(wěn)定性的方法,如果得出的P值小于臨界值,則認(rèn)為是序列是穩(wěn)定的。
白噪聲序列,又稱為純隨機(jī)性序列,序列的各個(gè)值之間沒(méi)有任何的相關(guān)關(guān)系,序列在進(jìn)行無(wú)序的隨機(jī)波動(dòng),可以終止對(duì)該序列的分析,因?yàn)閺陌自肼曅蛄兄惺翘崛〔坏饺魏斡袃r(jià)值的信息的。
均值和方差為常數(shù),并且具有與時(shí)間無(wú)關(guān)的自協(xié)方差。
考慮從2012年1月開(kāi)始的一個(gè)地方的年降雨量細(xì)節(jié)。我們創(chuàng)建一個(gè)R時(shí)間序列對(duì)象為期12個(gè)月并繪制它。
# Get the data points in form of a R vector. rainfall <- c(799,1174.8,865.1,1334.6,635.4,918.5,685.5,998.6,784.2,985,882.8,1071) # Convert it to a time series object. rainfall.timeseries <- ts(rainfall,start = c(2012,1),frequency = 12) # Print the timeseries data. print(rainfall.timeseries) # Give the chart file a name. png(file = "rainfall.png") # Plot a graph of the time series. plot(rainfall.timeseries) # Save the file. dev.off()
當(dāng)我們執(zhí)行上面的代碼,它產(chǎn)生以下結(jié)果及圖表 -
Jan Feb Mar Apr May Jun Jul Aug Sep 2012 799.0 1174.8 865.1 1334.6 635.4 918.5 685.5 998.6 784.2 Oct Nov Dec 2012 985.0 882.8 1071.0
時(shí)間序列圖 -
ts()函數(shù)中的頻率參數(shù)值決定了測(cè)量數(shù)據(jù)點(diǎn)的時(shí)間間隔。 值為12表示時(shí)間序列為12個(gè)月。 其他值及其含義如下 -
頻率= 12指定一年中每個(gè)月的數(shù)據(jù)點(diǎn)。
頻率= 4每年的每個(gè)季度的數(shù)據(jù)點(diǎn)。
頻率= 6每小時(shí)的10分鐘的數(shù)據(jù)點(diǎn)。
頻率= 24 * 6將一天的每10分鐘的數(shù)據(jù)點(diǎn)固定。
我們可以通過(guò)將兩個(gè)系列組合成一個(gè)矩陣,在一個(gè)圖表中繪制多個(gè)時(shí)間序列。
# Get the data points in form of a R vector. rainfall1 <- c(799,1174.8,865.1,1334.6,635.4,918.5,685.5,998.6,784.2,985,882.8,1071) rainfall2 <- c(655,1306.9,1323.4,1172.2,562.2,824,822.4,1265.5,799.6,1105.6,1106.7,1337.8) # Convert them to a matrix. combined.rainfall <- matrix(c(rainfall1,rainfall2),nrow = 12) # Convert it to a time series object. rainfall.timeseries <- ts(combined.rainfall,start = c(2012,1),frequency = 12) # Print the timeseries data. print(rainfall.timeseries) # Give the chart file a name. png(file = "rainfall_combined.png") # Plot a graph of the time series. plot(rainfall.timeseries, main = "Multiple Time Series") # Save the file. dev.off()
當(dāng)我們執(zhí)行上面的代碼,它產(chǎn)生以下結(jié)果及圖表 -
Series 1 Series 2 Jan 2012 799.0 655.0 Feb 2012 1174.8 1306.9 Mar 2012 865.1 1323.4 Apr 2012 1334.6 1172.2 May 2012 635.4 562.2 Jun 2012 918.5 824.0 Jul 2012 685.5 822.4 Aug 2012 998.6 1265.5 Sep 2012 784.2 799.6 Oct 2012 985.0 1105.6 Nov 2012 882.8 1106.7 Dec 2012 1071.0 1337.8
多時(shí)間序列圖 -
更多建議: