頻率分布是示出數(shù)據(jù)集中的數(shù)據(jù)點(diǎn)的頻率的表。 表中的每個(gè)條目包含特定組或間隔內(nèi)的值的出現(xiàn)頻率或計(jì)數(shù),并且以這種方式,表概括了樣本中的值的分布。
SAS提供了一個(gè)稱為PROC FREQ的過程來計(jì)算數(shù)據(jù)集中數(shù)據(jù)點(diǎn)的頻率分布。
SAS中計(jì)算頻率分布的基本語法是:
PROC FREQ DATA = Dataset ; TABLES Variable_1 ; BY Variable_2 ;
以下是使用的參數(shù)的描述:
我們可以使用PROC FREQ確定單個(gè)變量的頻率分布。 在這種情況下,結(jié)果將顯示變量的每個(gè)值的頻率。 結(jié)果還顯示百分比分布,累積頻率和累積百分比。
在下面的例子中,我們找到名為CARS1的數(shù)據(jù)集的變量馬力的頻率分布,該數(shù)據(jù)集是從庫SASHELP.CARS創(chuàng)建的。 我們可以看到結(jié)果分為兩類結(jié)果。 一個(gè)為汽車的每一個(gè)。
PROC SQL; create table CARS1 as SELECT make,model,type,invoice,horsepower,length,weight FROM SASHELP.CARS WHERE make in ('Audi','BMW') ; RUN; proc FREQ data=CARS1 ; tables horsepower; by make; run;
當(dāng)執(zhí)行上面的代碼中,我們得到以下結(jié)果:
我們可以找到多個(gè)變量的頻率分布,將它們分組成所有可能的組合。
在下面的例子中,我們計(jì)算按汽車類型分組的汽車制造的頻率分布,以及按每種制造分組的每種類型汽車的頻率分布。
proc FREQ data=CARS1 ; tables make type; run;
當(dāng)執(zhí)行上面的代碼中,我們得到以下結(jié)果:
使用權(quán)重選項(xiàng),我們可以計(jì)算用變量的權(quán)重偏置的頻率分布。 這里,變量的值被取為觀察值的數(shù)量,而不是值的計(jì)數(shù)。
在下面的例子中,我們計(jì)算變量make和type的頻率分布,分配給馬力的權(quán)重。
proc FREQ data=CARS1 ; tables make type; weight horsepower; run;
當(dāng)執(zhí)行上面的代碼中,我們得到以下結(jié)果:
更多建議: