W3Cschool
恭喜您成為首批注冊用戶
獲得88經驗值獎勵
概率分布函數中的異常值是大于遠離下四分位數或上四分位數的數據的長度的1.5倍的數。 具體來說,如果數字小于$ {Q_1 - 1.5 \\ times IQR} $或大于$ {Q_3 + 1.5 \\ times IQR} $,那么它是一個異常值。
異常值由以下概率函數定義和給出:
$ {Outlier \\ datas \\ are \\,\\ lt Q_1 - 1.5 \\ times IQR \\(or)\\ \\ gt Q_3 + 1.5 \\ times IQR} $
其中 -
$ {Q_1} $ =第一個四分位數
$ {Q_2} $ =第三個四分位數
$ {IQR} $ =四分位數范圍
問題陳述:
考慮一個表示8個不同學生周期性任務計數的數據集。 任務計數信息集為11,13,15,3,16,25,12和14.從學生周期性任務計數中發(fā)現異常值數據。
解決方案:
給定數據集為:
11 | 13 | 15 | 3 | 16 | 25 | 12 | 14 |
按升序排列:
3 | 11 | 12 | 13 | 14 | 15 | 16 | 25 |
第一四分位數值()$ {Q_1} $
$ {Q_1 = \\ frac {(11 + 12)} {2} \\\\ [7pt]
\\ = 11.5} $
第三四分位值()$ {Q_3} $
$ {Q_3 = \\ frac {(15 + 16)} {2} \\\\ [7pt]
\\ = 15.5} $
低離群值范圍(L)
$ {Q_1 - 1.5 \\ times IQR \\\\ [7pt]
\\ = 11.5 - (1.5 \\ times 4)\\\\ [7pt]
\\ = 11.5 - 6 \\\\ [7pt]
\\ = 5.5} $
上方異常值范圍(L)
$ {Q_3 + 1.5 \\ times IQR \\\\ [7pt]
\\ = 15.5 +(1.5 \\ times 4)\\\\ [7pt]
\\ = 15.5 + 6 \\\\ [7pt]
\\ = 21.5} $
在給定信息中,5.5和21.5比給定數據集中的其他值更大,即除了3和25以外,因為3大于5.5,25小于21.5。
這樣,我們使用3和25作為異常值。
Copyright©2021 w3cschool編程獅|閩ICP備15016281號-3|閩公網安備35020302033924號
違法和不良信息舉報電話:173-0602-2364|舉報郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號
聯系方式:
更多建議: