歡迎來到你我貸客服熱線400-680-8888

標準差的致命性缺陷解剖

2014-01-21 15:25:20
來源:你我貸

為什么標準差通常都大于平均差?學者們將其歸因于先平方后開方。還有不少學者認為這“無形”中增大的誤差是總體差異度的合理組成部分,如桂文林、伍超標(2005)指出方差超過平均差平方的部分是離差的平方。⑹楊寶明(2002)指出方差為平均差的平方與離差的方差之和。⑺

(一)方差并不等于平均差的平方與離差的方差之和。

“方差為平均差的平方與離差的方差之和”之結論的錯誤性,我們可以從三個維度進行證明,即例舉證明其錯誤性,運用算術平均數的數學性質來證明其錯誤性,通過考察其推導證明過程來揭示其誤導所在。

1.舉一個實例數據足以證明其錯誤性。

例1,有一組變量數據如表1所示。

表1

序號

標志值

離差

1

126

-2.3333

2

121

-7.3333

3

119

-9.3333

4

135

6.6667

5

141

12.6667

6

128

-0.3333

根據表3所列的數據,我們經過計算,得

方差:σ258.5556

平均差的平方:AD241.5309

離差的方差:σY258.5556

顯然,方差σ2=平均差的平方AD2。

因此,有

AD2+σY2=41.5309+58.555658.5556

故有,σ2AD2+σY2。

2.從方差的數學性質證明其錯誤性。

眾所周知,在算術平均數的數學性質系列中,有一條數學性質為“各變量值與算術平均數的離差之和等于零”,這一數學性質告訴我們,離差的算術平均數也等于零。如果承認這一數學性質正確無誤,那么“方差為平均差的平方與離差的方差之和”之論調,無異于說“方差等于平均差的平方,亦即標準差等于平均差”,這樣一來,又與其結論“標準差不等于平均差”相矛盾;否則,又與算術平均數所具有的這一數學性質明顯相矛盾。

下面,我們運用算術平均數的數學性質“各變量值與算術平均數的離差之和等于零”來證明“方差為平均差的平方與離差的方差之和”之論點的錯誤性。

設標志變量數列為,其算術平均數為,方差為,則有

上述標志變量的離差所組成的數列為,設離差的算術平均數為,離差的方差為。

根據算術平均數的數學性質“各變量值與算術平均數的離差之和等于零”,則有

因此,可以推導出

顯然,標志變量的方差與標志變量的離差的方差等價,亦即

從而,可以得出,

亦即。

這就是說,方差不等于平均差的平方與離差的方差之和。

3.從其推導過程的失誤來證明其錯誤性。

楊寶明(2002)的“方差為平均差的平方與離差的方差之和”其數學表達式為⑹:

(第一步)

(第二步)

變量各值平方的均值減去均值的平方等于變量的方差,于是有

(第三步)

方差為平均差的平方與離差的方差之和。

上述推導證明過程中,存在著一系列失誤。

首先是第一步到第二步的推導出現了常識性錯誤,很明顯,第二步應該是

而不是。

其次是第二步到第三步的推導出現了常識性錯誤:錯誤之一,由于第二步公式是錯誤的,導致以其推導出來的第三步也是錯誤的。錯誤之二,其依據“變量各值平方的均值減去均值的平方等于變量的方差”中的減項講的是“均值的平方”,而其推導出來的第三步公式中卻是平均差的平方AD2,兩者之間明顯矛盾。顯而易見,因為

所以則有

這就是說,方差并不等于平均差的平方與離差的方差之和,方差超過平均差平方的部分也不是離差的平方。

(二)標準差通常都大于平均差,并非先平方后開方之故,而在于其用以平均化的自由度階數信息未能全涵蓋。

眾所周知,方差是各個變量與算術平均值之間的離差的平方的算術平均數,它所表明的是離差平方的平均水平。它在離差平方的算術平均化過程中,對自由度階數N進行了全涵蓋,亦即N個離差平方由N來計算平均水平。這一過程可以表達為:

被除數(分子)

除數(分母)

商。

從反映離差平方的平均水平維度考察,方差是非常正確,毫無疑義的。

但是,方差到標準差的演化則存在了很大的問題與誤導,且看以下過程:

被除數(分子):從方差時的到了標準差時的;

除數(分母):從方差時的N到了標準差時的

商:從方差時的到了標準差時的。

這一推演過程從等式兩邊同時開平方角度講,并沒有錯。然而,從算術平均數的計量規則維度講,則大錯特錯了。且看標準差原型算法的結構:

被除數(分子)

除數(分母)

商。

顯而易見,標準差原型算法對離差的算術平均化過程中其自由化階數是,而并非N。也就是說,標準差原型算法對離差的算術平均化過程中其自由度階數N未能做到全涵蓋,其涵蓋率只有。

其實,方差進行開方的目的在于解決其量綱與離差不一致問題,即方差的量綱是“面積”,離差的量綱是“距離”或“長度”。為了解決這一矛盾,確保反映絕對離散程度指標的量綱與離差相一致,則需要且只需要對各個離差進行平方求和后的算術平均數進行開方還原,就可以將量綱“面積”還原為“距離”或“長度”,而不必且不可以同時也將自由度階數從N變成。眾所周知,如果將自由度階數從N變成,則意味著N個離差數據由來進行平均化,則顯然是非常不科學合理的。

所以,方差的平方根即標準差原型用以衡量和反映變量離散程度的標準差,明顯缺乏科學合理性。

如果將標準差計量公式的分母轉化成N,亦即對離差平方和的平方根進行自由度階數N全涵蓋的算術平均化,那么就會發現“標準差通常都大于平均差”的決定性因素并非標準差的分子中的離差先平方后開方,而是分母代替了N。請看:

從標準差的分子講,離差之和的平方大于離差平方之和,亦即離差平方之和的平方根小于離差的絕對值之和,因而離差的先平方后開方不是標準差大于平均差的決定性因素。標準差的分子中的離差先平方后開方,在分母保持不變的條件下,只會導致各個變量與平均值之間偏離程度的相對縮小。

從標準差的分母講,其分母,即在標準差算法原型中把自由度階數(亦即變量個數)的平方根作為分母來進行變種后的變量離差(即分子先平方后開方)的算術平均化,請問該分母是什么?誰也說不清楚,事實上誰也沒有去關注過這一問題。然而,標準差所存在的最大的、最關鍵的缺陷性問題就在這里――標準差并非真正的平均化。本來應當由自由度階數N來對變種后的變量離差(即分子先平方后開方)進行算術平均化,可是標準差原型算法卻把自由度階數N無意識中變成了,由此造成了自由度階數N信息的嚴重丟失,使得變量離差的個數N與自由度階數顯著不對稱,必然會導致標準差度量和反映變量變異程度的信息失準或失真。

推薦閱讀

【總體標準差】總體標準差的概...

標準差相關專題知識百科,向大家介紹總體標準差的概述,總體標準差的計算公式,總體標...

【轉】如何在word中輸入均...

目標:在圖1的括號內打入“均數加減標準差”1.建立公式編輯器正常情況下,我們的w...

什么是六個標準差?

六西格瑪六西格瑪(SixSigma)又稱:6σ,6Sigma,6&S...

什么是標準差是什么意思,什么...

標準差?標準差是什么意思?標準差(StandardDeviation)是一種表示...

農村污染事故頻出環境標準差須...

安徽近日爆出的血鉛案,是近來各地一連串血鉛案中的最新例子。當地數十名因為中度鉛中...
各國貨幣融資租賃貴金屬證券公司期權交易貸款知識期貨公司金融知識銀行理財產品銀行網點信用卡信托產品
  • 熱線電話(服務時間 09 : 00 - 21 : 00 )
  • 400-680-8888
  • 關注我們
Copyright ? 2015 你我貸(www.afnvca.live) 網上投資理財 版權所有;杜絕借款犯罪,倡導合法借貸,信守借款合約
關注你我貸官方微信
青海11选5开奖结果彩票控 6开什么店面赚钱 免费欢乐麻将下载安装 诚信可靠网打码赚钱 竞彩比分彩客直播 在线麻将游戏有哪些 达人彩票首页 7.珠宝怎么赚钱 棒球比分网雪缘 2018种什么药赚钱 担保公司工作赚钱吗 海南4+1 被子生意能赚钱吗 做评测赚钱 湖北11选5 开通网站如何赚钱 提现秒到的赚钱软件