大家好,今天我們要聊一個(gè)看似簡(jiǎn)單卻經(jīng)常被混淆的統(tǒng)計(jì)指標(biāo)——平均相對(duì)誤差(Average Relative Error,ARE)和相對(duì)平均偏差(Relative Average Deviation,RAD)。這兩個(gè)指標(biāo)都用于衡量數(shù)據(jù)的誤差或偏差,但它們的計(jì)算方式和應(yīng)用場(chǎng)景有所不同。如果你是數(shù)據(jù)分析小白,或者經(jīng)常在工作中需要用到這些指標(biāo),這篇文章一定能幫到你。
首先,我們先來理清楚這兩個(gè)指標(biāo)的基本概念。平均相對(duì)誤差和相對(duì)平均偏差,都是用來描述一組數(shù)據(jù)與參考值之間的差異程度。它們的計(jì)算方式雖然相似,但側(cè)重點(diǎn)有所不同。
讓我們先從一個(gè)實(shí)際案例入手。假設(shè)我們測(cè)量了班上10個(gè)同學(xué)的身高,得到了以下數(shù)據(jù)(單位:厘米):
160, 162, 165, 168, 170, 172, 175, 178, 180, 182
而實(shí)際上,他們的真實(shí)身高應(yīng)該是:
155, 160, 165, 170, 175, 180, 185, 190, 195, 200
現(xiàn)在,我們用這兩個(gè)指標(biāo)來衡量預(yù)測(cè)值與實(shí)際值之間的誤差。
先來計(jì)算平均相對(duì)誤差(ARE)。ARE的公式是:
ARE = (1/n) Σ(|預(yù)測(cè)值 實(shí)際值| / 實(shí)際值)
這里,n是數(shù)據(jù)的個(gè)數(shù),Σ表示求和,|·|表示絕對(duì)值。
我們來計(jì)算一下。對(duì)于每個(gè)同學(xué),預(yù)測(cè)值與實(shí)際值的比值以及相對(duì)誤差如下:
1號(hào)同學(xué):160/155 = 1.032,相對(duì)誤差為3.2%
2號(hào)同學(xué):162/160 = 1.0125,相對(duì)誤差為1.25%
3號(hào)同學(xué):165/165 = 1,相對(duì)誤差為0%
4號(hào)同學(xué):168/170 ≈ 0.988,相對(duì)誤差為1.2%
5號(hào)同學(xué):170/175 ≈ 0.971,相對(duì)誤差為2.9%
6號(hào)同學(xué):172/180 ≈ 0.956,相對(duì)誤差為4.4%
7號(hào)同學(xué):175/185 ≈ 0.946,相對(duì)誤差為5.4%
8號(hào)同學(xué):178/190 ≈ 0.937,相對(duì)誤差為6.3%
9號(hào)同學(xué):180/195 ≈ 0.923,相對(duì)誤差為7.7%
10號(hào)同學(xué):182/200 = 0.91,相對(duì)誤差為9%
現(xiàn)在,我們將這些相對(duì)誤差相加,然后除以數(shù)據(jù)個(gè)數(shù)10,得到ARE:
ARE = (3.2% + 1.25% + 0% + 1.2% + 2.9% + 4.4% + 5.4% + 6.3% + 7.7% + 9%) / 10 ≈ 4.0%
接下來,我們來計(jì)算相對(duì)平均偏差(RAD)。RAD的公式是:
RAD = (1/n) Σ|預(yù)測(cè)值 實(shí)際值| / 實(shí)際值的平均值
首先,我們需要計(jì)算每個(gè)預(yù)測(cè)值與實(shí)際值的差值的絕對(duì)值,然后求和,再除以n,最后除以實(shí)際值的平均值。具體計(jì)算如下:
1號(hào)同學(xué):|160 155| = 5
2號(hào)同學(xué):|162 160| = 2
3號(hào)同學(xué):|165 165| = 0
4號(hào)同學(xué):|168 170| = 2
5號(hào)同學(xué):|170 175| = 5
6號(hào)同學(xué):|172 180| = 8
7號(hào)同學(xué):|175 185| = 10
8號(hào)同學(xué):|178 190| = 12
9號(hào)同學(xué):|180 195| = 15
10號(hào)同學(xué):|182 200| = 18
將這些差值相加,得到Σ|預(yù)測(cè)值 實(shí)際值| = 5 + 2 + 0 + 2 + 5 + 8 + 10 + 12 + 15 + 18 = 87
然后,計(jì)算實(shí)際值的平均值:
實(shí)際值總和 = 155 + 160 + 165 + 170 + 175 + 180 + 185 + 190 + 195 + 200 = 1785
實(shí)際值平均值 = 1785 / 10 = 178.5
最后,計(jì)算RAD:
RAD = 87 / 10 / 178.5 ≈ 0.0484,即4.84%
現(xiàn)在,我們得到了ARE和RAD的結(jié)果:
ARE ≈ 4.0%
RAD ≈ 4.84%
從這個(gè)案例來看,ARE和RAD的數(shù)值有些接近,但并非完全相同。那么,它們有什么區(qū)別呢?讓我們?cè)賮碜屑?xì)分析一下。
首先,ARE和RAD都是衡量預(yù)測(cè)值與實(shí)際值之間誤差的指標(biāo),但它們的計(jì)算方式有所不同。
ARE的計(jì)算方式是先對(duì)每個(gè)數(shù)據(jù)點(diǎn)的相對(duì)誤差取絕對(duì)值,再求平均值。也就是說,ARE是對(duì)每個(gè)數(shù)據(jù)點(diǎn)的相對(duì)誤差進(jìn)行簡(jiǎn)單的平均,而每個(gè)數(shù)據(jù)點(diǎn)的權(quán)重相同。
而RAD的計(jì)算方式則不同。RAD是先計(jì)算每個(gè)數(shù)據(jù)點(diǎn)的絕對(duì)誤差,然后求和,再除以n,最后除以實(shí)際值的平均值。因此,RAD實(shí)際上是在計(jì)算平均絕對(duì)誤差的基礎(chǔ)上,再除以實(shí)際值的平均值,得到一個(gè)相對(duì)的平均偏差。
簡(jiǎn)單來說,ARE和RAD都是衡量預(yù)測(cè)值與實(shí)際值之間誤差的指標(biāo),但它們的計(jì)算方式和側(cè)重點(diǎn)不同。ARE更注重每個(gè)數(shù)據(jù)點(diǎn)的相對(duì)誤差的平均值,而RAD則更注重整體誤差相對(duì)于實(shí)際值平均值的偏差。
接下來,我們來比較一下ARE和RAD的適用場(chǎng)景。
如果我們要比較不同數(shù)據(jù)集的誤差,或者在不同單位下進(jìn)行比較,ARE可能是一個(gè)更好的選擇,因?yàn)樗皇軉挝挥绊?,直接給出了百分比形式的誤差。
而RAD則更適合用于衡量預(yù)測(cè)值與實(shí)際值之間的整體偏差,尤其是在需要考慮實(shí)際值大小的情況下。例如,在銷售預(yù)測(cè)中,如果實(shí)際銷售額差異較大,RAD可以更好地反映預(yù)測(cè)誤差相對(duì)于實(shí)際值的大小。
總結(jié)一下,ARE和RAD的主要區(qū)別在于它們的計(jì)算方式和側(cè)重點(diǎn)不同。ARE更注重每個(gè)數(shù)據(jù)點(diǎn)的相對(duì)誤差的平均值,而RAD則是整體誤差相對(duì)于實(shí)際值平均值的偏差。
在實(shí)際應(yīng)用中,我們需要根據(jù)具體需求選擇合適的指標(biāo)。如果需要衡量預(yù)測(cè)值與實(shí)際值之間的相對(duì)誤差的平均值,那么ARE是一個(gè)不錯(cuò)的選擇;如果需要衡量整體誤差相對(duì)于實(shí)際值的平均偏差,那么RAD則是更適合的指標(biāo)。
最后,我們?cè)倩氐街暗陌咐纯磧烧叩膮^(qū)別具體體現(xiàn)在哪里。在我們計(jì)算的例子中,ARE ≈ 4.0%,RAD ≈ 4.84%。兩者數(shù)值接近,但RAD稍微大一些。這是因?yàn)镽AD不僅考慮了每個(gè)數(shù)據(jù)點(diǎn)的誤差,還考慮了實(shí)際值的平均值,因此在某些情況下可能會(huì)給出不同的結(jié)果。
總之,理解這些指標(biāo)背后的意義,以及它們的計(jì)算方式和適用場(chǎng)景,能夠幫助我們?cè)趯?shí)際工作中更好地進(jìn)行數(shù)據(jù)分析和決策。
如果你對(duì)數(shù)據(jù)分析還有其他問題,歡迎在評(píng)論區(qū)留言,我會(huì)盡力為你解答。

