回歸方程怎么求殘差?怎么求出殘差?
你好呀~我是你們的老朋友,一個天天和數(shù)據(jù)打交道的自媒體人。最近好多姐妹私信我:“老師,我剛學(xué)完線性回歸,但卡在‘殘差’這一步了!到底怎么算?為啥要算?”
別急,今天就用最生活化的方式,帶你一步步搞懂——回歸方程怎么求殘差?怎么求出殘差?
先來個真實案例:假設(shè)你是個咖啡店老板,想看看“每天賣出的咖啡杯數(shù)”和“當(dāng)天氣溫”有沒有關(guān)系。你記錄了7天的數(shù)據(jù):
氣溫(℃):20, 22, 25, 28, 30, 32, 35
銷量(杯):120, 130, 145, 160, 175, 190, 210
你用Excel或Python擬合出回歸方程:Y = 5.5X + 10(其中Y是銷量,X是氣溫)。
這時候,問題來了——這個公式真的準(zhǔn)嗎?它預(yù)測的值和實際值之間差多少?這就是殘差登場的時候啦!
殘差 = 實際值 預(yù)測值,就這么簡單!
比如第1天:氣溫20℃,實際賣了120杯,預(yù)測銷量 = 5.5×20 + 10 = 120杯 → 殘差 = 120 120 = 0
第2天:氣溫22℃,實際130杯,預(yù)測 = 5.5×22 + 10 = 131杯 → 殘差 = 130 131 = 1
第3天:氣溫25℃,實際145杯,預(yù)測 = 152.5 → 殘差 = 145 152.5 = 7.5
你看,有的時候預(yù)測剛好對,有的時候偏高、偏低。這些差值就是殘差,它們告訴你模型的“誤差程度”。
那為什么我們一定要看殘差?因為:
如果殘差整體很小且隨機分布,說明模型靠譜;
如果殘差有規(guī)律(比如總是偏高),說明模型可能漏掉了重要因素(比如是不是下雨影響了銷量?)
小貼士:朋友圈發(fā)數(shù)據(jù)圖時,你可以畫個“殘差圖”——橫軸是預(yù)測值,縱軸是殘差。如果散點像雪花一樣亂飛,恭喜你,模型很穩(wěn)!
所以啊,姐妹們,別怕殘差,它是你數(shù)據(jù)分析路上的“鏡子”——照出模型的好壞,也幫你找到改進(jìn)的方向。
下次寫報告或做選題分析時,記得加上殘差分析,你會比別人多一層洞察力!?
我是你們的干貨博主,關(guān)注我,一起把復(fù)雜數(shù)據(jù)變有趣~???

