主成分得分和因子得分

記錄一下主成分得分和因子得分html

本文是基於各全國各省經濟發展狀況綜合評價
首先貼上總得方差解釋
在這裏插入圖片描述web

A.成分矩陣
在這裏插入圖片描述
特別注意:
該成分矩陣(因子載荷矩陣)並非主成分的特徵向量,即不是主成分的係數。主成分系數的求法:各自因子載荷向量除以各自因子特徵值的算數平方根。則第一主成分的各個係數是向量(0.885,0.607,0.912,0.465,-0.5
08,-0.619,0.823)除以√3.755後才獲得的,(這裏是數理統計的相關知識)即(.456,.313,.470,.239,.250,-.262,-.319,.424)纔是主成分1的特徵向量,知足條件是係數的平方和等於1,分別乘以原始變量標準化以後的變量即爲第一主成分的函數表達式;
Y=0.456Z1+0.313Z2+0.470Z3+0.239Z4+0.250Z5-0.262Z6-0.319Z7+
0.424
Z8 ——這裏的Z爲標準化後的變量
svg

B.成分得分系數矩陣
在這裏插入圖片描述函數

該矩陣是因子載荷矩陣除以各自的方差(即特徵值)得來的,其實是因子分析中各個因子的係數,在主成分分析中不考慮它。xml

C.因子得分
SPSS中,因子分析的「得分」對話框,選中了「保存爲變量」,方法爲迴歸;又選中了「顯示因子得分系數矩陣」,所以SPSS的輸出結果和原始數據一塊兒顯示在數據窗口裏:
在這裏插入圖片描述
D.主成分得分
特別提醒:
後兩列的數據是因子一、因子2和因子3的得分,不是主成分一、主成分2主成分3的得分。主成分得分是相應的因子得分乘相應的方差(即特徵值)
即:主成分1得分=因子1得分√3.755
主成分2得分=因子2得分
√3.755
主成分3得分=因子3得分*√3.755
獲得各地區的主成分一、主成分2和主成分3的得分表以下
在這裏插入圖片描述
(有興趣的童鞋能夠驗證一下:上面推導出來的主成分的函數關係與計算出來的主成分得分是否與該數據欄的得分一致)(按道理應該是一致的。。。)
在這裏我就幫小夥伴們驗證一下,這是經過上述主成分得特徵向量函數關係獲得得主成分123得得分:
在這裏插入圖片描述htm

經過上述兩種操做能夠求得主成分一、主成分2和主成分3,
經過主成分得分能夠聚類分析和綜合評價。
E.綜合得分及排序
每一個地區的綜合得分是按照下列公式計算的:
在這裏插入圖片描述
這裏得權重w1,w2,w3有兩種計算方法,一是經過特徵根,二是經過旋轉以前方差貢獻率,這裏要注意對權重歸一化處理。
權重公式以下:λ是方差貢獻率
λ是方差貢獻率
在案例中具體得計算以下:
在這裏插入圖片描述
F.因子分析
參照這篇文章得解釋:主成分分析與因子分析及SPSS實現blog

這裏簡單記錄一下:
因子分析得重點是:探討變量內在聯繫和結構(structure detection)
觀測變量之間的存在相互依賴關係
在SPSS中進行的是因子分析,則考察因子的可解釋性,並在必要時進行因子旋轉,以尋求最佳解釋方式。
在主界面中點擊「旋轉」按鈕,打開對話框,「方法」=>「最大方差法」,「輸出」=>「旋轉解」。
在這裏插入圖片描述
這是選擇後的成分矩陣。通過旋轉,能夠看出:
公因子1得分越高,全部的跑步和跨欄成績越差,而跳遠、撐杆跳等須要助跑類項目的成績也越差,因此公因子1表明的是奔跑能力的反向指標,可稱爲「奔跑能力」。
公因子2與鐵餅和鉛球的正相關性很高,與標槍、撐杆跳等須要上肢力量的項目也正相關,因此該因子能夠成爲「上肢力量」。
通過旋轉,能夠看出公因子有了更合理的解釋。
在這裏插入圖片描述
由上圖,咱們能夠寫出公因子的表達式(用F一、F2表明兩個公因子,Z1~Z10分別表明原始變量):排序

F1 = -0.16Z1+0.161Z2+0.145Z3+0.199Z4-0.131Z5-0.167Z6+0.137Z7+0.174Z8+0.131Z9-0.037Z10
F2同理,略去。
注意,這裏的變量Z1~Z10,F一、F2再也不是原始變量,而是標準正態變換後的變量。
一樣咱們能夠選擇「保存爲變量」,方法採用默認的「迴歸」方法,同時選中「顯示因子得分系數矩陣」,來直接獲得因子得分。進然後續得聚類分析和綜合評價。圖片