始变量相关矩阵或协方差矩阵内部结构关系的研究,利用原始变量的线形组合形成几个综合指标(主成分) ,在保留原始变量主要信息的前提下其到降维和简化问题的作用,使得在研究复杂问题时更容易抓住主要矛盾。一般地说,利用主成分分析得到的主成分与原始变量之间有如下基本关系: 1. 每个主成分都是各原始变量的线形组合。 2. 主成分数目大大少于原始变量的数目。 3. 主成分保留了原始变量的绝大部分信息 4. 各主成分之间互不相关。设某一事物的研究涉及 p 个指标, 分别用表示,这 p 个指标构成的 12, ,..., PXXX p 维随机向量. 设随机对 X 的均值为,协方差阵为 X= (X1,X 2 ,...,X P)′μΣ,对 X进行线性变换,可以形成新的综合变量,用 Y 表示,既其可由原来的变量线性表示, 满足下式: ppYXXX1 111 1221=μ+μ+ ....+ μ pPYXXX2 211 2222=μ+μ+ ....+ μ…… PPp PP PY=μX+μX+ ....+ μX 在基于一定原则的情况下,综合变量、…. 分别称为原始变量的第一、 1Y2YpY 第二、…第P 个主成分。通过主成分分析,可以从事物之间错综复杂的关系中找出一些主要成分,从而能有效利用大量统计数据进行定量分析,揭示变量之间的内在关系,得到对事物特征及其发展的一些深层次的启发,把研究工作引向深入。 2.1.2 求解主成分的方法求解主成分的方法主要有两种,一是从原始变量的协方差矩阵结构入手,二是从原始变量的相关性矩阵结构入手。一· 从协方差矩阵出发求解主成分设矩阵 A′=A ,将 A 的特征值依大小顺序排列,不妨设 12, ,..., nλλλ, 为矩阵 A 各特征值对应的标准正交特征向量, 则对 12 ...nλ≥λ≥≥λ12, ,..., p γγγ任意向量 x有 010 max , min xxn