的情况下可以计算出类内离散度矩阵以及类间离散度矩阵,其中和分别代表各类均值与总体均值。是K-L坐标系的产生矩阵,变换后表征分类性能的函数Р Р可见是类间离散度与类内离散度在这坐标的分量之比,越大,表明在新坐标系中该坐标轴包含较多可分性信息。为了降低特征空间的维数,可以将各分量按大小重新排列,使:Р并且与前面d个最大的值相对应的特征向量,j=1,……,d作为特征空间的基向量。Р程序框图Р1.不考虑性别信息Р读入训练样本矩阵Р计算样本均值和协方差矩阵Р计算产生矩阵的特征值Р得到最大特征值对应的特征向量并建立K-L坐标系Р用测试样本进行测试分类Р利用类均值向量的特征提取Р读入训练样本矩阵Р计算样本均值和协方差矩阵Р根据给定的先验概率,求类内离散度和类间离散度Р计算产生矩阵的特征值,代入性能函数Р得到最大对应的特征向量并建立K-L坐标系Р用测试样本进行测试分类Р实验结果Р.不考虑性别信息的特征提取Р实验中不考虑类别信息,用FAMALE.TXT和MALE.TXT的数据作为本次实验使用的样本集,建立基于K-L变换的分类器,记录错误率,并与Fisher线性分类器的分类结果作比较。Р 表1Р不考虑性别信息的特征提取中,Fisher线性分类器略胜一筹Р.利用类均值向量的特征提取Р实验中考虑类别信息,设定男女先验概率分别为0.75和0.25,建立基于K-L变换的分类器,记录分类错误率并与Fisher线性分类器的分类错误率进行比较。Р 表2Р利用类均值向量的特征提取中,分类效果会受到先验概率的影响Р实验心得Р有了前两次的实验经验,这次的实验完成起来要熟络得多。我们先对之前学过的知识进行了系统的回顾,对KL变换有了更深一步的了解,此外,我们在选取先验概率时,考虑到前面Fisher分类器采用的是0.75对0.25,所以为了减少工作量,我们依旧选取0.75对0.25,整个过程相比于前两次显得较为轻松。