数学建模数据预处理

上传者：hnxzy51 | 格式：doc | 页数：15 | 大小：245KB

文档介绍

强调采用估计缺失数据,然后估计参数的方法。“M”的步骤是假设没有缺失数据而进行最大似然估计,然后进行“E”步,即是在给定数据可以用期望值替代,继续以上步骤,直到参数的估计值收敛为止。该方法比删除个案和单值填补更有吸引力,它一个重要的前提:适用于大样本。有效样本的数量足够以保证极大似然估计的估计值是渐近无偏的服从正态分布。但是这种方法可能会陷入局部极值,收敛速度也不是很快,并且计算很复杂。Р8.2 对于问题二的模型评价Р在工程、计量以及实验等测量过程中, 由于测量者的一时疏忽, 读错、记错测量数据或者操作不当、仪器突然失常等主客观因素, 都会使测量数据含有粗大误差, 从而严重影响测量精度, 歪曲实验结果, 因此, 在处理测量数据时, 应该把含有粗大误差的数值从中剔除。但是, 判断一个数据是否含有粗大误差而决定取舍时, 一定要特别慎重, 要有充分的理论依据, 否则会将反映客观事实的数据错误剔除, 或将真正含有粗大误差的数据保留, 造成人为地破坏测量数据的可靠性。Р而拉依达判断准则简便易懂,并且容易理解,能将含有粗大误差的数据剔除。在保留大部分数据的前提下,对少量异常数据进行删除,使得数据之间的客观规律不致产生较大变化,有利于研究工作的进行,减少误差。Р8.3 对于问题三的模型评价Р基于密度估计的异常数据识别与修正方法可以有效识别与修正连续突变或连续缺失的数据点,且识别过程是基于原始数据整体进行的,避免了现有的横向比较法的缺点。Р 基于密度估计的方法能很好地辨识异常数据,并给予适当修正,其修正符合的相对误差在5%以内,且较改进的数据横向比较法要好些。Р线性插值法简单易懂,且操作简单,计算不复杂。但是效果却一般,其主要适用于数据分布比较集中的情况,对于本题,其修改结果不太理想。Р参考文献Р[1]孙瑜玲,数学建模中的缺失数据[A],中国科技创新导刊,2013,NO.10:65-67.