医务人员在实际工作中经常会遇到样本数据丢失的问题。数据的缺乏可能导致统计结果的偏差。特别是对于样本量小的数据,大量的数据甚至会影响终的结论。因此,有必要对缺失数据进行补充。下面我们来详细讲解如何在spss中用回归估计法处理医学数据的缺失值。
回归估计法(regression),即是以存在缺失值的变量为因变量,以其他全部或部分变量为自变量,用无缺失的数据拟合回归方程:以方程的预测值作为该记录缺失值的初步估计值,再以全部数据拟合回归方程;如此迭代,直至两次方程预测值基本一致,并以此作为缺失值的估计值。
本例以“舒张压”和“心率”为因变量,以“组别”、“性别”、“年龄”、“身高”、“体重”、“收缩压”为自变量,采用回归估计法对存在缺失值的医学数据在SPSS中进行了缺失值的补充步骤展示。回归估计法在进行缺失值填补时较为客观,但可能存在对方差的低估,适用于有适合的“自变量”完整数据存在时。
1、数据概况
数据具体如下(仅展示存在缺失值数据列),其中,“……”表示该处数据值存在缺失,从数据表可以看出,缺失值主要出现在“舒张压”和“心率”数据列,共存在7处缺失。
2、在SPSS中的操作步骤
①依次点击“分析——缺失值分析”
②将变量分别选入“定量变量”和“分类变量”中——勾选“回归”方法。
③点击“回归”选项——勾选“保存完成数据”,并命名新的插补后的数据。
④得到插补后的数据列及具体补充数据。