缺失数据的Bootstrap与Jackknife方法:
我们将进行如下几种操作:
a)利用缺失插补后的Bootstrap与Jackknife,进行Y2 Y_2Y均值与变异系数的标准差的估计。(插补方式为线性回归插补)
b)利用缺失插补前的Bootstrap与Jackknife,进行Y2 Y_2Y均值与变异系数的标准差的估计。(插补方式为线性回归插补)
c)比较各种方式的90%置信区间实际覆盖真实值的情况,哪种方式表现最好,哪种方式是理论可行的,在大样本情况下。(这里对四种方法重复100次实验,看覆盖次数多少,越多表示效果越好)
Jackknife(刀切法)是有Maurice Quenouille (1949)提出的一种再抽样方法,其原始动机是降低估计的偏差。类似于“Leave one out”的交叉验证方法。令X=(X1,X2,…,Xn)为观测到的样本,定义第i个Jackknife样本为丢掉第i个样本后的剩余样本即由此生成的Jackknife样本集之间的差异很小,每两个Jackknife样本中只有两个单个的原始样本不同。Jackknife为一种瑞士小折刀,很容易携带。通过类比,John W. Tukey (1958)在统计学中创造了这个术语,作为一种通用的假设检验和置信区间计算的方法。