Phương pháp thay thế lặp MI – Multiple Imputation
1.2.1 Trường hợp MCAR
Ở trường hợp này, dữ liệu là MCAR và cả phân tích mẫu đầy đủ lẫn MI đều cho các kết quả không chệch.
Kết quả ước lượng trong trường hợp mẫu đầy đủ:
use https://www.vietlod.com/data/MCAR.dta, clear
reg y x
Kết quả thực hiện trong trường hợp áp dụng MI:
mi set wide
mi register imputed x
mi register regular y
mi impute chained (regress) x=y, add(10)
mi estimate: reg y x
Nhận xét: không có sự khác biệt lớn giữa trường hợp mẫu đầy đủ và MI. Hệ số của biến x đều khác 0 có ý nghĩa thống kê 5%. Tuy nhiên, sai số chuẩn của x trong trường hợp mẫu đầy đủ là nhỏ hơn so với trường hợp MI.
1.2.2 Trường hợp MAR
Bây giờ, chúng ta xem xét trường hợp khả năng của x bị missing tỉ lệ với y (luôn quan sát được). Dữ liệu này là MAR. Với dữ liệu MAR các phân tích dựa trên mẫu đầy đủ sẽ bị chệch.
use https://www.vietlod.com/data/MAR.dta, clear
reg y x
mi set wide
mi register imputed x
mi register regular y
mi impute chained (regress) x=y, add(10)
mi estimate: reg y x
Nhận xét: hệ số ước lượng của x trong trường hợp mẫu đầy đủ bằng 0.6740548 nhỏ hơn nhiều so với giá trị 0.9911255 của MI. Do vậy, trong trường hợp MAR kết quả ước lượng mẫu đầy đủ sẽ bị chệch, trong khi kết quả của phép MI vẫn được đảm bảo.