KTL cơ bảnXử lý dữ liệu

Phương pháp thay thế lặp MI – Multiple Imputation

Nếu bạn bỏ qua y trong mô hình thay thế, chỉ thay thế các biến x1-x3, thì các hệ số ước lượng của mô hình sẽ bị chệch về 0:

use https://www.vietlod.com/data/dependent-imputed.dta, clear
mi set wide
mi register imputed x*
mi register regular y miss_*
mi impute chained (regress) x*, add(10)
mi estimate: reg y x*

Phân biệt MCAR, MAR, MNAR

Tại sao các hệ số ước lượng của mô hình sẽ bị chệch về 0? Một cách đơn giản để hiểu vấn đề là xem xét các sự tương quan giữa y, x1, x2. Đầu tiên, chúng ta xem sự tương quan của y và x1 trong trường hợp dữ liệu chưa thay thế (mi xeq 0: cor y x1) và dữ liệu thay thế (mi xeq 1/5: cor y x1 if miss_x1)

Phân biệt MCAR, MAR, MNAR

Bởi vì không bao gồm y trong mô hình thay thế nên mô hình thay thế chỉ tạo các giá trị của x1, x2 và x3 không tương quan với y. Điều này chỉ phù hợp đối với các giá trị missing chứ không phải cho các giá trị quan sát được. Điều này cũng có thể làm thiên chệch kết quả trong mô hình cuối, trong đó y không thực sự tương quan với x1, x2, và x3.

Vấn đề này sẽ biến mất nếu chúng ta thêm y vào mô hình thay thế. Điều này có nghĩa là các giá trị missing của y phải được thay thế, bằng cách sử dụng điều kiện if !miss_y trong câu lệnh:

use https://www.vietlod.com/data/dependent-imputed.dta, clear
mi set wide
mi register imputed y x*
mi register regular miss_*
mi impute chained (regress) x* y, add(10)
mi estimate: reg y x* if !miss_y

Phân biệt MCAR, MAR, MNAR

Luôn luôn bổ sung biến phụ thuộc trong mô hình thay thế, dù bạn có sử dụng các giá trị thay thế của biến phụ thuộc hay không.

Trang trước 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15Trang sau
Xem thêm
Back to top button