Phương pháp thay thế lặp MI – Multiple Imputation
2. Tạo các mô hình thay thế
Theo lý thuyết, một mô hình thay thế (imputation model) sẽ ước lượng tổ hợp phân phối của tất cả các biến trong mô hình. Câu lệnh mi impute chained không yêu cầu bạn phải chỉ rõ mô hình riêng rẽ của từng biến. Bạn chỉ liệt kê các biến cần thay thế cùng với các thông tin chúng thay thế như thế nào và mi impute chained sẽ tự động xây dựng các mô hình riêng rẽ. Tuy nhiên, sự hiệu quả của mô hình thay thế chung sẽ phụ thuộc tính hiệu quả của tất cả các mô hình riêng rẻ. Nếu 1 mô hình riêng rẻ không hội tụ thì quá trình thay thế cho mô hình chung sẽ thất bại. Cũng như nếu 1 mô hình riêng rẽ bị xác định sai (misspecificatied) thì sẽ dẫn đến sự thiên chệch trong kết quả ước lượng mô hình chung. Do vậy, rất cần thiết phải kiểm tra tính hiệu quả (tính hội tụ và tính xác định) của các mô hình riêng rẻ trước khi thực hiện câu lệnh mi impute chained. Nội dung này sẽ được đề cập ở mục 3, phần này sẽ tập trung xem xét các vấn đề liên quan đến tạo các mô hình thay thế.
2.1 Chọn biến
Bước đầu tiên trong tạo mô hình thay thế là xác định các biến cần thay thế. Mô hình thay thế nên luôn bao gồm tất cả các biến trong mô hình phân tích, kể cả biến phụ thuộc (mặc dù có nhiều tranh luận về việc thay thế giá trị missing của biến phụ thuộc). Thậm chí, nếu bạn không có dự định sử dụng các giá trị thay thế cho biến phụ thuộc thì các giá trị quan sát được của biến phụ thuộc sẽ cung cấp thêm thông tin cho các biến giải thích và thông tin sẳn có của những quan sát kia sẽ được thay thế các giá trị missing của biến phụ thuộc trong mô hình thay thế.
Ví dụ thay thế biến phụ thuộc
Sử dụng dữ liệu gồm 1000 quan sát với các biến x1-x3 được rút ra từ một phân phối chuẩn chuẩn hóa độc lập (iid) và biến phụ thuộc y là tổng của tất cả biến x cộng với thành phần sai số chuẩn chuẩn hóa.
Giả định: y và x1-x3 đều có 20% khả năng bị missing (MCAR).
Kết quả đúng: hồi quy y theo x1-x3 thì các hệ số ước lượng phải bằng 1.
Phân tích mẫu đầy đủ
use https://www.vietlod.com/data/dependent-imputed.dta, clear
reg y x*