Phương pháp thay thế lặp MI – Multiple Imputation
Và kết quả dao động của giá trị trung bình và độ lệch chuẩn của dữ liệu được thay thế cho thấy một trạng thái dừng hay hội tụ của dữ liệu.
Nếu bạn thấy có dấu hiệu chuỗi dữ liệu thay thế không hội tụ sau 10 lần lặp (mặc định) thì gia tăng số lần lặp trước khi lưu các giá trị được thay thế với tùy chọn burnin(). Nếu tính hội tụ là không bao giờ đạt được cho thấy rằng có vấn đề ở mô hình thay thế.
Kiểm tra giá trị được thay thế
Sau khi thay thế, chúng ta cũng cần kiểm tra các giá trị được thay thế có giống với các giá trị quan sát được không. Không may là không có một kiểm định chính thống nào kiểm tra sự giống nhau này.
Đối với biến nhị phân và biến danh mục thì chúng ta có thể so sánh các bảng tần suất. Đối với biến liên tục thì so sánh dựa trên giá trị trung bình và độ lệch chuẩn. Tuy nhiên, bao quát nhất là đánh giá trên hình dạng phân phối của dữ liệu, chẳng hạn đồ thị kernel hoặc histogram.
mi xeq:
Tiền tố mi xeq: cho Stata biết áp dụng tuần tự câu lệnh cho mỗi bước thay thế riêng rẽ. Đối với dữ liệu ban đầu ứng với lần thay thế thứ 0. Vì vậy:
mi xeq: tab race
sẽ cho chúng ta 6 bảng tần suất: 1 cho dữ liệu ban đầu và 5 bảng ứng với 5 lần thay thế.
Tuy nhiên, chúng ta muốn so sánh các giá trị quan sát với các giá trị thay thế chứ không phải toàn bộ tập dữ liệu. Điều này đòi hỏi bổ sung thêm điều kiện if trong câu lệnh tab như bên dưới.
mi xeq 0: tab race
mi xeq 1/5: tab race if miss_race