Please Enable JavaScript in your Browser to visit this site

KTL cơ bảnXử lý dữ liệu

Các phương pháp xử lý missing

2.2. Phương pháp thay thế đơn (Single imputation methods)

2.2.1 Thay thế trung bình/trung vị

Ý nghĩa: các giá trị missing của biến có thể được thay thế bằng giá trị trung bình hoặc trung vị của biến (lệnh replace). Chúng ta có thể kết hợp câu lệnh by…egen để thay thế giá trị missing bằng các giá trị trung bình của nhóm.

Ví dụ: chúng ta tin rằng những hộ nghèo sống ở nông thôn ở của mỗi vùng sẽ có thu nhập gần giống nhau. Khi đó, giá trị missing về thu nhập của 1 hộ có thể được thay thế bằng giá trị trung bình của các hộ trong cùng điều kiện (nghèo, nông thôn, vùng) theo câu lệnh sau:

by poor urban region: egen inc_m = mean(income)
replace income = inc_m if income ==.

Nhận xét phương pháp thay thế trung bình/trung vị

Ưu điểm của phương pháp thay thế là sử dụng đầy đủ các quan sát cho phân tích, tuy nhiên, điều này làm giảm sự biến thiên của dữ liệu, giảm kết quả ước lượng tương quan và hiệp phương sai (bởi vì bỏ qua mối quan hệ giữa các biến).

Minh họa phương pháp thay thế missing

2.2.2 Điều chỉnh thông qua biến giả

Quá trình điều chỉnh thông qua biến giả nhằm ghi nhận giá trị missing được thực hiện như sau:

  • Tạo một biến giả ghi nhận giá trị missing (=1 nếu đó là giá trị missing, = 0 nếu là giá trị quan sát).
  • Thay thế các giá trị missing bằng trung bình/trung vị của biến
  • Thêm biến giả ghi nhận giá trị missing này như là biến kiểm soát trong phương trình hồi quy.

Nhận xét phương pháp điều chỉnh thông qua biến giả

Ưu điểm của phương pháp điều chỉnh thông quan biến giả là sử dụng tất cả thông tin sẳn có về các quan sát có giá trị missing. Tuy nhiên, kết quả ước lượng có thể bị chệch và không được sự hỗ trợ của lý thuyết.

2.2.3 Phương pháp thay thế hồi quy (Regression Imputation)

Ý nghĩa của phương pháp là các giá trị missing được thay thế bằng giá trị dự báo của phương trình hồi quy.

Phương pháp thay thế giá trị missing bằng giá trị dự báo có ưu điểm là sử dụng tất cả các thông tin sẳn có, tuy nhiên, sẽ dẫn đến ước lượng quá mô hình và làm giảm phương sai.

Phương pháp thay thế regression

Previous page 1 2 3 4 5Next page
Back to top button