KTL cơ bảnXử lý dữ liệu

Phân biệt gen vs egen, listwise vs pairwise deletion

1. Mã hóa missing data

Có 3 cách thông dụng để mã hóa các missing data này:

– Cách 1: sử dụng lệnh replace để thay thế các giá trị đặc biệt

use missing_data.dta, clear
replace x1 = .a if x1 ==-999
replace x1 = .b if x1 ==-99
codebook x1
list

– Cách 2: sử dụng lệnh mvdecode

Ưu điểm của câu lệnh mvdecode là cho phép mã hóa nhiều biến cùng lúc, so với câu lệnh replace chỉ mã hóa lần lượt từng biến.

use missing_data.dta, clear
mvdecode x1 x2, mv(-999=.a \-99=.b)
list

– Cách 3: sử dụng lệnh mvdecode với _all để mã hóa toàn bộ danh sách biến

use missing_data.dta, clear
mvdecode _all, mv(-999=.a \-99=.b)
list

GHI CHÚ:

Trong trường hợp chúng ta muốn trở về giá trị mã hóa đặc biệt ban đầu từ các giá trị missing thì sử dụng câu lệnh mvencode như sau: mvencode _all, mv(.a=-999 \.b=-99)

Trang trước 1 2 3 4Trang sau
Xem thêm
Back to top button