KTL cơ bảnXử lý dữ liệu
Phân biệt gen vs egen, listwise vs pairwise deletion
2. Thể hiện tổng hợp missing
use missing_data.dta, clear
mvdecode _all, mv(-999=.a \-99=.b)
2 câu lệnh sau sẽ mô tả số quan sát missing và không missing trong mỗi biến
misstable sum
misstable pattern, freq
Câu lệnh misstable sum sẽ thể hiện cụ thể từng loại missing trong mỗi biến. Một cách khác để hiển thị nhanh số giá trị missing trong mỗi biến là sử dụng lệnh nmissing
nmissing
Theo đó, số giá trị missing ở các biến x1, x2, x3 lần lượt là 4, 4 và 1.
Câu lệnh ngược lại npresent cho biết số quan sát hợp lí (non-missing) trong mỗi biến.
npresent
Ngoài ra, chúng ta có thể sử dụng hàm rowmiss và rownonmis như sau:
egen miss = rowmiss(x1 – x3)
egen nomiss = rownonmiss(x1 – x3)
list