Hồi quy logit lặp – Stata
Hồi quy logit lặp (repeated measures logistic regression) được sử dụng để giải thích tác động của những biến độc lập lên biến phụ thuộc trong trường hợp các quan sát là kết quả của các phép đo lặp của các đối tượng. Trong Stata, hồi quy logit lặp có thể được thực hiện bằng lệnh xtgee. Bài viết sau sẽ hướng dẫn phân tích hồi quy logit lặp trên Stata.
Lệnh xtgee là viết tắt của:
- x: các quan sát chéo
- t: các quan sát thời gian
- gee: generalized estimating equations là ước lượng tổng quát các biểu thức
Mô hình ước lượng tổng quát các biểu thức (GEE) có ưu điểm là nó xét nhiều hơn đến cấu trúc tương quan của dữ liệu. Do vậy, nó làm cho mô hình được ước lượng trở nên phù hợp hơn và có sức mạnh giải thích tốt hơn.
Cấu trúc của lệnh xtgee được thể hiện như sau:
xtgee depvar predvars,
family(dạng phân phối của biến phụ thuộc)
link(hàm liên kết tuyến tính biến phụ thuộc – độc lập)
corr(cấu trúc tương quan)
i(biến quan sát)
t(biến thời gian)
robus
Để thực hiện ước lượng mô hình GEE bằng lệnh xtgee, chúng ta phải xác định rõ 5 yếu tố:
1. family
Trả lời câu hỏi: “nhóm hàm phân phối nào phù hợp với dữ liệu biến phụ thuộc: phân phối chuẩn (Normal), nhị phân (Binomial), hay dạng phân phối khác?”
Family
- binomial
- Gaussian (i.e., normal) mặc định
- gamma
- nbinomial
- Poisson
2. Những biến giải thích nào được đưa vào mô hình? Xem thêm: đặc tả sai mô hình
Xem tiếp phần minh họa thực hành hồi quy logit lặp trên Stata ở trang 2