Diễn giải chi tiết kết quả hồi quy logit
Tiếp theo bài sơ lược về hồi quy logit, bài viết này sẽ giới thiệu hồi quy logit qua các ví dụ đơn giản. Bài viết sẽ sử dụng một tập dữ liệu mẫu, Logit dataset, với mục đích minh họa. Các bộ dữ liệu có 200 quan sát và biến kết quả được sử dụng là honor (nhận giá trị là 1 nếu một học sinh trong một lớp học được vinh danh và có giá trị bằng 0 nếu học sinh đó không được vinh danh). Ở đây, chúng tôi sẽ bỏ qua tất cả các kiểm định và tập trung vào ý nghĩa của các hệ số hồi quy (Nguồn: http://www.ats.ucla.edu)
1. Hồi quy logit đơn giản với hằng số
Chúng ta bắt đầu với một mô hình Null chỉ với hằng số có dạng: logit(p) = β0
. logit honor Iteration 0: log likelihood = -111.35502 Iteration 1: log likelihood = -111.35502 Logistic regression Number of obs = 200 LR chi2(0) = 0.00 Prob > chi2 = . Log likelihood = -111.35502 Pseudo R2 = 0.0000 ------------------------------------------------------------------------------ honor | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- _cons | -1.12546 .1644101 -6.85 0.000 -1.447697 -.8032217 ------------------------------------------------------------------------------
Điều này nghĩa là logit(p) = log(p/(1-p)) = -1.12546. Vậy p ở đây là gì? Đó chính là xác suất mà các học sinh trong lớp được vinh danh, được tính bằng số học sinh được vinh danh trên tổng số học sinh trong lớp
. tab honor honor | Freq. Percent Cum. ------------+----------------------------------- No | 151 75.50 75.50 Yes | 49 24.50 100.00 ------------+----------------------------------- Total | 200 100.00
Vì vậy,
- p = 49/200 = 0.245
- odds = 0.245 / (1 – 0.245) = 0.3245
- logit = log(0.3245) = -1.12546