KTL cơ bảnPhân tích hồi quy
Chẩn đoán mô hình hồi quy logit
Kết quả sau khi chạy boxtid:
. boxtid logit hiqual yr_rnd meals Iteration 0: Deviance = 608.6424 Iteration 1: Deviance = 608.6373 (change = -.0050887) Iteration 2: Deviance = 608.6373 (change = -.0000592) -> gen double Imeal__1 = X^0.5535-.7047873475 if e(sample) -> gen double Imeal__2 = X^0.5535*ln(X)+.4454623098 if e(sample) (where: X = (meals+1)/100) [Total iterations: 2] Box-Tidwell regression model Logistic regression Number of obs = 1200 LR chi2(3) = 906.22 Prob > chi2 = 0.0000 Log likelihood = -304.31863 Pseudo R2 = 0.5982 ------------------------------------------------------------------------------ hiqual | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- Imeal__1 | -12.13661 1.60761 -7.55 0.000 -15.28747 -8.985755 Imeal_p1 | .0016505 1.961413 0.00 0.999 -3.842647 3.845948 yr_rnd | -.998601 .3598947 -2.77 0.006 -1.703982 -.2932205 _cons | -1.9892 .1502115 -13.24 0.000 -2.283609 -1.694791 ------------------------------------------------------------------------------ ------------------------------------------------------------------------------ meals | -.1074156 .0064857 -16.56 Nonlin. dev. 7.918 (P = 0.005) p1 | .5535294 .1622327 ------------------------------------------------------------------------------ Deviance: 608.637.
Kết quả kiểm tra tính phi tuyến của biến meals là có ý nghĩa thống kê (p = 0.005) với giả thuyết H0 là không có tính phi tuyến ở biến meals hay p1 = 1. Nhưng kết quả boxtid cho thấy p1 quanh 0.55 là tối ưu. Vì vậy, có thể xem xét biến đổi lấy căn bậc 2 của meals. Sử dụng linktest để kiểm tra lại mô hình với việc thay thế meals bằng m2 = meals^0.5
. logit hiqual yr_rnd meals cred_ml ym Iteration 0: log likelihood = -349.01971 Iteration 1: log likelihood = -192.43886 Iteration 2: log likelihood = -157.59484 Iteration 3: log likelihood = -153.98173 Iteration 4: log likelihood = -153.95333 Iteration 5: log likelihood = -153.95333 Logistic regression Number of obs = 707 LR chi2(4) = 390.13 Prob > chi2 = 0.0000 Log likelihood = -153.95333 Pseudo R2 = 0.5589 ------------------------------------------------------------------------------ hiqual | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- yr_rnd | -2.816989 .8625013 -3.27 0.001 -4.50746 -1.126517 meals | -.1014958 .0098204 -10.34 0.000 -.1207434 -.0822483 cred_ml | .7795475 .3205748 2.43 0.015 .1512325 1.407863 ym | .0459029 .0188068 2.44 0.015 .0090422 .0827635 _cons | 2.668048 .429688 6.21 0.000 1.825875 3.510221 ------------------------------------------------------------------------------
Kết quả cho thấy trong mô hình biến m2 có ý nghĩa thống kê, đồng thời kết quả linktest không có ý nghĩa thống kê, hay mô hình có thể được chấp nhận. Như vậy, đôi khi logit của biến kết quả không phải là tổ hợp tuyến tính của các biến giải thích nhưng lại là tổ hợp tuyến tính với dạng biến đổi của các biến này.