Chẩn đoán mô hình hồi quy logit

Kết quả cho thấy hệ số của _hat và _hatsq có ý nghĩa thống kê. Điều đó có ý nghĩa một mặt mô hình chúng ta xây dựng có biến giải thích phù hợp, mặt khác nó cho thấy mô hình có thể đã bỏ sót một số biến quan trọng. Trong trường hợp này, chúng ta thử bổ sung thêm một (một số) biến giải thích khác vào mô hình, xem xét ý nghĩa thống kê của biến thêm vào và kiểm tra lại lỗi mô tả bằng câu lệnh linktest.
. logit hiqual yr_rnd meals cred_ml ym , nolog Logistic regression Number of obs = 707 LR chi2(4) = 390.13 Prob > chi2 = 0.0000 Log likelihood = -153.95333 Pseudo R2 = 0.5589 ------------------------------------------------------------------------------ hiqual | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- yr_rnd | -2.816989 .8625013 -3.27 0.001 -4.50746 -1.126517 meals | -.1014958 .0098204 -10.34 0.000 -.1207434 -.0822483 cred_ml | .7795475 .3205748 2.43 0.015 .1512325 1.407863 ym | .0459029 .0188068 2.44 0.015 .0090422 .0827635 _cons | 2.668048 .429688 6.21 0.000 1.825875 3.510221 ------------------------------------------------------------------------------
Ghi chú: ở đây, chúng ta đã bổ sung thêm biến tương tác ym = yr_rnd*meals
Kết quả cho thấy biến tương tác bổ sung có ý nghĩa thống kê (mức ý nghĩa 5%).
Kết quả kiểm tra linktest cho mô hình mới này cho thấy biến _hat có ý nghĩa thống kê (các biến giải thích phù hợp), nhưng biến _hatsq không có ý nghĩa thống kê (p-value = 0.381 > 0.05). Vì vậy, có thể chấp nhận mô hình xây dựng này là phù hợp.
. linktest, nolog Logistic regression Number of obs = 707 LR chi2(2) = 390.87 Prob > chi2 = 0.0000 Log likelihood = -153.58393 Pseudo R2 = 0.5600 ------------------------------------------------------------------------------ hiqual | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- _hat | 1.063142 .1154731 9.21 0.000 .8368188 1.289465 _hatsq | .0279257 .031847 0.88 0.381 -.0344934 .0903447 _cons | -.0605556 .1684181 -0.36 0.719 -.390649 .2695379 ------------------------------------------------------------------------------
Bên cạnh vấn đề bỏ sót biến quan trọng thì xác định sai dạng hàm liên kết của biến phụ thuộc cũng có thể làm cho hệ số _hatsq có ý nghĩa thống kê (hay đôi khi còn gọi linktest có ý nghĩa thống kê). Trong trường hợp này chúng ta có thể sử dụng lệnh boxtid (sử dụng lệnh ssc install boxtid để cài đặt gói lệnh này) để kiểm tra liệu biến phụ thuộc có tuyến tính theo các biến giải thích hay không (tuyến tính theo hệ số). boxtid là một dạng của mô hình Box-Tidwell nhằm biến đổi biến giải thích thành dạng mũ ( \(x \to {b_1} + {b_2}{x^p}\), với p được tính thông qua ước lượng hợp lí cực đại – ML). Bên cạnh đó, boxtid cũng có thể biến đổi x thành dạng mũ hóa.
. logit hiqual yr_rnd meals , nolog Logistic regression Number of obs = 1200 LR chi2(2) = 898.30 Prob > chi2 = 0.0000 Log likelihood = -308.27755 Pseudo R2 = 0.5930 ------------------------------------------------------------------------------ hiqual | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- yr_rnd | -.9908117 .3545668 -2.79 0.005 -1.68575 -.2958736 meals | -.1074156 .0064857 -16.56 0.000 -.1201273 -.0947039 _cons | 3.61557 .2418968 14.95 0.000 3.141461 4.089679 ------------------------------------------------------------------------------
. linktest, nolog Logistic regression Number of obs = 1200 LR chi2(2) = 908.87 Prob > chi2 = 0.0000 Log likelihood = -302.99327 Pseudo R2 = 0.6000 ------------------------------------------------------------------------------ hiqual | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- _hat | 1.10755 .0724056 15.30 0.000 .9656381 1.249463 _hatsq | .0622644 .0174387 3.57 0.000 .0280852 .0964436 _cons | -.1841694 .1185286 -1.55 0.120 -.4164812 .0481423 ------------------------------------------------------------------------------