KTL cơ bảnPhân tích hồi quy

Chẩn đoán mô hình hồi quy logit

Kết quả cho thấy hệ số của _hat và _hatsq có ý nghĩa thống kê. Điều đó có ý nghĩa một mặt mô hình chúng ta xây dựng có biến giải thích phù hợp, mặt khác nó cho thấy mô hình có thể đã bỏ sót một số biến quan trọng. Trong trường hợp này, chúng ta thử bổ sung thêm một (một số) biến giải thích khác vào mô hình, xem xét ý nghĩa thống kê của biến thêm vào và kiểm tra lại lỗi mô tả bằng câu lệnh linktest.

. logit hiqual yr_rnd meals cred_ml ym , nolog

Logistic regression                               Number of obs   =        707
                                                  LR chi2(4)      =     390.13
                                                  Prob > chi2     =     0.0000
Log likelihood = -153.95333                       Pseudo R2       =     0.5589

------------------------------------------------------------------------------
      hiqual |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      yr_rnd |  -2.816989   .8625013    -3.27   0.001     -4.50746   -1.126517
       meals |  -.1014958   .0098204   -10.34   0.000    -.1207434   -.0822483
     cred_ml |   .7795475   .3205748     2.43   0.015     .1512325    1.407863
          ym |   .0459029   .0188068     2.44   0.015     .0090422    .0827635
       _cons |   2.668048    .429688     6.21   0.000     1.825875    3.510221
------------------------------------------------------------------------------

Ghi chú: ở đây, chúng ta đã bổ sung thêm biến tương tác ym = yr_rnd*meals

Kết quả cho thấy biến tương tác bổ sung có ý nghĩa thống kê (mức ý nghĩa 5%).

Kết quả kiểm tra linktest cho mô hình mới này cho thấy biến _hat có ý nghĩa thống kê (các biến giải thích phù hợp), nhưng biến _hatsq không có ý nghĩa thống kê (p-value = 0.381 > 0.05). Vì vậy, có thể chấp nhận mô hình xây dựng này là phù hợp.

. linktest, nolog

Logistic regression                               Number of obs   =        707
                                                  LR chi2(2)      =     390.87
                                                  Prob > chi2     =     0.0000
Log likelihood = -153.58393                       Pseudo R2       =     0.5600

------------------------------------------------------------------------------
      hiqual |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
        _hat |   1.063142   .1154731     9.21   0.000     .8368188    1.289465
      _hatsq |   .0279257    .031847     0.88   0.381    -.0344934    .0903447
       _cons |  -.0605556   .1684181    -0.36   0.719     -.390649    .2695379
------------------------------------------------------------------------------

Bên cạnh vấn đề bỏ sót biến quan trọng thì xác định sai dạng hàm liên kết của biến phụ thuộc cũng có thể làm cho hệ số _hatsq có ý nghĩa thống kê (hay đôi khi còn gọi linktest có ý nghĩa thống kê). Trong trường hợp này chúng ta có thể sử dụng lệnh boxtid (sử dụng lệnh ssc install boxtid để cài đặt gói lệnh này) để kiểm tra liệu biến phụ thuộc có tuyến tính theo các biến giải thích hay không (tuyến tính theo hệ số). boxtid là một dạng của mô hình Box-Tidwell nhằm biến đổi biến giải thích thành dạng mũ ( \(x \to {b_1} + {b_2}{x^p}\), với p được tính thông qua ước lượng hợp lí cực đại – ML). Bên cạnh đó, boxtid cũng có thể biến đổi x thành dạng mũ hóa.

. logit hiqual yr_rnd meals , nolog

Logistic regression                               Number of obs   =       1200
                                                  LR chi2(2)      =     898.30
                                                  Prob > chi2     =     0.0000
Log likelihood = -308.27755                       Pseudo R2       =     0.5930

------------------------------------------------------------------------------
      hiqual |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      yr_rnd |  -.9908117   .3545668    -2.79   0.005     -1.68575   -.2958736
       meals |  -.1074156   .0064857   -16.56   0.000    -.1201273   -.0947039
       _cons |    3.61557   .2418968    14.95   0.000     3.141461    4.089679
------------------------------------------------------------------------------
. linktest, nolog

Logistic regression                               Number of obs   =       1200
                                                  LR chi2(2)      =     908.87
                                                  Prob > chi2     =     0.0000
Log likelihood = -302.99327                       Pseudo R2       =     0.6000

------------------------------------------------------------------------------
      hiqual |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
        _hat |    1.10755   .0724056    15.30   0.000     .9656381    1.249463
      _hatsq |   .0622644   .0174387     3.57   0.000     .0280852    .0964436
       _cons |  -.1841694   .1185286    -1.55   0.120    -.4164812    .0481423
------------------------------------------------------------------------------
Trang trước 1 2 3 4 5 6 7 8Trang sau
Back to top button