KTL cơ bảnPhân tích hồi quy

Diễn giải chi tiết kết quả hồi quy logit

4. Hồi quy logit đa biến

Trong mô hình hồi quy logit đa biến thì mỗi hệ số ước lượng là sự thay đổi dự kiến trong log-odds của việc được vinh danh trong lớp học ứng với mỗi sự gia tăng 1 đơn vị trong các biến giải thích khi giá trị của các biến còn lại được giữ không đổi. Mỗi hệ số mũ hóa là tỉ lệ của 2 odds cho mỗi sự gia tăng 1 đơn vị trong các biến giải thích khi giá trị của các biến còn lại được giữ không đổi.

Xét ví dụ: logit(p) = log(p/(1-p))= β0  + β1*math + β2*female + β3*read

. logit honor math female read

Iteration 0:   log likelihood = -111.35502  
Iteration 1:   log likelihood = -81.114154  
Iteration 2:   log likelihood = -78.119675  
Iteration 3:   log likelihood = -78.084806  
Iteration 4:   log likelihood = -78.084776  
Iteration 5:   log likelihood = -78.084776  

Logistic regression                               Number of obs   =        200
                                                  LR chi2(3)      =      66.54
                                                  Prob > chi2     =     0.0000
Log likelihood = -78.084776                       Pseudo R2       =     0.2988

------------------------------------------------------------------------------
       honor |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
        math |   .1229589    .031276     3.93   0.000     .0616591    .1842586
      female |    .979948   .4216307     2.32   0.020     .1535671    1.806329
        read |   .0590632    .026553     2.22   0.026     .0070202    .1111062
       _cons |  -11.77025    1.71071    -6.88   0.000    -15.12318   -8.417315
------------------------------------------------------------------------------

Kết quả cho thấy, nếu giữ điểm môn toán và đọc ở một giá trị cố định thì odds của việc được vinh danh trong lớp của học sinh nữ nhiều hơn so với học sinh nam là là exp(0.979.948) = 2.66. Tính theo phần trăm thì chúng ta có thể nói rằng odds cho nữ cao hơn nam là 166%. Tương tự, chúng ta có thể tính odds cho việc được vinh danh ứng với mỗi sự gia tăng của điểm môn toán khi giữ biến female và read ở một giá trị cố định. Theo đó, cứ mỗi sự gia tăng 1 điểm môn toán sẽ làm tăng 13% trong odds của việc được vinh danh khi giữ nguyên giá trị của female và read, exp(0.1229589) = 1.13.

5. Hồi quy logit với biến tương tác

Trong các ví dụ trước, chúng ta đã nói rằng các hệ số hồi quy của biến tương ứng với sự thay đổi trong log-odds hoặc dưới dạng mũ hóa đó chính là sự thay đổi trong tỉ lệ odds. Kết luận này chỉ đúng khi mô hình của chúng ta xét không có thành phần tương tác nào. Khi một mô hình có thành phần tương tác của hai biến giải thích thì việc giải thích tác động của một biến giải thích sẽ phụ thuộc vào giá trị của biến giải thích còn lại trong thành phần tương tác.

Xét ví dụ: logit(p) = log(p/(1-p))= β0 + β1*female + β2*math + β3*femalexmath

Trong ví dụ này để đơn giản trong cách giải thích chúng ta chỉ đưa vào biến tương tác giữa một biến giải thích dạng nhị phân và một biến giải thích dạng liên tục.

. logit honor female math  femalexmath

Iteration 0:   log likelihood = -111.35502  
Iteration 1:   log likelihood = -82.363951  
Iteration 2:   log likelihood = -79.909579  
Iteration 3:   log likelihood =  -79.88332  
Iteration 4:   log likelihood = -79.883301  
Iteration 5:   log likelihood = -79.883301  

Logistic regression                               Number of obs   =        200
                                                  LR chi2(3)      =      62.94
                                                  Prob > chi2     =     0.0000
Log likelihood = -79.883301                       Pseudo R2       =     0.2826

------------------------------------------------------------------------------
       honor |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      female |  -2.899863   3.094213    -0.94   0.349    -8.964409    3.164683
        math |   .1293781   .0358836     3.61   0.000     .0590474    .1997087
 femalexmath |   .0669951   .0534605     1.25   0.210    -.0377854    .1717757
       _cons |  -8.745841   2.129147    -4.11   0.000    -12.91889    -4.57279
------------------------------------------------------------------------------

Ghi chú: biến femalexmath = female*math

Với sự hiện diện của thành phần tương tác femalexmath trong phương trình hồi quy chúng ta không thể nói về odds của việc được vinh danh của học sinh nữ hoặc nam chỉ dựa vào hệ số của female trong phương trình ước lượng như ở mô hình trước. Ở đây, chúng ta xét riêng hai phương trình: (i) một phương trình cho học sinh nữ (female = 1) và một phương trình cho nam (female = 0)

  • Phương trình hồi quy logit đối với học sinh nam (female = 0): logit(p) = log(p/(1-p))= β0+ β2*math.
  • Phương trình hồi quy logit đối với học sinh nữ (female = 1): logit(p) = log(p/(1-p))= (β0+ β1) + (β2 + β3 )*math.

Như vậy với các yếu tố khác không đổi, đối với một học sinh nam thì một sự gia tăng một đơn vị trong điểm số toán học sẽ mang lại một sự thay đổi trong logit là 0.13. Trong khi đó, đối với các học sinh nữ, một sự gia tăng một đơn vị trong điểm số toán sẽ mang lại một sự thay đổi trong logit là (0.13 + 0.067) = 0.197.

Xét theo tỉ lệ odds thì tỉ lệ odds học sinh nam và học sinh nữ ứng với mỗi sự gia tăng một đơn vị trong điểm số toán lần lượt là exp(0.13) = 1.14 và exp(0.197) = 1.22 ứng với mỗi sự gia tăng một đơn vị trong điểm số toán. Tỷ lệ của 2 tỉ lệ odds này (nữ trên nam) là hệ số mũ hóa của hệ số tương tác femalexmath: 1.22 / 1.14 = exp(0.067) = 1.07.

Trang trước 1 2 3 4 5 6Trang sau
Xem thêm
Back to top button