Diễn giải chi tiết kết quả hồi quy logit
4. Hồi quy logit đa biến
Trong mô hình hồi quy logit đa biến thì mỗi hệ số ước lượng là sự thay đổi dự kiến trong log-odds của việc được vinh danh trong lớp học ứng với mỗi sự gia tăng 1 đơn vị trong các biến giải thích khi giá trị của các biến còn lại được giữ không đổi. Mỗi hệ số mũ hóa là tỉ lệ của 2 odds cho mỗi sự gia tăng 1 đơn vị trong các biến giải thích khi giá trị của các biến còn lại được giữ không đổi.
Xét ví dụ: logit(p) = log(p/(1-p))= β0 + β1*math + β2*female + β3*read
. logit honor math female read Iteration 0: log likelihood = -111.35502 Iteration 1: log likelihood = -81.114154 Iteration 2: log likelihood = -78.119675 Iteration 3: log likelihood = -78.084806 Iteration 4: log likelihood = -78.084776 Iteration 5: log likelihood = -78.084776 Logistic regression Number of obs = 200 LR chi2(3) = 66.54 Prob > chi2 = 0.0000 Log likelihood = -78.084776 Pseudo R2 = 0.2988 ------------------------------------------------------------------------------ honor | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- math | .1229589 .031276 3.93 0.000 .0616591 .1842586 female | .979948 .4216307 2.32 0.020 .1535671 1.806329 read | .0590632 .026553 2.22 0.026 .0070202 .1111062 _cons | -11.77025 1.71071 -6.88 0.000 -15.12318 -8.417315 ------------------------------------------------------------------------------
Kết quả cho thấy, nếu giữ điểm môn toán và đọc ở một giá trị cố định thì odds của việc được vinh danh trong lớp của học sinh nữ nhiều hơn so với học sinh nam là là exp(0.979.948) = 2.66. Tính theo phần trăm thì chúng ta có thể nói rằng odds cho nữ cao hơn nam là 166%. Tương tự, chúng ta có thể tính odds cho việc được vinh danh ứng với mỗi sự gia tăng của điểm môn toán khi giữ biến female và read ở một giá trị cố định. Theo đó, cứ mỗi sự gia tăng 1 điểm môn toán sẽ làm tăng 13% trong odds của việc được vinh danh khi giữ nguyên giá trị của female và read, exp(0.1229589) = 1.13.
5. Hồi quy logit với biến tương tác
Trong các ví dụ trước, chúng ta đã nói rằng các hệ số hồi quy của biến tương ứng với sự thay đổi trong log-odds hoặc dưới dạng mũ hóa đó chính là sự thay đổi trong tỉ lệ odds. Kết luận này chỉ đúng khi mô hình của chúng ta xét không có thành phần tương tác nào. Khi một mô hình có thành phần tương tác của hai biến giải thích thì việc giải thích tác động của một biến giải thích sẽ phụ thuộc vào giá trị của biến giải thích còn lại trong thành phần tương tác.
Xét ví dụ: logit(p) = log(p/(1-p))= β0 + β1*female + β2*math + β3*femalexmath
Trong ví dụ này để đơn giản trong cách giải thích chúng ta chỉ đưa vào biến tương tác giữa một biến giải thích dạng nhị phân và một biến giải thích dạng liên tục.
. logit honor female math femalexmath Iteration 0: log likelihood = -111.35502 Iteration 1: log likelihood = -82.363951 Iteration 2: log likelihood = -79.909579 Iteration 3: log likelihood = -79.88332 Iteration 4: log likelihood = -79.883301 Iteration 5: log likelihood = -79.883301 Logistic regression Number of obs = 200 LR chi2(3) = 62.94 Prob > chi2 = 0.0000 Log likelihood = -79.883301 Pseudo R2 = 0.2826 ------------------------------------------------------------------------------ honor | Coef. Std. Err. z P>|z| [95% Conf. Interval] -------------+---------------------------------------------------------------- female | -2.899863 3.094213 -0.94 0.349 -8.964409 3.164683 math | .1293781 .0358836 3.61 0.000 .0590474 .1997087 femalexmath | .0669951 .0534605 1.25 0.210 -.0377854 .1717757 _cons | -8.745841 2.129147 -4.11 0.000 -12.91889 -4.57279 ------------------------------------------------------------------------------
Ghi chú: biến femalexmath = female*math
Với sự hiện diện của thành phần tương tác femalexmath trong phương trình hồi quy chúng ta không thể nói về odds của việc được vinh danh của học sinh nữ hoặc nam chỉ dựa vào hệ số của female trong phương trình ước lượng như ở mô hình trước. Ở đây, chúng ta xét riêng hai phương trình: (i) một phương trình cho học sinh nữ (female = 1) và một phương trình cho nam (female = 0)
- Phương trình hồi quy logit đối với học sinh nam (female = 0): logit(p) = log(p/(1-p))= β0+ β2*math.
- Phương trình hồi quy logit đối với học sinh nữ (female = 1): logit(p) = log(p/(1-p))= (β0+ β1) + (β2 + β3 )*math.
Như vậy với các yếu tố khác không đổi, đối với một học sinh nam thì một sự gia tăng một đơn vị trong điểm số toán học sẽ mang lại một sự thay đổi trong logit là 0.13. Trong khi đó, đối với các học sinh nữ, một sự gia tăng một đơn vị trong điểm số toán sẽ mang lại một sự thay đổi trong logit là (0.13 + 0.067) = 0.197.
Xét theo tỉ lệ odds thì tỉ lệ odds học sinh nam và học sinh nữ ứng với mỗi sự gia tăng một đơn vị trong điểm số toán lần lượt là exp(0.13) = 1.14 và exp(0.197) = 1.22 ứng với mỗi sự gia tăng một đơn vị trong điểm số toán. Tỷ lệ của 2 tỉ lệ odds này (nữ trên nam) là hệ số mũ hóa của hệ số tương tác femalexmath: 1.22 / 1.14 = exp(0.067) = 1.07.