KTL cơ bảnPhân tích hồi quy

Hồi quy Logit – STATA

2.

Lựa chọn phương pháp

Phần trình bày bên dưới sẽ liệt kê một số phương pháp có thể được sử dụng để giải quyết vấn đề của ví dụ nêu ra.

  • Hồi quy Probit: mô hình hồi quy Probit sẽ cho ra các kết quả tương đối giống với hồi quy Logit. Việc lựa chọn giữa logit vs probit phần lớn tùy thuộc vào quan điểm cá nhân của người sử dụng.

Đọc thêm: Phân biệt mô hình logit vs probit.

  • Hồi quy OLS. Khi biến phụ thuộc của mô hình có dạng danh mục (nhị phân, thứ tự, định danh) thì hồi quy OLS (cụ thể trong trường hợp này là mô hình xác suất tuyến tính) được sử dụng như cách mô tả các xác suất có điều kiện. Tuy nhiên, các phần dư (sai số) của mô hình xác suất tuyến tính sẽ vi phạm giả thuyết OLS về tính đồng nhất và phân phối chuẩn của phần dư. Kết quả là các sai số chuẩn của hệ số ước lượng, và giá trị kiểm định thống kê sẽ không còn đúng.[1]
  • Phương pháp phân tách 2 nhóm. Một phương pháp phân tích đa biến cho trường hợp biến phụ thuộc dạng nhị phân thường được sử dụng là Hotelling’s T2. Ý tưởng của phương pháp Hotelling’s T2 là chuyển các giá trị 0/1 của biến phụ sang biến phân nhóm và các biến giải thích sẽ được chuyển sang các biến kết quả. Điều này cho phép thực hiện kiểm định chung về mức ý nghĩa của mô hình nhưng không cho biết được giá trị hệ số của từng biến riêng rẻ. Do vậy, ý nghĩa giải thích của các biến độc lập sẽ không còn rõ ràng.
  • Hồi quy Logit. Như đã trình bày ở trên, hồi quy Logit vs probit là 2 dạng thể hiện khác nhau của hàm phân phối xác suất. Kết quả hồi quy từ mô hình logit vs probit có mối quan hệ chặt với nhau[2].

Bài viết này sẽ minh họa ước lượng mô hình ở ví dụ trên bằng phương pháp hồi quy probit với sự hỗ trợ của phần mềm STATA.

Trên STATA, hồi quy logit được thực hiện bằng câu lệnh logit hoặc logistic. Cấu trúc của logit tương tự với logistic như sau:

logit admit gre gpa i.rank
Hồi quy logit - stata

logistic admit gre gpa i.rank
Hồi quy logit - stata

Ghi chú: tiền tố i. trước biến rank nhằm mục đích thông báo cho STATA hiểu phải thực hiện hồi quy probit với i biến giả tương ứng với i giá trị của biến thứ tự rank (ở đây i = 4).

Quan sát kết quả hiển thị của 2 lệnh logitlogistic không có sự khác biệt ở các thông số ngoại trừ giá trị ở 2 cột coef (hoặc Odds ratio) và Std. Err.

Sở dĩ như vậy là vì, lệnh logitlogistic là 2 dạng thực hiện của cùng một mô hình hồi quy logit. Sự khác nhau chủ yếu ở giá trị tính toán. Lệnh logit sẽ cho kết quả ước lượng là các hệ số logit (log của odds) kí hiệu là coef. Lệnh logistic cho kết quả ước lượng là các hệ số được mũ hóa hay còn gọi là tỉ lệ odds, kí hiệu Odds ratio. Do vậy, tùy theo bạn muốn sử dụng kết quả nào để giải thích mà lựa chọn lệnh phù hợp. Tuy nhiên, điều này cũng không thực sự quan trọng, bởi chúng ta có thể sử dụng kết quả hồi quy của lệnh này để suy ra kết quả của lệnh còn lại.

Trang trước 1 2 3Trang sau
Xem thêm
Back to top button