Chẩn đoán mô hình hồi quy logit
Trong các bài viết trước, chúng tôi đã giới thiệu sơ lược về hồi quy logit, cũng như đi sâu diễn giải chi tiết kết quả hồi quy logit trong từng trường hợp cụ thể. Chẳng hạn như làm thế nào để tạo ra các biến tương tác và làm thế nào để giải thích kết quả của mô hình logit. Để kết quả phân tích được hợp lệ thì cần thiết phải đáp ứng các giả định của mô hình hồi quy logit. Khi các giả định này không được đáp ứng thì chúng ta có thể có vấn đề, chẳng hạn như tính toán sai lệch cách hệ số hoặc sai số chuẩn của các hệ số ước lượng rất lớn, và những vấn đề này có thể dẫn đến suy luận thống kê không còn hợp lệ. Vì vậy, trước khi sử dụng mô hình để thực hiện bất kỳ sự suy luận thống kê nào thì điều đầu tiên là phải kiểm tra xem mô hình đó có phù hợp chưa và kiểm tra liệu các quan sát có ảnh hưởng có tác động đến kết quả ước lượng của các hệ số. Trong bài viết này, chúng tôi sẽ tập trung vào việc làm thế nào để đánh giá một mô hình logit phù hợp, làm thế nào để chẩn đoán các vấn đề tiềm năng trong mô hình cũng như làm thế nào để xác định những quan sát có tác động đáng kể đến độ phù hợp của mô hình hoặc tham số ước lượng. Đầu tiên, chúng ta bắt đầu với việc xem xét các giả định của hồi quy logit.
Các giả định của hồi quy logit bao gồm:
- Xác suất có điều kiện thật sự là một hàm logit của các biến giải thích.
- Không có biến giải thích quan trọng bị bỏ sót.
- Không bao gồm các biến giải thích không liên quan.
- Các biến giải thích không có lỗi đo lường.
- Các quan sát độc lập.
- Các biến giải thích không phải là tổ hợp tuyến tính của nhau.
Toàn bộ phần minh họa gồm mô tả sai mô hình, đánh giá độ phù hợp của mô hình và các vấn đề khác như hiện tượng phương sai sai số thay đổi hoặc đa cộng tuyến cũng như phát hiện khuyết tật của dữ liệu đều được thực hiện trên file minh họa apilog