Please Enable JavaScript in your Browser to visit this site

KTL cơ bảnPhân tích hồi quy

Phát hiện khuyết tật dữ liệu trong hồi quy logit

Kỹ thuật chẩn đoán dữ liệu cuối cùng liên quan đến hệ số độ nhạy (coefficient sensitivity). Nó cho biết mức độ ảnh hưởng của mỗi quan sát lên mỗi tham số ước lượng. Tương tự như OLS, chúng ta có thể sử dụng dfbeta cho hồi quy logit. Trên Stata, chúng ta có thể sử dụng gói lệnh ldfbeta (net install ldfbeta.pkg) để thực hiện chẩn đoán này.

  • ldfbeta meals
  • scatter DFmeals id, mlab(snum)

Đồ thị chẩn đoán độ nhạy theo mã quan sát

Chúng ta cũng có thể sử dụng Pregibon’s dbeta để cung cấp những thông tin tóm tắt về sự ảnh hưởng của các quan sát lên các tham số ước lượng (dbeta này tương tự như Cook’s D trong hồi quy OLS) thông qua tùy chọn dbeta trong câu lệnh predict.

  • predict dbeta, dbeta
  • scatter dbeta id, mlab(snum)

Tóm lại: chúng ta đã biết cách làm thế nào để chẩn đoán các kết quả phân tích hồi quy logit. Tuy nhiên, câu hỏi đặt ra là giới hạn (cutoff) để xác định đó là các vấn đề có ảnh hưởng? Đầu tiên là chúng ta phải đánh giá, đối chiếu với lý thuyết. Tiếp đến là áp dụng các quy tắc kinh nghiệm (rule of thumb) khi mô hình có cở mẫu lớn (vì khi cở mẫu lớn thì phân phối của các biến có thể tiệm cận phân phối chuẩn). Thông thường, chúng ta so sánh độ lớn tương đối của một thống kê so với các quan sát  còn lại. Kết quả so sánh để quyết định được tổng hợp ở bảng sau:

Thống kê đo lường Giá trị
leverage (hat value) >2 hoặc 3 lần leverage trung bình
abs(Pearson Residuals) > 2
abs(Deviance Residuals) > 2

 

Previous page 1 2 3 4 5 6
Back to top button