KTL cơ bảnPhân tích hồi quy
Diễn giải chi tiết kết quả hồi quy logit

6. Giải thích các kết quả hồi quy logit
6.1 Bảng kết quả hồi quy
Sử dụng kết quả với lệnh logit ở trên để diễn giải kết quả mô hình logit như sau:
- Trong bảng kết quả trên, chúng ta thấy kết quả hội tụ sau 5 lần lặp ở giá trị log likelihood bằng -79.8833. Giá trị log likelihood có thể được sử dụng để so sánh các mô hình với nhau.
- Ở dòng trên cùng của kết quả, chúng ta thấy cả 200 quan sát trong tập dữ liệu đều được sử dụng trong phân tích. Điều này bởi vì tập dữ liệu hiện sử dụng không có giá trị missing. Các giá trị missing sẽ được loại bỏ khỏi phân tích.
- LR chi2 (3)cho biết giá trị của thống kê chi bình phương (3 bậc tự do) bằng 62.94 với mức ý nghĩa p-value bằng 0.0001. Thống kê Chi2 này sẽ kiểm tra hiệu quả của mô hình logit so với mô hình không (không có biến giải thích nào), hay nói cách khác, Chi2 kiểm tra giả thuyết cho rằng hệ số ước lượng của 3 biến giải thích trong mô hình probit đều bằng 0. Với mức ý nghĩa p-value bằng 0.0001 cho thấy, mô hình logit là phù hợp.
- Tương tự như OLS, bảng hệ số cũng bao gồm thông tin về các hệ số ước lượng, sai số chuẩn, mức ý nghĩa, khoảng tin cậy… nhưng lưu ý, ở cột thống kê. Kiểm định hệ số trong hồi quy probit sử dụng thống kê z thay vì thống kê t như ở OLS. Kết quả cho thấy, ngoại trừ biến math thì 2 biến còn lại là female và femalexmath không có ý nghĩa thống kê ở mức 5%.
6.2 Giải thích về tính chính xác của phương pháp
Thông thường, có hai chỉ số có thể sử dụng phản ảnh độ chính xác của một phương pháp xét nghiệm: độ nhạy (sensitivity) và độ đặc hiệu (specificity). Thật ra, hai thuật ngữ tiếng Anh này không hẳn thích hợp, nhưng vì giới y khoa đã sử dụng quá lâu nên chúng ta tạm chấp nhận hai thuật ngữ đó. Tôi sẽ giải thích hai chỉ số này như sau (trích trong bài giới thiệu phương pháp Bayes của GS.TS Y khoa Nguyễn Văn Tuấn):
- Độ nhạy là xác suất có kết quả dương tính nếu cá nhân thật sự mắc bệnh. Nói cách khác, độ nhạy trả lời câu hỏi: nếu 100 người mắc bệnh ung thư vú đều đi chụp nhũ ảnh thì có bao nhiêu người có kết quả dương tính. Nếu phương pháp nhũ ảnh hoàn toàn chính xác, chúng ta kỳ vọng tất cả 100 người sẽ có kết quả dương tính. Nhưng trong thực tế, không có phương pháp nào hoàn chỉnh, nên độ nhạy của nhũ ảnh thường khoảng 90% hoặc thấp hơn (nhưng chúng ta sẽ lạc quan với 90%).
- Độ đặc hiệu là xác suất có kết quả âm tính nếu cá nhân thật sự không mắc bệnh. Thông thường độ đặc hiệu của nhũ ảnh khoảng 80%. Độ đặc hiệu 80% có thể hiểu như sau: nếu 100 người không mắc bệnh đều đi chụp nhũ ảnh thì sẽ có 80 người có kết quả âm tính. Nói cách khác, sẽ có 20 người có kết quả dương tính, và đây là trường hợp dương tính giả (false positive).
Ngoài ra, có thể xem thêm bài viết về ROC: https://www.medcalc.org/manual/roc-curves.php