Hồi quy tuyến tính đa biến – SPSS

03/10/2014

8 phút

IV. ĐỌC KẾT QUẢ HỒI QUY TUYẾN TÍNH ĐA BIẾN

Bảng ANOVA tóm tắt các kết quả về độ phù hợp của mô hình nghiên cứu.

– Hệ số ý nghĩa (Sig) trong bảng sẽ cho thấy mô hình có giải thích được sự thay đổi của biến phụ thuộc hay không? Thông thường, nếu mức ý nghĩa này lớn hơn 0.05 chúng ta có thể kết luận mô hình nghiên cứu không phù hợp với dữ liệu thu thập.
Hồi quy tuyến tính đa biến

– Cột F trong bảng ANOVA so sánh giá trị kiểm định F trong mô hình hồi quy tuyến tính đa biến với mô hình null chỉ bao gồm hệ số cắt (\(\alpha \)). Hay nói cách khác F sẽ kiểm định giả thuyết cho rằng tất cả các hệ số ước lượng của các biến giải thích đều bằng 0 (\({\beta _1} = {\beta _2} = {\beta _3} = 0\)). Nếu F không có ý nghĩa thống kê thì chúng ta không thể nói mô hình hồi quy tuyến tính đa biến là tốt hơn so với mô hình null.

– Cột Sum of squares cho biết tổng bình phương (TSS) các sai số của mô hình hồi quy tuyến tính đa biến. TSS chính là tổng thay đổi trong biến phụ thuộc. Ta có: TSS = ESS + RSS, trong đó, ESS: tổng bình phương thay đổi của biến phụ thuộc được giải thích bởi mô hình và RSS: tổng bình phương của phần dư. Khả năng giải thích của mô hình \({R^2}\) chính là tỉ số ESS/TSS hay là phần thay đổi được giải thích bởi mô hình trên tổng thay đổi.

Cụ thể, các thông số trong bảng ANOVA trên như sau:

ESS chính là giá trị của Regression (7.498)
RSS chính là giá trị của Residual (1.482)
TSS = ESS + RSS là giá trị Total (8.980)

Bảng Model Summary trình bày kết quả tóm tắt của mô hình hồi quy về độ phù hợp của mô hình (\({R^2}\) và \({R^2}\) hiệu chỉnh), sai số của ước lượng và giá trị d của kiểm định Durbin – Watson.

Cột R-square cho biết giá trị \({R^2}\). \({R^2}\) đo tỉ lệ thay đổi trong biến phụ thuộc được giải thích bởi sự thay đổi của các biến độc lập. Trong ví dụ này \({R^2}=0.835\) cho thấy 83.5% sự thay đổi (chứ không phải phương sai) của biến phụ thuộc có thể được giải thích bởi mô hình.
Cột Adjusted R-square cho biết giá trị \({R^2}\) hiệu chỉnh. \({R^2}\) hiệu chỉnh đo lường tỉ lệ phương sai trong biến phụ thuộc được giải thích bởi sự thay đổi của các biến độc lập của mô hình. Trong ví dụ này, \({R^2}\) hiệu chỉnh bằng 0.804 cho thấy 80.4% phương sai của biến phụ thuộc được giải thích bởi mô hình.
Cột Std Error of Estimate cho biết sai số chuẩn của ước lượng. Sai số chuẩn của ước lượng đo lường mức độ phân tán của các hệ số ước lượng của biến phụ thuộc quanh giá trị trung bình (trong ví dụ này, sai số chuẩn của ước lượng là 4.468). So sánh nó với giá trị trung bình dự đoán (Predicted) của biến phụ thuộc. Nếu tỉ lệ này lớn hơn 10% thì được xem là phân tán cao.
Ngoài ra, cột Durbin – Watson cho biết giá trị thống kê d của kiểm định Durbin – Watson. Trong ví dụ, giá trị d bằng 2.029 nằm trong khoảng 1.5 đến 2.5, do vậy, theo quy tắc kinh nghiệm^[1] thì không có sự tự tương quan bậc 1.

Hồi quy tuyến tính đa biến

Lưu ý:

Cần đánh giá độ phù hợp của mô hình ở bảng ANOVA trước khi đánh giá hiệu quả giải thích \({R^2}\).

Bảng Coefficients sẽ trình bày các hệ số của phương trình hồi quy tuyến tính giản đơn bao gồm 1 hằng số cắt \(\alpha \) và tham số \(\beta \) của ước lượng. Kết quả cho thấy cả ngoại trừ hệ số của biến tuổi (age) có nghĩa thống kê (5%) thì các biến còn lại đều không có ý nghĩa thống kê. Điều đó cho thấy, tuổi có ảnh hưởng đến khả năng đọc hiểu của trẻ, trong khi đó chưa có bằng chứng cho thấy các yếu tố như chỉ số IQ hoặc khả năng ghi nhớ tác động đến khả năng đọc hiểu của trẻ.

Cột Collinearity Statistics kiểm tra mức độ đa cộng tuyến giữa các biến giải thích. Theo quy tắc kinh nghiệm thì hệ số phóng đại phương sai (VIF) lớn hơn 10 thì được xem là có hiện tượng đa cộng giữa các biến^[2]. Trong ví dụ trên, hệ số VIF của các biến nằm trong khoảng từ 1.8 đến 3.5; do vậy, không xảy ra hiện tượng đa cộng tuyến.

Đồ thị histogram của phần dư cho thấy phân phối của phần dư có hình dạng phân phối chuẩn, tuy nhiên ở đồ thị Normal P-P cho thấy giá trị các quan sát phân phối xấp xỉ đường thẳng ứng với phân phối chuẩn. Kết quả này cho thấy phần dư có phân phối xấp xỉ phân phối chuẩn.
Hồi quy tuyến tính đa biến

Tuy nhiên, ở đồ thị Scatter plot của phần dư theo giá trị dự báo cho thấy phương sai của phần dư không đồng nhất. Nghĩa là mô hình hồi quy này đang vi phạm giả thuyết về phương sai đồng nhất của hồi quy tuyến tính giản đơn.

Sự vi phạm này không làm ảnh hưởng đến độ phù hợp \({R^2}\) và hệ số ước lượng \(\beta \) của mô hình. Tuy nhiên, phương sai thay đổi sẽ ảnh hưởng đến sai số chuẩn của ước lượng, từ đó, làm thay đổi giá trị thống kê F, t và mức ý nghĩa của mô hình.

1. Một quy tắc kinh nghiệm được sử dụng để kết luận không có sự tự tương quan bậc 1 là nếu giá trị thống kê d nằm giữa 1.5 và 2.5. d nhỏ hơn 1.5 cho biết có sự tự tương quan dương bậc 1. d lớn hơn 2.5 cho biết có sự tự tương quan âm bậc 1.
2. Hoàng Ngọc Nhậm và cộng sự, 2008. Giáo trình kinh tế lượng. Hà Nội: Nhà xuất bản lao động – xã hội, trang 140.

Trang trước 1 2 3

Thẻ

03/10/2014

8 phút

Xem thêm

Hồi quy thứ tự - SPSS

Khuyết tật mô hình hồi quy tuyến tính