KTL cơ bảnPhân tích hồi quy
Độ phù hợp hồi quy Stepwise
Ví dụ: sử dụng bộ dữ liệu doanh số bán xe ô tô của Mỹ năm 1978 (auto.dta) chúng ta muốn xem các yếu tố như tiêu hao nhiên liệu (mpg), trọng lượng xe (weight), chiều dài xe (length), nơi sản xuất (foreign) quyết định như thế nào đến giá xe thì trên Stata chúng ta thực hiện như sau:
Đầu tiên, tôi thực hiện hồi quy Stepwsie thuận bằng câu lệnh stepwise với tùy chọn pe trên Stata. Ở đây, tôi sử dụng mức xác suất thêm biến là 5%, nghĩa là các biến có ý nghĩa thống kê ở mức nhỏ hơn 0.05 thì sẽ được thêm vào mô hình.
. sysuse auto (1978 Automobile Data) . stepwise, pe(.05): regress price mpg weight length foreign begin with empty model p = 0.0000 < 0.0500 adding weight p = 0.0000 < 0.0500 adding foreign p = 0.0069 < 0.0500 adding length Source | SS df MS Number of obs = 74 -------------+---------------------------------- F(3, 70) = 28.39 Model | 348565467 3 116188489 Prob > F = 0.0000 Residual | 286499930 70 4092856.14 R-squared = 0.5489 -------------+---------------------------------- Adj R-squared = 0.5295 Total | 635065396 73 8699525.97 Root MSE = 2023.1 ------------------------------------------------------------------------------ price | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------- weight | 5.774712 .9594168 6.02 0.000 3.861215 7.688208 foreign | 3573.092 639.328 5.59 0.000 2297.992 4848.191 length | -91.37083 32.82833 -2.78 0.007 -156.8449 -25.89679 _cons | 4838.021 3742.01 1.29 0.200 -2625.183 12301.22 ------------------------------------------------------------------------------