Home | KTL nâng cao | Hướng dẫn thiết lập các lệnh hồi quy mở rộng ERM
Các mô hình hồi quy mở rộng ERM cho phép thực hiện các hồi quy tuyến tính, hồi quy probit... khi dữ liệu có các vấn đề về nội sinh, chọn mẫu..
Các mô hình hồi quy mở rộng ERM cho phép thực hiện các hồi quy tuyến tính, hồi quy probit... khi dữ liệu có các vấn đề về nội sinh, chọn mẫu..

Hướng dẫn thiết lập các lệnh hồi quy mở rộng ERM

Các mô hình hồi quy mở rộng, ERM là các mô hình cấu trúc tổng quát cho phép mở rộng các hồi quy khoảng (câu lệnh eintreg), hồi quy probit thứ tự  (câu lệnh eoprobit), hồi quy probit (câu lệnh eprobit) và hồi quy tuyến tính (câu lệnh eregress) bằng cách giải quyết các vấn đề lựa chọn mẫu nội sinh [tùy chọn select()], biến nội sinh [tùy chọn endogenous()] và tham gia đánh giá phi ngẫu nhiên [tùy chọn entreat()] tồn tại trong dữ liệu.

Trước khi đi vào phần giới thiệu cách sử dụng các câu lệnh trong hồi quy mở rộng, tôi sẽ đi sâu làm rõ các thuật ngữ liên quan đến mô hình hồi quy mở rộng này thông qua các ví dụ thực tế, cũng như ví dụ về chương trình cải thiện sức khỏe ở phần trước. Đầu tiên là khái niệm mẫu lựa chọn nội sinh.

Xem thêm: Giới thiệu mô hình hồi quy mở rộng ERM, Stata 15

Mẫu lựa chọn nội sinh đề cập đến các trường hợp mà trong đó tập dữ liệu con được sử dụng để ước lượng mô hình đã được lựa chọn theo cách có tương quan với kết quả của mô hình "Endogenous sample selection refers to situations in which the subset of the data used to fit a model has been selected in a way correlated with the model’s outcome." Trích trong thuật ngữ ERM trên Stata.

Nguyên nhân gây ra vấn đề chọn mẫu nội sinh có thể do bỏ sót thông tin thu thập với các giá trị missing không phải ngẫu nhiên (MNAR) hoặc bị ảnh hưởng bởi các đặc điểm không quan sát được. Khi các yếu tố không quan sát được ảnh hưởng đến các đối tượng trong mẫu là độc lập với các yếu tố không quan sát được ảnh hưởng đến kết quả thì việc chọn mẫu không phải là nội sinh. Và trong trường hợp này sự thiên chệch do chọn mẫu có thể được bỏ qua mà không ảnh hưởng đến độ tin cậy của phương pháp. Ngược lại, nếu các yếu tố không quan sát được ảnh hưởng đến các đối tượng trong mẫu mà có quan hệ với các yếu tố không quan sát được có ảnh hưởng đến kết quả thì việc chọn mẫu là nội sinh và khi đó, vấn đề này không được bỏ qua. Bởi vì các ước lượng bỏ qua vấn đề chọn mẫu nội sinh này sẽ cho ra các kết quả không tin cậy. Ví dụ, tôi nghi ngờ rằng các yếu tố ảnh hưởng đến việc nhân viên đến phòng tập cuối năm (completed) để ghi nhận số cân nặng, cũng ảnh hưởng đến kết quả giảm cân (weightloss).

Nguyên nhân dẫn đến biến nội sinh có thể do mô hình đã bỏ sót biến quan trọng mà biến này có tương quan với biến giải thích trong mô hình. Hoặc cũng có thể các biến trong mô hình không được đo lường đúng (lỗi đo lường biến). Hoặc cũng có trường hợp, một biến trong mô hình và biến kết quả có tương quan từng phần với các yếu tố không quan sát được (quan hệ nhân quả). Trong ví dụ này, dễ dàng nhận thấy việc bỏ sót biến ý thức sức khỏe có thể dẫn đến vấn đề biến nội sinh ở weight wellpgm. Biến weight là biến nội sinh có thể được hiểu rằng nhân viên có ý thức sức khỏe tốt sẽ quan tâm đến cân nặng của mình nhiều hơn, cũng như sẽ có mức giảm cân (weightloss) nhiều hơn khi tham gia chương trình so với các nhân viên có ý thức sức khỏe kém. Điều này cũng tương tự cho biến wellpgm.

Phần nội dung có thu phí bên dưới đã được ẩn.

Xin mời bạn đăng nhập để tiếp tục nội dung...

* Nếu chưa có tài khoản Premium, mời bạn đăng ký tại đây.

Chân thành cảm ơn sự quan tâm của bạn!