KTL cơ bảnPhân tích hồi quy

Lựa chọn trọng số: pweight hay fweight

3.

Trọng số phân tích

Trọng số phân tích (Analytic Weights) trong STATA được thể hiện bằng lệnh aweight, được sử dụng khi chúng ta muốn hồi quy tuyến tính các biến giải thích ở các giá trị trung bình của mỗi nhóm. Đơn giản hơn, chúng ta xét dữ liệu sau:

groupxy
1322
1430
2825
2219
2516

Thu gọn giá trị các biến về mức giá trị trung bình ở mỗi nhóm như sau:

groupxyn
13.526.02
25.020.03

Sau đó, chúng ta thực hiện hồi quy dữ liệu trên như sau:

regress y x [aweight=n]

Đây là loại trọng số ít được sử dụng nhất và không nên sử dụng trọng số phân tích để xác định trọng số mẫu. Điều này bởi vì những phương pháp sử dụng trọng số đều giả định rằng những quan sát trọng số lớn sẽ có độ chính xác hoặc quan trọng cao hơn. Và ngược lại, những quan sát có trọng số nhỏ thì quan sát đó kém tin cậy hoặc không quan trọng. Chính vì vậy, khi chúng ta sử dụng trọng số trung bình nó sẽ san bằng ý nghĩa ở các quan sát, làm cho các kết quả ước lượng hệ số, phương sai, sai số chuẩn và mức ý nghĩa kiểm định sẽ không còn đúng.

4.

Trọng số ảnh hưởng

Trọng số ảnh hưởng (Importance Weights), kí hiệu là iweight trong STATA, được sử dụng khi chúng ta biết được mức độ quan trọng của các quan sát, bằng cách gán những trọng số cao cho những quan sát này. Kết quả phân tích với trọng số này mang tính chất cảm tính và sẽ bị ảnh hưởng mạnh theo kinh nghiệm và kiến thức của người nghiên cứu. Nói chung, phương pháp trọng số này được sử dụng hạn chế nhằm đảm bảo sự tin cậy và khách quan trong tổng thể.

GHI CHÚ VỀ LỰA CHỌN TRỌNG SỐ

Bài viết chỉ minh họa cách phân biệt 4 loại trọng số trên STATA. Tên gọi và cách sử dụng các loại trọng số này trên các phần mềm khác sẽ có sự điều chỉnh đôi chút.

Tham khảo thêm: Lệnh weight

 

Trang trước 1 2
Xem thêm
Back to top button