Home | KTL cơ bản | Lựa chọn trọng số: pweight hay fweight

Lựa chọn trọng số: pweight hay fweight

Vấn đề về lựa chọn trọng số

Một trong những sai lầm phổ biến nhất xảy ra khi phân tích dữ liệu từ cuộc điều tra mẫu là lựa chọn trọng số của mẫu không phù hợp. Có 4 loại trọng số mẫu thường được sử dụng trong phân tích dữ liệu điều tra là:

  1. Trọng số xác suất: pweight (pw)
  2. Trọng số tần suất: fweight (fw)
  3. Trọng số phân tích: aweight (aw)
  4. Trọng số ảnh hưởng: iweight (iw)

Trong 4 loại trọng số trên, trọng số xác suất (chọn mẫu) và trọng số tần suất là 2 trọng số được sử dụng phổ biến nhất. Bài viết này sẽ lần lượt trình bày 4 loại trọng số trên.

Trọng số xác suất

Stata có một trọng số đặc biệt, pweight, để xác định các trọng số xác suất (Probability weights). Trọng số xác suất đôi khi còn gọi là trọng số lấy mẫu (sampling weights). Trọng số lấy mẫu cho biết một quan sát trong mẫu sẽ đại diện cho bao nhiêu quan sát trong tổng thể mà nó đại diện. Trọng số lấy mẫu được sử dụng phổ biến trong tính toán các ước lượng như tỷ lệ, trung bình và phân tích hồi quy.

Phương pháp hồi quy với phương sai chuẩn mạnh (robust variance) sẽ tự động sử dụng các trọng số xác suất để điều chỉnh các đặc điểm dữ liệu nhằm làm cho các kết quả ước lượng của phương sai, sai số chuẩn và khoảng tin cậy được chính xác.

Sử dụng bộ số liệu pweight.dta để minh họa kết quả hồi quy trong các trường hợp không có và có sử dụng trọng số xác suất (trường hợp không có tùy chọn robust và có tùy chọn robust). Bộ số liệu gồm 4029 quan sát từ cuộc khảo sát năm 1999 của phụ nữ Tanzania. Ở đây chúng ta ước đoán xác suất có 0 - 2 con (twokids) theo các biến giải thích là tuổi (age) và mức học vấn của người phụ nữ (educat).

Phần nội dung có thu phí bên dưới đã được ẩn. Vui lòng đăng nhập hoặc đăng ký gói Premium. Trân trọng!