KTL cơ bảnPhân tích hồi quy

Phân tích hiệp phương sai – Stata

Phân tích hiệp phương sai (ANCOVA) được sử dụng để kiểm chứng sự khác nhau về giá trị trung bình giữa 2 hay nhiều nhóm độc lập, đồng thời cho phép “kiểm soát thống kê” đối với một biến thứ 3 (đôi khi còn gọi là biến nhiễu – confounding variable – hoặc hiệp biến – covariate) có ảnh hưởng đến kết quả. Do vậy, phân tích hiệp phương sai được xem là trường hợp mở rộng của phân tích phương sai một chiều khi bao gồm một hay nhiều biến liên tục để giải thích biến kết quả.

Để hiểu rõ hơn về ý nghĩa của phương pháp phân tích hiệp phương sai, chúng ta tìm hiểu thông qua ví dụ sau.

Giả sử bạn bạn muốn biết chương trình điều trị A hoặc chương trình điều trị B có thể giúp người hút thuốc giảm số thuốc họ hút mỗi ngày không. Bạn tiến hành chọn mẫu gồm 150 người hút thuốc. Những người được chọn và phân ngẫu nhiên vào 3 nhóm, mỗi nhóm 50 người: nhóm kiểm soát, nhóm điều trị A và nhóm điều trị B. Nhóm kiểm soát hút thuốc như thường lệ, trong khi nhóm điều trị A đã tham gia chương trình điều trị A và nhóm điều trị B tham gia chương trình điều trị B. Bạn tiến hành đo lượng thuốc lá được hút ở mỗi nhóm ở 2 thời điểm trước và sau khi thực hiện chương trình.

Giả sử, kết quả phân tích phương sai một chiều cho thấy việc tiêu thụ thuốc lá của người hút thuốc ở nhóm điều trị nhóm B giảm 3 điếu mỗi ngày so với nhóm đối chứng, nhưng chỉ giảm 2 điếu thuốc mỗi ngày trong nhóm điều trị A, và tất cả các sự sụt giảm này đều có ý nghĩa thống kê.

Với kết quả này, chúng ta có thể kết luận rằng cả hai biện pháp can thiệp đã đều có tác động tích cực đến việc giảm tiêu thụ thuốc lá. Tuy nhiên, cũng có thể có một lời giải thích khác cho kết quả này là sự khác biệt giữa 3 nhóm không phải là do biện pháp can thiệp. Chẳng hạn, sự khác nhau này có thể là do mức độ hút thuốc ban đầu của 150 người được chọn là khác nhau. Vì chúng ta chọn mẫu ngẫu nhiên, sự khác nhau này là rất khó tránh khỏi. Mức độ hút thuốc ban đầu, trong trường hợp này, là một hiệp biến của phép phân tích hiệp phương sai. Phân tích hiệp phương sai cho phép chúng ta kiểm soát các mức hiệp biến này để có một kết quả phân tích chính xác hơn về hiệu quả điều trị của 2 phương pháp.

Bài viết sử dụng dữ liệu thực hành là ancova.dta
use https://www.vietlod.com/data/ancova.dta, clear

Bộ dữ liệu bao gồm 3 biến:

  • Biến group: mã thành viên của đối tượng trong 3 nhóm A, B và nhóm kiểm soát
  • Biến before: số thuốc được hút của đối tượng trước khi tham gia chương trình
  • Biến after: số thuốc được hút của đối tượng khi chương trình kết thúc.

Kết quả thống kê sơ bộ về các biến được thể hiện như sau:
su

VariableObsMeanStd. Dev.MinMax
group302.13330.860413
before304.36671.956129
after302.73331.855707

Đồ thị thanh thể hiện số lượng thuốc được hút ở 3 nhóm trước và sau tác động như sau:
Đồ thị thanh trước và sau tác động

Đồ thị cho thấy, ở nhóm bị tác động A và B số người hút thuốc giảm khi chương trình kết thúc. Cụ thể hơn, số người hút thuốc giảm mạnh hơn ở nhóm B (group=3). Tuy nhiên, nhóm kiểm soát (group = 1) số người hút thuốc lại tăng lên sau khi chương trình kết thúc.

Còn tiếp…

1 2Trang sau
Xem thêm
Back to top button