Kiểm định dấu hạng Wilcoxon – Stata
Kiểm định dấu hạng Wilcoxon (Wilcoxon signed rank sum test ) được sử dụng thay thế kiểm định t-test cặp đôi khi giả định về phân phối chuẩn của biến bị vi phạm. Về mặt ý nghĩa kiểm định dấu hạng Wilcoxon được sử dụng kiểm tra sự khác nhau về giá trị trung bình của 2 nhóm (có cùng các đối tượng quan sát) như tác động “trước/sau”, “tăng/giảm”…
Xem thêm: kiểm định phi tham số
Chúng ta có thể minh họa ý nghĩa và cách thực hiện kiểm định t-test cặp đôi thông qua ví dụ sau: một giám đốc Marketing muốn đánh giá doanh thu bán hàng (triệu đồng/năm) của mảng điện thoại ở 24 cửa hàng khu vực TpHCM (kí hiệu 1-24). Số liệu doanh thu điện thoại 24 cửa hàng được thu thập trong 3 năm 2011, 2012 và 2013 được cho ở file dữ liệu thực hành là paired-t-test.dta
Trong ví dụ này, biến đo lường là doanh thu bán hàng; các nhóm quan sát là năm 2011, năm 2012 và năm 2013.
Thông tin chung về dữ liệu được mô tả bằng như bên dưới:
su DT2011 DT2012 DT2013
Giá trị trung bình về doanh thu của 24 cửa hàng trong 3 năm 2011, 2012, 2013 lần lượt như sau: 893.96; 832.12; 537.63
Câu hỏi vị giám đốc này đặt ra là doanh thu điện thoại ở 24 cửa hàng trong hai năm 2011 và năm 2012 có bằng nhau hay không?.
Trước khi sử dụng kiểm định t-test cặp đôi hay kiểm định dấu hạng Wilcoxon, chúng ta cần kiểm tra dạng phân phối của của các biến liên tục.
Xem thêm: Kiểm tra phân phối chuẩn của biến.
Trong ví dụ này các biến DT2011, DT2012, và DT2013 là những biến không có phân phối chuẩn.
Khi đó, kiểm định dấu hạng Wilcoxon được thực hiện trên Stata bằng câu lệnh signrank như sau:
signrank DT2011 = DT2012
Kết quả cho thấy, với giá trị Prob > |z| = 0.0765 của kiểm định dấu hạng Wilcoxon so với giá trị Pr(|T| > |t|) = 0.4963 của kiểm định t-test cặp đôi nhỏ hơn rất nhiều. Tuy nhiên, trong trường hợp này ở mức ý nghĩa 5% chúng ta cũng bác bỏ giả thuyết H0 rằng không có sự chênh lệch về doanh thu trung bình giữa 2 năm 2011, 2012. Như vậy, trong cả 2 trường hợp doanh thu giữa 2 năm 2011 và 2012 xem như không có sự chênh lệch.
Tuy nhiên, doanh thu giữa năm 2012 và năm 2013 là có sự chênh lệch. Kết quả kiểm tra sự chênh lệch về doanh thu của các cửa hàng ở 2 năm 2012 và 2013 cho thấy doanh thu năm 2013 là giảm đáng kể so với năm 2012 (ý nghĩa thống kê 5%). Điều này cũng tương tự ở kết quả kiểm định t-test cặp đôi cho doanh thu 2 năm 2012, 2013 ở bài trước.
signrank DT2012= DT2013
NHẮC LẠI KIỂM ĐỊNH DẤU HẠNG WILCOXON
Khi dữ liệu của biến phân tích không có phân phối chuẩn thì để kiểm tra sự khác nhau về giá trị trung bình của 2 nhóm thì kiểm định được ưu tiên sử dụng là kiểm định dấu hạng Wilcoxon.
Ngoài ra, bạn có thể sử dụng kiểm định dấu (Sign test) khi bạn muốn kiểm định giả thuyết cho rằng số trường hợp chênh lệch tăng và giảm là bằng nhau (chẳng hạn, số cửa hàng có doanh thu tăng tăng và giảm ở 2 năm 2011 và 2012 có bằng nhau hay không) mà không cần quan tâm đến độ lớn của sự thay đổi. Trên Stata, kiểm định dấu được thực hiện bằng câu lệnh signtest. Tuy nhiên, kiểm định dấu thường rất yếu và khó phát hiện sự khác biệt giữa 2 nhóm.
Xem thêm: kiểm định dấu hạng Wilcoxon trên SPSS