Kiểm định Kruskal-Wallis
![Kiểm định Kruskal-Wallis 1 Thực hành kiểm định Kruskal - Wallis trên SPSS](https://www.vietlod.com/wp-content/uploads/kiem-dinh-Kruskal-Wallis-spss-1.png)
II. THỰC HÀNH KIỂM ĐỊNH Kruskal – Wallis TRÊN SPSS
Sử dụng bộ dữ liệu Kruskal-Wallis.sav. Bộ dữ liệu gồm 7287 quan sát là người lao động trên cả nước. Các thông tin khảo sát chính bao gồm: giới tính (gender), tuổi (age), dân tộc (ethnic), bằng cấp (degree), nơi sinh sống (region, urban), số năm đi học (school), số năm kinh nghiệm (exp), doanh nghiệp hoạt động (section), lĩnh vực làm việc (structure), thu nhập (earn)…
Giả sử, chúng ta muốn kiểm tra nhận định cho rằng thu nhập của người lao động không có sự khác nhau trong các lĩnh vực công nghiệp, nông nghiệp và dịch vụ. Nghĩa là chúng ta kiểm định giả thuyết:
- \({H_0}\): Không có sự khác nhau về thu nhập của người lao động trong các lĩnh vực.
- \({H_1}\): Có sự khác nhau về thu nhập của người lao động trong các lĩnh vực.
– Kiểm tra dạng phân phối chuẩn của biến thu nhập earn theo biến giới tính gender bằng đồ thị histogram. Thực hiện vẽ đồ thị histogram giữa 3 loại hình kinh tế:
– Vào Graphs \( \to \) Legacy dialogs \( \to \) Histogram… và đưa các biến vào như hình:
Kết quả kiểm tra được thể hiện như sau:
Về cơ bản, biểu đồ thu nhập ở các lĩnh vực có hình dạng tương đối giống nhau. Tuy nhiên, biểu đồ thu nhập của lao động ở lĩnh vực công nghiệp và dịch vụ cho thấy mức thu nhập tập trung nhiều trong khoảng 20 đến 40 triệu đồng/năm. Trong khi đó, ở lĩnh vực nông nghiệp, thu nhập của người lao động tập trung chủ yếu ở mức 20 triệu trở xuống. Ngoài ra, ở lĩnh vực dịch vụ, thu nhập của người lao động tập trung nhiều và trải dài ở các mức thu nhập cao so với lĩnh vực công nghiệp. Tóm lại, nhìn chung thu nhập của người lao động có xu hướng giảm dần từ dịch vụ – công nghiệp – nông nghiệp.
Để hực hiện kiểm định Kruskal-Wallis, chúng ta tiến hành trên SPSS như sau:
– Vào Analyze \( \to \) Nonparametric Tests \( \to \) Legacy Dialogs \( \to \) K Independent Samples…
– Cửa sổ Tests for Several Independent Samples. Đưa biến thu nhập earn vào ô Test Variable List: và biến giới tính structure vào ô Grouping Variable: và thiết lập Define Groups… như hình bên dưới:
Lưu ý rằng
- Kruskal-Wallis H trong khung Test Type đã được chọn.
- Ngoài ra, trong trường hợp biến phân loại của chúng ta có 6 mức, giả sử là 6 vùng theo thứ tự: 1-Đồng bằng Sông Hồng; 2-Trung du & Miền núi phía Bắc; 3-Bắc trung bộ & Duyên hải miền Trung; 4-Tây Nguyên; 5-Đông Nam bộ; 6-Đồng bằng Sông Cửu Long, và chúng ta chỉ 3 quan tâm đến 3 vùng nghèo nhất là TT&MN phía Bắc; BTB&DH miền Trung; Tây Nguyên thì khi đó chúng ta thiết lập giá trị Minimum: là 2 và Maximum: là 4
– Bấm Continue để trở về cửa sổ Tests for Several Independent Samples
– Bấm Options… chọn Descriptive và Quartiles trong phần Statistics như hình:
– Bấm Continue để trở về cửa sổ Tests for Several Independent Samples
– Bấm OK để tiến hành thực hiện.
3.Phân tích kết quả kiểm định Kruskal – Wallis
Kết quả thực hiện kiểm định Kruskal-Wallis về sự khác biệt thu nhập trung bình giữa 3 nhóm như sau:
- Tổng hạng trung bình của nhóm dịch vụ (structure==1) là 4302.55
- Tổng hạng trung bình của nhóm công nghiệp (structure==2) là 3528.89
- Tổng hạng trung bình của nhóm nông nghiệp (structure==3) là 2027.49
- Chỉ số Chi bình phương là 868.862
- Bậc tự do (df) là 2
- Mức ý nghĩa quan sát (Sig)=0.000
Như vậy có thể kết luận, có sự khác nhau về thu nhập của người lao động nam ở các lĩnh vực dịch vụ, công nghiệp và nông nghiệp (kết quả kiểm định này có ý nghĩa thống kê 1%)
Xem thêm: Kiểm định phi tham số