Kiểm định T-test trung bình 2 mẫu
I. Giới thiệu T-test trung bình 2 mẫu độc lập
Kiểm định t-test trung bình 1 mẫu được sử dụng để kiểm chứng trung bình của một tổng thể so với 1 giá trị dự báo. Tuy nhiên, kiểm định này không thể được sử dụng trong trường hợp chúng ta muốn so sánh giá trị trung bình của 2 mẫu độc lập. Khi đó, chúng ta phải sử dụng kiểm định T-test trung bình 2 mẫu độc lập. Kiểm định T-test trung bình của 2 mẫu độc lập được sử dụng khi bạn muốn so sánh giá trị trung bình của một biến phụ thuộc liên tục có phân phối chuẩn theo hai nhóm giá trị của một biến độc lập có bằng nhau hay không.
Xem thêm: Kiểm định tham số (Parametric tests)
Ví dụ, thu nhập trung bình của người lao động nam và người lao động nữ có bằng nhau hay không?
Để sử dụng kiểm định t-test trung bình 2 mẫu độc lập thì dữ liệu phải thỏa mãn 6 điều kiện sau:
- Biến phụ thuộc phải là biến liên tục (dạng khoảng hoặc tỉ lệ). Tham khảo bài viết các loại thang đo trong phân tích dữ liệu.
- Biến độc lập là biến phân loại 2 mức, chẳng hạn biến giới tính (nam/nữ), biến lao động (có việc làm/thất nghiệp), biến khu vực (thành thị/nông thôn)…
- Tính độc lập của mẫu: không có mối quan hệ giữa các quan sát trong cùng một nhóm hoặc giữa 2 nhóm,
- Không có các điểm dị biệt. Điểm dị biệt sẽ ảnh hưởng xấu đến kết quả và làm giảm tính hợp lý của kiểm định,
- Biến phụ thuộc phải có (hoặc xấp xỉ) phân phối chuẩn trong từng nhóm,
- Phương sai của biến phụ thuộc phải có tính đồng nhất (homogeneity of variances)
Phần hướng dẫn thực hành và đọc kết quả kiểm định t-test trung bình 2 mẫu trên SPSS được trình bày chi tiết ở trang 2.II. Minh họa thực hành kiểm định t-test trung bình 2 mẫu trên SPSS
Sử dụng bộ dữ liệu hsb2.sav
Đối tượng khảo sát của bộ dữ liệu này là 200 học sinh từ trung học trở xuống. Các biến chính trong bộ dữ liệu bao gồm điểm số các môn toán (math), đọc (read), viết (write), chương trình học (prog), giới tính (female)… Giả sử chúng ta muốn kiểm tra liệu điểm trung bình môn toán (math) giữa các học sinh nam và nữ có bằng nhau hay không? Để kiểm chứng điều này, chúng ta thực hiện T-test trung bình 2 mẫu như sau:
Kiểm chứng phân phối chuẩn của biến math bằng kiểm định Kolmogorov – Smirnov trong kiểm định phi tham số. Thực hiện tương tự như kiểm định T-test trung vị mẫu, tuy nhiên ở tab Settings, chọn ô Test observed distribution against hypothesized (Kolmogorov – Smirnov test)
Kết quả cửa sổ Model Viewer như sau:
Kết quả cho thấy, chưa đủ cơ sở để bác bỏ giả thuyết \({H_0}\) về tính chuẩn hóa của biến (hay có thể chấp nhận biến math có phân phối chuẩn).
– Vào Analyze \( \to \) Compare Means \( \to \) Independent-Samples T Test…
– Cửa sổ Independent-Samples T Test đưa biến math vào khung Test Variable(s): và biến female vào ô Grouping Variable:
– Bấm Define Groups… và thiết lập các thông số như hình:
– Bấm Continue để trở về cửa sổ Independent-Samples T Test
– Bấm OK để thực hiện kiểm định
III. Đọc kết quả kiểm định t-test trung bình 2 mẫu
Kết quả thực hiện hiện T-test trung bình 2 mẫu như sau:
Kết quả thống kê ở Group Statistics cho thấy điểm trung bình môn toán (math) ở nhóm nam cao hơn nữ (52.95 so với 52.39). Tuy nhiên, kết quả kiểm định t-test trung bình 2 mẫu cho thấy sự chênh lệch này không có ý nghĩa thống kê ở mức 5% (sig = 0.432 > 0.05).