Kiểm định t-test trung bình 2 mẫu – Stata
Kiểm định t-test trung bình 2 mẫu được sử dụng để kiểm tra xem giá trị trung bình của một biến ở 2 mẫu độc lập có bằng nhau hay không? Giả sử, chúng ta muốn kiểm tra xem điểm số các môn học có khác nhau giữa 2 nhóm sinh viên nam và nữ hay không. Ở đây, 2 nhóm con (nhóm sinh viên nam và nhóm sinh viên nữ) là 2 nhóm độc lập.
Kiểm định t-test trung bình 2 mẫu là một loại kiểm định tham số. Các biến được phân tích trong kiểm định này yêu cầu phải có phân phối chuẩn (hoặc xấp xỉ). Đọc thêm: kiểm tra phân phối chuẩn trên SPSS, STATA
Trên Stata, kiểm định t-test trung bình 2 mẫu được thực hiện bằng lệnh ttest, tương tự như kiểm định t-test trung bình 1 mẫu.
Phần minh họa sử dụng dữ liệu thực hành là hsb2.dta
use https://www.vietlod.com/data/hsb2.dta, clear
Mẫu dữ liệu bao gồm 200 quan sát với 10 biến như sau:
- female giới tính – biến nhị phân (1: nữ; 0: nam),
- race dân tộc – biến phân loại 4 mức (1: hispanic; 2: asian; 3: african-amer; 4: white),
- ses điều kiện kinh tế – biến phân loại 3 mức (1: low; 2: middle; 3: high),
- schtyp loại trường – biến nhị phân (1: công; 2: tư)
- prog chuyên ngành – biến phân loại (1: general; 2: academic; 3: vocation),
- read điểm số môn đọc hiểu – biến liên tục,
- write điểm số môn viết – biến liên tục,
- math điểm số môn toán – biến liên tục,
- science điểm số môn khoa học – biến liên tục,
- socst điểm số môn xã hội – biến liên tục,
Thông tin chung về dữ liệu được mô tả bằng như bên dưới:
su female race ses schtyp prog read write science socst
Giá trị của biến science theo biến giới tính được thể hiện ở bảng 2 chiều bên dưới như sau:
table female, c(n science mean science sd science median science)
Chúng ta sử dụng lệnh histogram để hiển thị dạng phân phối của biến liên tục science trong 2 nhóm (nam/nữ) như sau:
histogram science, normal by(female)
Đồ thị phân phối của science ở 2 nhóm có dạng gần phân phối chuẩn. Bây giờ, giả sử chúng ta muốn biết giá trị trung bình ở 2 nhóm này có bằng nhau ở mức ý nghĩa thống kê 5% hay không, sử dụng lệnh ttest như sau:
ttest science, by(female)
Với giá trị của Pr(|T| > |t|) = 0.0714 cho thấy ở mức ý nghĩa 5%, chúng ta không thể bác bỏ giả thuyết H0 cho rằng giá trị trung bình của điểm khoa học ở 2 nhóm sinh viên nam và nữ là bằng nhau.
Các bạn có thể sử dụng kiểm định t-test trung bình 2 mẫu để kiểm tra giá trị trung bình của các biến liên tục như read, write, math, sosct theo các biến nhị phân như female, schtyp.
Đọc thêm: kiểm định t-test trung bình 2 mẫu trên SPSS