T-test trung bình 1 mẫu – Stata
Kiểm định t-test trung bình 1 mẫu (one sample t-test) là một kiểm định tham số, được sử dụng để kiểm tra liệu trung bình của 1 mẫu có phân phối chuẩn có bằng với một giá trị giả định ban đầu hay không.
Trên Stata, kiểm định t-test trung bình 1 mẫu được thực hiện bằng lệnh ttest
Xem thêm cách kiểm định t-test trung bình 1 mẫu trên SPSS.
Phần minh họa sử dụng dữ liệu thực hành là hsb2.dta
use https://www.vietlod.com/data/hsb2.dta, clear
Mẫu dữ liệu bao gồm 200 quan sát với 10 biến như sau:
- female giới tính – biến nhị phân (1: nữ; 0: nam),
- race dân tộc – biến phân loại 4 mức (1: hispanic; 2: asian; 3: african-amer; 4: white),
- ses điều kiện kinh tế – biến phân loại 3 mức (1: low; 2: middle; 3: high),
- schtyp loại trường – biến nhị phân (1: công; 2: tư)
- prog chuyên ngành – biến phân loại (1: general; 2: academic; 3: vocation),
- read điểm số môn đọc hiểu – biến liên tục,
- write điểm số môn viết – biến liên tục,
- math điểm số môn toán – biến liên tục,
- science điểm số môn khoa học – biến liên tục,
- socst điểm số môn xã hội – biến liên tục,
Thông tin chung về dữ liệu được mô tả bằng như bên dưới:
su female race ses schtyp prog read write science socst
Chúng ta sử dụng lệnh histogram để hiển thị dạng phân phối của biến liên tục x1 như sau:
histogram science, normal
Đồ thị phân phối của science có dạng gần phân phối chuẩn với giá trị trung bình là 51.85. Xem thêm bài kiểm tra phân phối chuẩn trên STATA và SPSS.
Bây giờ, giả sử chúng ta muốn biết giá trị trung bình này có khác ý nghĩa thống kê với 50 hay không, sử dụng lệnh ttest như sau:
ttest science, == 50, level(95)
Ghi chú: Tùy chọn level(95) để hiển thị khoảng tin cậy 95% của giá trị trung bình science
Kết quả cho thấy với giá trị Pr(|T| > |t|) = 0.0089 với giả thuyết thay thế (Ha: mean != 50) thì chúng ta có thể bác bỏ giả thuyết H0 (mean = 50). Đồng thời, kết quả giả thuyết thay thế ở 2 đuôi thì cho thấy giá trị trung bình của biến science lớn hơn 50 (Pr(T > t) = 0.0044).
Các bạn có thể sử dụng kiểm định t-test trung bình 1 mẫu để kiểm tra giá trị trung bình của các biến liên tục như read, write, math, sosct