Kiểm định khác biệt tỉ lệ – Stata
Kiểm định khác biệt tỉ lệ (one sample binomial test) như tên gọi được sử dụng để kiểm tra xem tỉ lệ các giá trị của biến phân loại 2 mức (biến nhị phân) có khác ý nghĩa thống kê với nhau hay không. Chẳng hạn, chúng ta muốn biết sự khác nhau trong tỉ lệ lao động nam, lao động nữ trong bộ dữ liệu có ý nghĩa thống kê hay không.
Trên Stata, kiểm định khác biệt tỉ lệ được thực hiện bằng lệnh bitest
Xem thêm: Kiểm định khác biệt tỉ lệ trên SPSS
Phần minh họa sử dụng dữ liệu thực hành là hsb2.dta
use https://www.vietlod.com/data/hsb2.dta, clear
Mẫu dữ liệu bao gồm 200 quan sát với 10 biến như sau:
- female giới tính – biến nhị phân (1: nữ; 0: nam),
- race dân tộc – biến phân loại 4 mức (1: hispanic; 2: asian; 3: african-amer; 4: white),
- ses điều kiện kinh tế – biến phân loại 3 mức (1: low; 2: middle; 3: high),
- schtyp loại trường – biến nhị phân (1: công; 2: tư)
- prog chuyên ngành – biến phân loại (1: general; 2: academic; 3: vocation),
- read điểm số môn đọc hiểu – biến liên tục,
- write điểm số môn viết – biến liên tục,
- math điểm số môn toán – biến liên tục,
- science điểm số môn khoa học – biến liên tục,
- socst điểm số môn xã hội – biến liên tục,
Thông tin chung về dữ liệu được mô tả bằng như bên dưới:
su female race ses schtyp prog read write science socst
Tỉ lệ sinh viên nam và sinh viên nữ trong mẫu khảo sát được thể hiện ở bảng bên dưới:
tab female
Tỉ lệ sinh viên nam và nữ là gần bằng nhau. Giả sử chúng ta muốn tỉ lệ số các sinh viên nam/nữ này có khác 0.5 hay không. Trên Stata thực hiện kiểm định khác biệt tỉ lệ bằng lệnh bitest như sau:
bitest female =0.5
Kết quả cho thấy số các đối tượng quan sát (Observed k) là 109 so với số đối tượng kì vọng bằng nhau là 100 (Expected k). Đồng thời kết quả Pr(k <= 91 or k >= 109) = 0.229247 cho thấy sự khác nhau về tỉ lệ trên là không có ý nghĩa thống kê. Nói cách khác, trong một chừng mực nào đó chúng ta có thể xem tỉ lệ nam và nữ trong mẫu dữ liệu khảo sát là bằng nhau.
Các bạn có thể sử dụng kiểm định t-test trung bình 1 mẫu để kiểm tra khác biệt tỉ lệ của biến schtyp như cách trình bày bên trên. Tuy nhiên, với những trường hợp có sự chênh lệch rõ ràng (khá lớn) giữa 2 nhóm thì không cần thiết phải kiểm tra sự khác biệt tỉ lệ này.