Home | KTL cơ bản | Kiểm định | Kiểm định t-test trung bình 2 mẫu – Stata

Kiểm định t-test trung bình 2 mẫu – Stata

Kiểm định t-test trung bình 2 mẫu được sử dụng để kiểm tra xem giá trị trung bình của một biến ở 2 mẫu độc lập có bằng nhau hay không? Giả sử, chúng ta muốn kiểm tra xem điểm số các môn học có khác nhau giữa 2 nhóm sinh viên nam và nữ hay không. Ở đây, 2 nhóm con (nhóm sinh viên nam và nhóm sinh viên nữ) là 2 nhóm độc lập.

Kiểm định t-test trung bình 2 mẫu là một loại kiểm định tham số. Các biến được phân tích trong kiểm định này yêu cầu phải có phân phối chuẩn (hoặc xấp xỉ). Đọc thêm: kiểm tra phân phối chuẩn trên SPSS, STATA

Trên Stata, kiểm định t-test trung bình 2 mẫu được thực hiện bằng lệnh ttest, tương tự như kiểm định t-test trung bình 1 mẫu.

Phần minh họa sử dụng dữ liệu thực hành là hsb2.dta

use https://vietlod.com/data/hsb2.dta, clear

Mẫu dữ liệu bao gồm 200 quan sát với 10 biến như sau:

  • female giới tính – biến nhị phân (1: nữ; 0: nam),
  • race dân tộc – biến phân loại 4 mức (1: hispanic; 2: asian; 3: african-amer; 4: white),
  • ses điều kiện kinh tế – biến phân loại 3 mức (1: low; 2: middle; 3: high),
  • schtyp loại trường – biến nhị phân (1: công; 2: tư)
  • prog chuyên ngành – biến phân loại (1: general; 2: academic; 3: vocation),
  • read điểm số môn đọc hiểu – biến liên tục,
  • write điểm số môn viết – biến liên tục,
  • math điểm số môn toán – biến liên tục,
  • science điểm số môn khoa học – biến liên tục,
  • socst điểm số môn xã hội – biến liên tục,

Thông tin chung về dữ liệu được mô tả bằng như bên dưới:

su female race ses schtyp prog read write science socst

Kiểm định t-test trung bình 2 mẫu

Giá trị của biến science theo biến giới tính được thể hiện ở bảng 2 chiều bên dưới như sau:

table female, c(n science mean science sd science median science)

Kiểm định t-test trung bình 2 mẫu

Chúng ta sử dụng lệnh histogram để hiển thị dạng phân phối của biến liên tục science trong 2 nhóm (nam/nữ) như sau:

histogram science, normal by(female)

T-test trung bình 2 mẫu

Đồ thị phân phối của science ở 2 nhóm có dạng gần phân phối chuẩn. Bây giờ, giả sử chúng ta muốn biết giá trị trung bình ở 2 nhóm này có bằng nhau ở mức ý nghĩa thống kê 5% hay không, sử dụng lệnh ttest như sau:

ttest science, by(female)

T-test trung bình 2 mẫu

Với giá trị của Pr(|T| > |t|) = 0.0714 cho thấy ở mức ý nghĩa 5%, chúng ta không thể bác bỏ giả thuyết H0 cho rằng giá trị trung bình của điểm khoa học ở 2 nhóm sinh viên nam và nữ là bằng nhau.

Các bạn có thể sử dụng kiểm định t-test trung bình 2 mẫu để kiểm tra giá trị trung bình của các biến liên tục như read, write, math, sosct theo các biến nhị phân như female, schtyp.

Đọc thêm: kiểm định t-test trung bình 2 mẫu trên SPSS