Home | KTL cơ bản | Kiểm định | T-test trung vị mẫu – Stata

T-test trung vị mẫu – Stata

Kiểm định t-test trung vị mẫu (One sample median test) được sử dụng thay thế kiểm định t-test trung bình 1 mẫu trong trường hợp biến liên tục không có phân phối chuẩn. Do vậy, kiểm định t-test trung vị mẫu là một dạng của kiểm định phi tham số.

Trong nhiều trường hợp nhất là dữ liệu bị ảnh hưởng bởi những điểm dị biệt (outliers) hoặc các điểm có leverage cao thì sử dụng trung vị sẽ cho kết quả đánh giá khách quan hơn so với giá trị trung bình.

Xem thêm: khuyết tật của dữ liệu
Kiểm định T-test trung vị mẫu trên SPSS

Trên Stata, kiểm định t-test trung vị mẫu được thực hiện bằng lệnh signrank

Phần minh họa sử dụng dữ liệu thực hành là hsb2.dta

use https://vietlod.com/data/hsb2.dta, clear

Mẫu dữ liệu bao gồm 200 quan sát với 10 biến như sau:

  • female giới tính – biến nhị phân (1: nữ; 0: nam),
  • race dân tộc – biến phân loại 4 mức (1: hispanic; 2: asian; 3: african-amer; 4: white),
  • ses điều kiện kinh tế – biến phân loại 3 mức (1: low; 2: middle; 3: high),
  • schtyp loại trường – biến nhị phân (1: công; 2: tư)
  • prog chuyên ngành – biến phân loại (1: general; 2: academic; 3: vocation),
  • read điểm số môn đọc hiểu – biến liên tục,
  • write điểm số môn viết – biến liên tục,
  • math điểm số môn toán – biến liên tục,
  • science điểm số môn khoa học – biến liên tục,
  • socst điểm số môn xã hội – biến liên tục,

Thông tin chung về dữ liệu được mô tả bằng như bên dưới:

su female race ses schtyp prog read write science socst
T-test trung vị mẫu

Chúng ta sử dụng lệnh histogram để hiển thị dạng phân phối của biến liên tục science như sau:

histogram science, normal
T-test trung bình 1 mẫu

Đồ thị phân phối của science có dạng gần phân phối chuẩn với giá trị trung bình là 51.85. Xem thêm bài kiểm tra phân phối chuẩn trên STATASPSS.

Trong trường hợp, biến science không có phân phối chuẩn thì chúng ta có thể sử dụng kiểm định t-test trung vị mẫu để thay thế. Giả sử chúng ta muốn biết giá trị trung vị của biến này có khác ý nghĩa thống kê với 50 hay không, sử dụng lệnh signrank như sau:

signrank science = 50
T-test trung vị mẫu

Giá trị Prob > |z| = 0.0080 cho thấy chúng ta có đủ bằng chứng để bác bỏ giả thuyết Ho: science = 50; điều đó có nghĩa chấp nhận trung vị của mẫu ở biến science là khác 50.

Các bạn có thể sử dụng kiểm định t-test trung bình 1 mẫu để kiểm tra giá trị trung vị của các biến liên tục như read, write, math, sosct