KTL cơ bảnXử lý dữ liệu
Giá trị trống – missing values
Phân biệt giá trị trống ngẫu nhiên và không ngẫu nhiên như thế nào?
- Thứ nhất, nếu chỉ có một ít các giá trị trống thì khả năng rất cao các giá trị này là các giá trị trống ngẫu nhiên. Chẳng hạn, giá trị trống của biến color ở ví dụ trên là 1 trên 80 quan sát, với tỉ lệ 1/80 này có thể được xem là ngẫu nhiên.
- Thứ hai, thậm chí nếu có số giá trị trống này lớn hơn thì nó cũng không nhất thiết có ý nghĩa là không ngẫu nhiên. Bạn nên đánh lại bảng câu hỏi xem liệu thiết kế của nó có tối nghĩa hoặc câu hỏi có liên quan đến những vấn đề nhạy cảm không.
- Thứ ba, do cách thiết kế câu hỏi dẫn đến một vài câu hỏi luôn có nhiều giá trị trống so với các câu hỏi khác. Đó là những câu hỏi dạng “chọn những câu trả lời mà bạn thấy phù hợp“, khi đó, sẽ có những tùy chọn được chọn ít hơn so với những tùy chọn còn lại.
- Thứ tư, sử dụng add-on “Missing Values Analysis” của SPSS để đánh giá quan sát nào là giá trị trống ngẫu nhiên và không ngẫu nhiên. Thực hiện đánh giá này như sau:
- Chọn Analyze –> Missing Value Analysis
- Chọn EM
EM sẽ kiểm tra các quan sát có giá trị trống có khác so với các quan sát không có giá trị trống không. Nếu p nhỏ hơn 0.05 thì có sự khác nhau giữa hai nhóm và do đó, các giá trị trống này là không ngẫu nhiên và ngược lại nếu p lớn hơn 0.05 thì cho thấy các giá trị trống là ngẫu nhiên.