Thang đo trong phân tích dữ liệu
1. Giới thiệu các loại thang đo
Để đo lường đúng các biến rất cần thiết phải xác định đúng thang đo. Các kiểu biến khác nhau đòi hỏi phải được đo lường theo những cách khác nhau. Có 4 loại thang đo thường được sử dụng trong phân tích dữ liệu là thang đo danh nghĩa (nominal), thang đo thứ bậc (ordinal), thang đo khoảng (Interval) và thang đo tỉ lệ (Ratio). Sử dụng linh hoạt các thang đo trong việc đo lường biến sẽ giúp người nghiên cứu tiếp cận và phân tích đối tượng tốt hơn. Các loại thang đo trên lần lượt được trình bày ở bên dưới.
2. Sử dụng các loại thang đo
1.Thang đo danh nghĩa (còn gọi là định danh hoặc phân loại) – nominal scale: có ý nghĩa phân biệt các đối tượng, chứ không mang ý nghĩa đo lường nào khác.
Có hai loại thang đo danh nghĩa thường được sử dụng:
(i) thang đo nhị phân (binary) với hai giá trị, chẳng hạn 1 – nam; 2 – nữ hoặc 1 – nghèo; 0 – không nghèo;
(ii) thang đo danh mục (categorical) với nhiều thuộc tính giá trị chẳng hạn như các vùng trên cả nước (1 – ĐB Sông Hồng; 2 – Tây Bắc & Bắc Trung bộ; 3 – Nam Trung bộ & Duyên Hải miền Trung; 4 – Tây Nguyên; 5 – Đông Nam bộ; 6 – ĐB Sông Cửu Long).
Thang đo thứ bậc (thang chia hạng) – ordinal scale: có mối quan hệ hơn kém giữa các đối tượng, tuy nhiên sự sai khác giữa các đối tượng phải đều nhau. Điều này cho thấy bất kì thang đo thứ bậc nào cũng là thang đo danh nghĩa nhưng không phải thang đo danh nghĩa nào cũng là thang đo thứ bậc. Thang đo Likert được xem là một ví dụ về thang đo này.
Ví dụ: để đo lường mức độ hài lòng của người đọc tại trang vietlod.com, tác giả lập bảng khảo sát để đo lường biến mức độ hài lòng.
Giả sử 1 trong số các câu hỏi đại diện đó là “Hãy cho biết cảm nhận của bạn về nội dung các bài viết tại trang vietlod.com“?
(1) Rất tệ
(2) Tệ
(3) Bình thường (tạm được)
(4) Hữu ích
(5) Rất hữu ích.
Thang đo khoảng – interval scale: là một dạng đặc biệt của thang đo thứ bậc vì nó cho biết được khoảng cách giữa các thứ bậc. Các giá trị của thang đo khoảng có thể cộng hoặc trừ lẫn nhau (nhưng không thể nhân/chia) và không chứa giá trị 0 tuyệt đối (năm 0 trước công nguyên, 0oF…). Ví dụ khoảng thời gian giữa năm 1981 và 1982 là bằng nhau với khoảng thời gian giữa năm 1983 và 1984 (đều có 365 ngày) .
4.Thang đo tỉ lệ – ratio scale: thang đo tỉ lệ có tất cả các đặc tính khoảng cách và thứ tự của thang đo khoảng, ngoài ra điểm 0 trong thang đo tỉ lệ là một số “thật” nên ta có thể thực hiện được phép toán chia để tính tỉ lệ nhằm mục đích so sánh. Ví dụ: 1 người 50 tuổi thì có tuổi lớn gấp đôi người 25 tuổi.
Các đặc tính của thang đo được tổng hợp ở bảng sau:
Tính chất | Định danh | Thứ tự | Khoảng | Tỷ lệ |
Sự phân biệt | Có | Có | Có | Có |
Thứ tự độ lớn | Không | Có | Có | Có |
Điểm trung vị, phân vị | Không | Có | Có | Có |
Trung bình, độ lệch chuẩn, sai số chuẩn | Không | Không | Có | Có |
Thực hiện cộng/trừ | Không | Không | Có | Có |
Khoảng bằng nhau | Không | Không | Có | Có |
Tỷ lệ, hệ số của phương sai | Không | Không | Không | Có |
Điểm 0 tuyệt đối; có thể nhân/chia | Không | Không | Không | Có |
Cả thang đo khoảng và thang đo tỷ lệ thông thường được gộp chung vào một nhóm gọi là thang đo liên tục. Chúng ta có thể đếm, sắp xếp thứ tự, tính toán các dữ liệu liên tục này. Các trường hợp thường sử dụng dữ liệu liên tục này như đo lường chiều cao, cân nặng, nhiệt độ, hàm lượng, thời gian…
Ngoài ra, tùy thuộc vào kiểu dữ liệu mà ta lựa chọn thang đo phù hợp. Mối quan hệ giữa thang đo và kiểu dữ liệu được thể hiện ở bảng bên dưới:
Tham khảo từ bis.net.vn