Please Enable JavaScript in your Browser to visit this site

KTL cơ bảnPhân tích hồi quy

Hệ số tương quan Pearson

3.

Một số vấn đề trong xác định hệ số tương quan Pearson

Loại biến nào phù hợp sử dụng trong xác định hệ số tương quan Pearson?
Biến dạng khoảng hoặc tỉ lệ là 2 loại biến được sử dụng trong hệ số tương quan Pearson. Tuy nhiên, cả 2 biến này không cần thiết phải có cùng thang đo (chẳng hạn, có thể một biến có thang đo khoảng, 1 biến có thang đo tỉ lệ). Nếu bạn có dữ liệu dạng thang đo thứ tự, có lẽ bạn nên sử dụng kiểm định Spearman hoặc tương quan Kendall’s Tau thay thế tương quan Pearson.

Có phải 2 biến cần phải có cùng một đơn vị đo?
KHÔNG, hai biến có thể được đo lường hoàn toàn bởi các đơn vị khác nhau. Chẳng hạn, bạn có thể thực hiện kiểm tra sự tương quan giữa tuổi và mức đường huyết của một người. Ở đây, các đơn vị hoàn hoàn khác nhau; tuổi được tính bằng năm; và mức đường huyết được đo bằng milimol/l. Kết quả của hệ số tương quan Pearson không bị ảnh hưởng bởi đơn vị, do vậy có thể được so sánh giữa các cặp biến sử dụng.

Biến phụ thuộc – biến độc lập và mối quan hệ nhân – quả trong hệ số tương quan Pearson?
Tương quan Pearson KHÔNG thể xác định mối quan hệ nhân quả của cặp biến, cũng như xác định vai trò biến độc lập hay biến phụ thuộc. Đơn giản, nó chỉ cho biết mức độ tương quan của cặp biến. Giả sử, kết quả khảo sát về tình hình tội phạm trên một địa bàn X, kết quả cho thấy có một mối tương quan dương mạnh (r = 0.7) giữa số lượng tội phạm và số lượng cảnh sát. Nếu chỉ dựa vào hệ số tương quan Pearson thì có thể kết luận số tội phạm, hay số cảnh sát biến nào gây ra biến nào hay biến nào là biến phụ thuộc/độc lập…
Hệ số tương quan Pearson

Có phải hệ số tương quan cho biết giá trị độ dốc của đường thẳng?
Câu trả lời là KHÔNG.
Cần lưu ý rằng hệ số tương quan Pearson (r) không phải là giá trị độ dốc của đường thẳng. Vì vậy, nếu bạn có hệ số tương quan Pearson bằng +1, điều này không có nghĩa là mỗi đơn vị gia tăng trong một biến sẽ làm gia tăng một đơn vị ở biến còn lại. Đơn giản nó cho thấy không có sự sai lệch giữa các điểm dữ liệu và đường thẳng.

Hệ số tương quan Pearson

4.

Các giả thuyết về kiểm định tương quan Pearson?

Kiểm định tương quan Pearson được thực hiện dựa trên 5 giả thuyết như sau:

  1. Các biến đo lường phải có dạng khoảng hoặc tỉ lệ.
  2. Các biến phải có phân phối chuẩn hoặc xấp xỉ phân phối chuẩn.
  3. Có mối quan hệ tuyến tính giữa hai biến.
  4. Tối thiểu hóa hoặc loại bỏ hoàn toàn các điểm dị biệt. Trường hợp bạn không muốn loại bỏ hoặc tối thiểu các điểm dị biệt này thì có thể sử dụng tương quan hạng Spearman hoặc Kendall’s Tau để kiểm tra sự tương quan này (2 kiểm định này ít nhạy cảm với các điểm dị biệt).
  5. Dữ liệu thỏa mãn phương sai đồng nhất (homoscedasticity)
    Phương sai đồng nhất - homoscedasticity
Previous page 1 2 3Next page
Back to top button