KTL cơ bảnPhân tích hồi quy

Hệ số tương quan Pearson

GIỚI THIỆU VỀ SỰ TƯƠNG QUAN – CORRELATION

Tương quan (correlation) cho biết mối liên hệ tương đối giữa 2 biến. Hệ số tương quan (correlation coefficient) sẽ cho biết độ mạnh hay mức độ liên hệ giữa 2 biến. Hệ số tương quan có thể được xác định qua 2 phương pháp:

  1. Hệ số tương quan Pearson
  2. Tương quan hạng Spearman

Tương quan là điều kiện giả định trong rất nhiều mô hình hoặc các kiểm định, phân tích chẳng hạn như phân tích hồi quy, kiểm định dấu hạng Wilcoxon… Nội dung bài viết này trình bày về Hệ số tương quan Pearson.

Xem thêm: Kiểm định tham số

1.

Giới thiệu hệ số tương quan Pearson

Hệ số tương quan Pearson (Pearson correlation coefficient, kí hiệu r) đo lường mức độ tương quan tuyến tính giữa hai biến. Nguyên tắc cơ bản, tương quan Pearson sẽ tìm ra một đường thẳng phù hợp nhất với mối quan hệ tuyến tính của 2 biến. Chính vì vậy, phân tích tương quan Pearson đôi khi còn được gọi là phân tích hồi quy giản đơn (nhưng khác nhau về mặt ý nghĩa).

Hệ số tương quan Pearson (r) sẽ nhận giá trị từ +1 đến -1. r > 0 cho biết một sự tương quan dương giữa hai biến, nghĩa là nếu giá trị của biến này tăng thì sẽ làm tăng giá trị của biến kia và ngược lại. r < 0 cho biết một sự tương quan âm giữa hai biến, nghĩa là nếu giá trị của biến này tăng thì sẽ làm giảm giá trị của biến kia và ngược lại.

Giá trị tuyệt đối của r càng cao thì mức độ tương quan giữa 2 biến càng lớn hoặc dữ liệu càng phù hợp với quan hệ tuyến tính giữa hai biến. Giá trị r bằng +1 hoặc bằng -1 cho thấy dữ liệu hoàn toàn phù hợp với mô hình tuyến tính.

Hệ số tương quan Pearson

2.

Quy tắc xác định mức độ tương quan

Có nhiều quy tắc kinh nghiệm khác nhau đề nghị mức độ tương quan theo giá trị tuyệt đối r, trong đó quy tắc Evans (1996) được sử dụng phổ biến như sau:

rMức độ tương quan
Từ 0.00 đến 0.19Rất yếu
Từ 0.20 đến 0.39Yếu
Từ 0.40 đến 0.59Đáng kể
Từ 0.60 đến 0.79Mạnh
Từ 0.80 đến 1.0Rất mạnh
1 2 3Trang sau
Xem thêm
Back to top button