Home | KTL cơ bản | Hồi quy khoảng – Interval Regression

Hồi quy khoảng – Interval Regression

1. Giới thiệu về hồi quy khoảng
Hồi quy khoảng (Interval Regression) được sử dụng để ước lượng mô hình có các biến phụ thuộc bị kiểm duyệt. Dữ liệu bị kiểm duyệt trong hồi quy khoảng là các kiểm duyệt khoảng. Điều đó có nghĩa chúng ta biết các quan sát nằm trong khoảng giá trị nào nhưng không thể biết chính xác giá cụ thể của mỗi quan sát. Hồi quy khoảng là trường hợp tổng quát của hồi quy kiểm duyệt (censored regression).

Ví dụ: chẳng hạn chúng ta muốn biết thu nhập thực của người lao động (triệu/tháng) theo các mức học vấn, số năm kinh nghiệm cũng như loại hình kinh tế mà người lao động làm việc. Trong trường hợp này, chúng ta không thể biết được giá trị thu thập thực của từng người lao động, nhưng chúng ta có thể biết được giá trị thu nhập thực có thể rơi vào các khoảng như nhỏ hơn 5 triệu, từ 5 triệu đến 10 triệu, từ 10 triệu đến 20 triệu, từ 20 triệu đến 50 triệu và trên 50 triệu. Đối với dữ liệu thu thập này, thì rõ ràng dữ liệu vừa bị kiểm duyệt trái (nhỏ hơn 5 triệu), kiểm duyệt phải (lớn hơn 50 triệu), đồng thời trong mỗi khoảng giá trị của các quan sát bị kiểm duyệt trái và phải đồng thời. Trong trường hợp này, chúng ta không sử dụng mô hình hồi quy kiểm duyệt thông thường, mà phải sử dụng hồi quy kiểm duyệt tổng quát hay còn gọi là hồi quy khoảng.

Hoặc một ví dụ khác gần gũi với vấn đề học tập. Giả sử chúng ta muốn dự đoán điểm trung bình GPA dựa vào các điểm bài thi viết (write), bài thi đọc hiểu (read), điểm nỗ lực (rating) của mỗi học sinh và loại chương trình học mà mỗi học sinh tham gia (type). Điểm trung bình GPA được phản hồi từ mỗi học sinh được thể hiện ở các mức như sau:

Phần nội dung có thu phí bên dưới đã được ẩn. Vui lòng đăng nhập hoặc đăng ký gói Premium. Trân trọng!