Home | KTL nâng cao | Đôi điều về tính chất BLUE của ước lượng

Đôi điều về tính chất BLUE của ước lượng

Chúng ta gần như rất quen thuộc với các khái niệm như kết hợp tuyến tính (linearity), độ tin cậy (consistent), tính không chệch (unbiased) hoặc tính nhất quán, hiệu quả (effective) của ước lượng. Đó chính là các tính chất BLUE của ước lượng. Vậy một ước lượng như thế nào được gọi là BLUE. Sau đây là đôi điều “tản mạn” về tính chất BLUE của ước lượng.

BLUE là viết tắt của Best Linear Unbiased Estimator, tạm dịch là ước lượng không chệch tuyến tính tốt nhất. Đầu tiên, chúng ta nhắc lại khái niệm Ước lượng.

Ước lượng (Estimator) là một kỹ thuật thống kê nhằm tìm ra bản chất của các mối quan hệ giữa các đại lượng đo lường trong tổng thể thông qua hệ số ước lượng của các biến trong mẫu dữ liệu thu thập.

1. Tính tuyến tính của ước lượng

Tính chất tuyến tính (Linearity) trong ước lượng, nghĩa là kết quả ước lượng các hệ số của các biến cho thấy tồn tại một mối quan hệ tuyến tính hoặc tổ hợp tuyến tính của các biến giải thích với biến phụ thuộc của mô hình. Lưu ý, sự tuyến tính được ở đây chính là sự tuyến tính trong tham số ước lượng (Linearity in the Parameters) chứ không phải tuyến tính ở biến giải thích (Linearity in the Variables). Do vậy, cần lựa chọn dạng hàm phù hợp để đảm bảo sự tuyến tính trong tham số.

Một ước lượng được xem là tốt nhất (Best) nếu các giá trị được dự báo của nó sát với giá trị thực tế. Điều này được thể hiện qua tiêu chí phương sai của phần dư (là sự chênh lệch giữa giá trị được dự báo và giá trị thực) nhỏ nhất. Một ước lượng tốt nhất, đôi khi, không phải là một ước lượng tin cậy.

2. Tính tin cậy – không chệch của ước lượng

Một ước lượng được xem là tin cậy (Consistence) nếu kết quả ước lượng của nó phản ánh đúng các giá trị thực của mô hình (dữ liệu). Sự tin cậy của ước lượng, được thể hiện qua tính không chệch (Unbiasedness) của kết quả ước lượng. Kết quả ước lượng sẽ bị thiên chệch khi nó vi phạm các giả định của ước lượng hoặc mô hình như tồn tại các khuyết tật mô hình. Đó là lí do tại sao ước lượng OLS là không tin cậy trong trường hợp dữ liệu bảng hoặc mô hình OLS tồn tại các vấn đề về biến nội sinh, phương sai thay đổi, sự tự tương quan… Như vậy một ước lượng tin cậy cũng có thể không phải là một ước lượng tốt nhất.

3. Tính hiệu quả của ước lượng

Một ước lượng được xem là hiệu quả (Effectiveness) nếu quá trình tính toán của nó sử dụng hoặc khai thác hết tất cả các thông tin liên quan đến dữ liệu cũng như các điều kiện giả định của mô hình. Có nhiều kỹ thuật hoặc phương pháp để ước lượng mô hình, phương pháp nào khai thác hoặc sử dụng hết các thông tin này thì phương pháp ước lượng đó được xem là hiệu quả. Ước lượng OLS là không hiệu quả trong ước lượng dữ liệu bảng; Ước lượng FE hoặc RE lại không hiệu quả và không tin cậy trong trường hợp bảng động (dynamic panel) tuyến tính.

Vậy làm thế nào để có 1 kết quả ước lượng tốt?

  • Đầu tiên là phải am hiểu về dữ liệu. Kết quả của ước lượng phụ thuộc rất nhiều vào dữ liệu, do vậy, nhà phân tích cần phải am hiểu về dữ liệu. Cần phải thực hiện các thống kê mô tả về dữ liệu nhằm phát hiện các khuyết tật dữ liệu (nếu có), mối quan hệ cơ bản giữa các biến để lựa chọn một ước lượng phù hợp.
  • Tiếp đến, nhà phân tích cần hiểu rõ về ước lượng nhất là các giả định liên quan đến kỹ thuật ước lượng. Việc hiểu rõ các giả định này giúp cho nhà phân tích có thể lựa chọn một ước lượng phù hợp nhất cho dữ liệu thu thập.
  • Cuối cùng là thiết lập đúng các thông số của phương pháp trước khi thực hiện ước lượng và có công cụ để kiểm định lại các giả định của ước lượng cũng như giả định của mô hình.