Ước lượng mô hình ARIMA

07/12/2014

5 phút

Hồi quy mô hình ARIMA bằng ước lượng hợp lí cực đại MLE (Maximum Likelihood Estimation)

1. Giới thiệu về phương pháp ước lượng mô hình ARIMA

Khi mô hình ARIMA đã được nhận dạng, nghĩa là đã xác được các thông số p, d, q bước tiếp theo là chúng ta ước lượng các tham số c, \(\phi_1,\dots,\phi_p\) và \(\theta_1,\dots,\theta_q\). Mô hình ARIMA (p,d,q) sẽ được phân tích thông qua ước lượng hợp lý cực đại (maximum likelihood estimation – MLE). Kỹ thuật này được sử dụng để xác định các tham số nhằm tối đa sự phù hợp của các quan sát. Nguyên tắc ước lượng của MLE cũng tương tự như ước lượng OLS, nghĩa là tối thiểu hóa sai số phần dư \(\sum_{t=1}^Te_t^2\).

Ghi chú:

Đối với các mô hình AR(1), MA(1) đã được minh họa ở các phần trình bày trước, ước lượng MLE sẽ cho kết quả giống với kết quả của ước lượng OLS. Tuy nhiên, mô hình ARIMA là mô hình tổng quát của các mô hình AR(p), MA(q) nên kết quả ước lượng OLS sẽ mắc phải các khuyết tật của mô hình.
Ngoài ra, kết quả ước lượng MLE của mô hình ARIMA trên các phần mềm thống kê khác nhau như Eview, SPSS, Stata, R… cũng có sự khác nhau đôi chút.

[restrict] [/restrict] Đối với phần mềm Stata, R, SAS sẽ tính toán giá trị của dữ liệu dưới dạng hàm log likelihood (likelihood tạm dịch hàm hợp lí, hay hàm phù hợp nó cho biết mức độ phù hợp giữa các giá trị quan sát với các giá trị được ước lượng). Điều đó có nghĩa mô hình sử dụng hàm logarit để “hợp lí” các giá trị quan sát với giá trị ước lượng của mô hình. Đối với các giá trị p, d và q cho trước các phần mềm này sẽ tối đa hóa giá trị hàm log likehood khi ước lượng các tham số.

2. Lựa chọn mô hình ARIMA

Trong nghiên cứu thực tiễn, hiếm khi tồn tại một mẫu mô hình ARIMA (p,d,q) rõ ràng và duy nhất. Do vậy, chúng ta thường phải ước lượng 2 hay nhiều mô hình ARIMA với các bộ thông số (p,d,q) khác nhau. Câu hỏi đặt ra là:

Mô hình ARIMA nào sẽ được lựa chọn để thực hiện công việc dự báo tiếp theo?

Xem thêm: Xác định p, q trong mô hình ARIMA
Xác định chuỗi thời gian dừng bằng kiểm định DF-ADF.

hắc lại: ước lượng OLS thường dựa vào thống kê \({R^2}\) để lựa chọn mô hình (dĩ nhiên mô hình ước lượng đã thỏa mãn các giả định của OLS, cũng như có ý nghĩa thống kê).

Với ước lượng hợp lý cực đại MLE, việc lựa chọn mô hình sẽ dựa vào 2 giá trị AIC và BIC. Theo đó, mô hình nào có AIC và BIC nhỏ nhất sẽ được chọn (mô hình tốt nhất).

Vậy AIC và BIC là gì? Xác định AIC và BIC như thế nào?

AIC viết tắt là Akaike Information Criterion (tạm dịch là tiêu chí thông tin Akaike). AIC là một thước đo của chất lượng tương đối của một mô hình thống kê cho một tập hợp các dữ liệu. AIC được xem là một phương tiện hữu ích để lựa chọn mô hình, cũng như là việc xác định các độ trễ của một mô hình ARIMA. AIC trong mô hình ARIMA (p,d,q) được tính như sau:

\(\text{AIC} = -2 \log(L) + 2(p+q+k+1)\)

Trong đó:

L: hàm likehood đo lường mức hợp lí của dữ liệu,
k = 1 nếu hằng số c khác 0 và k = 0 nếu c = 0,
p, q lần lượt là độ trễ của mô hình AR(p) và MA(q)

Lưu ý rằng: thành phần (p + q + k + 1) chính là số tham số trong mô hình, bao gồm cả phương sai của phần dư.

AIC được xem là một tiêu chí “đánh đổi” giữa 2 khái niệm sự phù hợp (goodness of fit) và tính phức tạp (complexity) của mô hình. Mô hình phù hợp nhất với dữ liệu sẽ bao gồm đầy đủ tất cả các biến kiểm soát; ngược lại, mô hình với bao gồm tất cả các biến quan sát sẽ là mô hình phức tạp nhất, đôi khi không phù hợp với thực tế nghiên cứu.

Quy tắc kinh nghiệm cho thấy nếu số biến ước lượng (p + q) trong mô hình ARIMA nhỏ hơn 30% cở mẫu được xem là phù hợp (p + q < 0.3T). Do vậy, nếu chúng ta giữ p + q nhỏ tương đối so với T thì AIC sẽ cho kết quả tốt, tuy nhiên, trong trường hợp số thời điểm thu thập (T) nhỏ thì chúng ta cần xem xét lại giá trị p, q để đảm bảo sự phù hợp của mô hình.

Để kiểm soát vấn đề này, Hurvich và Tsai (1989)^[1] đề xuất thông số AIC hiệu chỉnh như sau:

\(\text{AIC}_{\text{c}} = \text{AIC} + \frac{2(p+q+k+1)(p+q+k+2)}{T-p-q-k-2}\)

Ngoài ra, một tiêu chí khác gắn liền với ước lượng hợp lí cực đại MLE là tiêu chí thông tin Bayesian (BIC – Bayesian information criterion) hay còn gọi là tiêu chí Schwarz^[2]. (đôi khi còn gọi là SBC hay SBIC). BIC là một tiêu chuẩn để lựa chọn mô hình trong một tập hữu hạn các mô hình. BIC có liên quan chặt chẽ với các tiêu chí thông tin Akaike (AIC).

Khi một mô hình là phù hợp, chúng ta có thể làm tăng khả năng phù hợp bằng cách thêm tham số, nhưng điều này có thể dẫn đến sự “phù hợp quá mức” (overfitting). Cả hai BIC và AIC hiệu chỉnh giải quyết vấn đề này bằng cách thêm điều kiện “đánh đổi” đối với số lượng tham số trong mô hình (tương tự như R bình phương hiệu chỉnh trong ước lượng OLS). Sự “đánh đổi” ở tiêu chí BIC là nặng hơn so với AIC.

Tiêu chí thông tin BIC trong mô hình ARIMA (p,d,q) được tính như sau:

\(\text{BIC} = \text{AIC} + (\log(T)-2)(p+q+k+1)\)

TÓM TẮT VỀ LỰA CHỌN MÔ HÌNH ARIMA

Các mô hình ARIMA (p,d,q) sau khi được nhận dạng có thể được hồi quy với ước lượng hợp lí cực đại MLE. Ước lượng MLE sẽ xác định các tham số c, \(\phi_1,\dots,\phi_p\) và \(\theta_1,\dots,\theta_q\) thỏa mãn điều kiện hợp lí tối đa của dữ liệu. Trong các mô hình được ước lượng phù hợp, mô hình nào có các tiêu chí thông tin AIC hoặc AIC hiệu chỉnh và BIC nhỏ nhất sẽ được sử dụng để thực hiện cho công tác dự báo tiếp theo.

1. Hurvich, C.M. & Tsai, C.L. (1989). “Regression and Time Series Model Selection in Small Samples”. Biometrika 76, 297-307.
2. Schwarz, Gideon E. (1978). “Estimating the dimension of a model”. Annals of Statistics 6(2): 461–464. doi:10.1214/aos/1176344136. MR 468014.

Thẻ

07/12/2014

5 phút

Xem thêm