Tải dữ liệu kinh tế từ WB, IMF, OECD trên Stata
Tải và cập nhật dữ liệu tự động trên Stata với sdmxuse
Sử dụng câu lệnh sdmxuse để tải dữ liệu từ các cơ quan thống kê như European Central Bank (ECB), Eurostat (ESTAT), International Monetary Fund (IMF), Organisation for Economic Co-operation and Development (OECD), United Nations Statistics Division (UNSD) sử dụng chuẩn SDMX.
Trong bài báo này, tôi sẽ hướng dẫn các bạn sử dụng lệnh sdmxuse để tải dữ liệu từ các tổ chức quốc tế bằng cách sử dụng chuẩn SDMX. Rất đơn giản trải qua 3 bước: xác định nguồn dữ liệu, xác định cấu trúc dữ liệu (lựa chọn chỉ số) và tùy chỉnh dữ liệu. Vì vậy, để tải được các dữ liệu mong muốn, việc của bạn chỉ là tìm hiểu thông tin dữ liệu (chỉ số) cần lấy. Bạn cần tổng hợp thành một bảng mô tả dữ liệu gồm các cột chính như tên chỉ số, ý nghĩa, bộ dữ liệu, nguồn. Đây cũng là một yêu cầu bắt buộc mà bạn cần trình bày để chứng minh nguồn gốc và độ tin cậy của dữ liệu cho nghiên cứu. Từ bảng tổng hợp này, bạn dễ dàng sử dụng sdmxuse hay wbopendata để truy xuất dữ liệu mình cần, tính toán các biến và chạy ước lượng mô hình một cách tự động (thông qua dofile). Các kết quả, khi đó, cũng sẽ tự động được cập nhật khi các dữ liệu liên quan được công bố.
Giới thiệu chuẩn dữ liệu SDMX
Năm 2001, các cơ quan thống kê như Ngân hàng thanh toán quốc tế (BIS), Ngân hàng trung ương châu Âu (ECB), Cơ quan Thống kê châu Âu (Eurostat), Quỹ tiền tệ quốc tế (IMF), Tổ chức hợp tác và phát triển kinh tế (OECD), Cơ quan Thống kê Liên hợp quốc (UNSD) và Ngân hàng Thế giới (WB) đã đưa ra một sáng kiến nhằm tạo điều kiện thuận lợi cho việc trao đổi các dữ liệu thống kê.
Sáng kiến này xuất phát từ thực tế việc thu thập, xử lý và trao đổi số liệu thống kê thường tốn nhiều thời gian và nhân lực. Cùng với đó, nhu cầu áp dụng các công nghệ mới trong thống kê ngày càng tăng. Mỗi tổ chức, cơ quan thống kê lại có một phương pháp trao đổi và xử lý số liệu riêng. Do đó, sáng kiến về SDMX ra đời đã giải quyết những vấn đề trên bằng việc phát triển một quy trình hiệu quả hơn để trao đổi và chia sẻ dữ liệu (data) và siêu dữ liệu (metadata) bằng cách sử dụng công nghệ hiện đại. Tiêu chuẩn này sẽ giống như một ngôn ngữ chung để các tổ chức dễ dàng trao đổi dữ liệu chỉ thông qua máy tính có kết nối internet mà không mất nhiều công sức của con người. Đối với người dùng tin, sau khi đăng ký trên các trang web của các tổ chức thống kê, sẽ dễ dàng thu thập được thông tin và sẽ được tự động cập nhật thông tin mới nhất khi có thay đổi.
Từ khi ra đời cho đến nay, SDMX đã có khá nhiều tiến bộ trong việc phát triển chuẩn SDMX. Nhiều tổ chức thống kê đã sử dụng và áp dụng SDMX trong các lĩnh vực thống kê như: Tài khoản quốc gia, cán cân thanh toán, đầu tư nước ngoài, MDG, hệ thống phổ biến số liệu GDDS, SDG… Và SDMX đang tiếp tục được mở rộng cho các lĩnh vực khác.
Lệnh sdmxuse giúp việc tải xuống và nhập liệu trực tiếp vào Stata trở nên dễ dàng. Nó có thể hữu ích cho các nhà nghiên cứu, những người thường xuyên cập nhật dữ liệu và muốn tự động hóa quá trình nhập liệu và xử lý khi mà hàng trăm chuỗi thời gian được sử dụng ngay khi chúng được công bố.