Tải dữ liệu kinh tế từ WB, IMF, OECD trên Stata
Tải và cập nhật dữ liệu tự động trên Stata với sdmxuse
Minh họa tải dữ liệu kinh tế với sdmxuse
Ví dụ bên dưới sử dụng sdmxuse để tải và nhập dữ liệu dân số các quốc gia OECD
Bước 1: Xác định nguồn dữ liệu
Tìm tất cả các bộ dữ liệu sẵn có từ nguồn OECD cũng như các mô tả có chứa từ “population”
. sdmxuse dataflow OECD, clear . list if regexm(lower(dataflow_description), "population"), noobs +----------------------------------------------------------------------------------------------------+ | dataflow_id dataflow_description | |----------------------------------------------------------------------------------------------------| | ALFS_POP_VITAL Population and Vital Statistics | | ALFS_POP_LABOUR Population and Labour Force | | SNA_TABLE3 3. Population and employment by main activity | | POP_FIVE_HIST Population | | RPOP Total population by sex and age | |----------------------------------------------------------------------------------------------------| | SNA_TABLE3_SNA93 3. Population and employment by main activity, SNA93 | | POP_PROJ Historical population data and projections (1950-2050) | | WATER_TREAT Wastewater treatment (% population connected) | | AEO2012_CH6_FIG5 Figure 5: Employment Rate to working age population in Africa and comparators | | AEO2012_CH6_BOX6 Box 6: Rural vs. Agricultural population in Nigeria (1980-2010, in thousands) | |----------------------------------------------------------------------------------------------------| | HISTPOP Historical population | | POPPROJ Population projections | | EDU_DEM Population data | | SNA_TABLE3_ARCHIVE 3. Population and employment by main activity, 2019 archive | +----------------------------------------------------------------------------------------------------+
Bước 2: Xác định cấu trúc dữ liệu
Từ dataflow của OCED liệt kê ở trên, chúng ta thấy dữ liệu về dân số phân theo tuổi và giới tính được tổng hợp trong bộ dữ liệu RPOP. Tiếp đến, chúng tôi tìm định nghĩa cấu trúc DSD của bộ dữ liệu RPOP. Câu lệnh sdmxuse datastructure sẽ trả về tên và thứ tự của các chiều trong bộ dữ liệu.
. sdmxuse datastructure OECD, clear dataset(RPOP) Order of dimensions: (COUNTRY.DAGEGR.DSEX.DSTATUS)
Bước 3: Tùy chỉnh các yêu cầu dữ liệu
Sau khi biết định nghĩa cấu trúc của bộ dữ liệu, tiếp đến chúng tôi truy xuất vào các chỉ tiêu (chiều) dữ liệu cần tổng hợp. Giả sử, ở đây, chúng tôi cần dữ liệu về tổng dân số trong độ tuổi 20 – 24. Bỏ trống chiều đầu tiên và cuối cùng, nghĩa là, chúng tôi muốn truy xuất tất cả giá trị của 2 chiều này.
. sdmxuse data OECD, clear dataset(RPOP) dimensions(.2024.90.)
56 serie(s) imported
Tiếp đến, chúng tôi nối dữ liệu với DSD để lấy thêm thông tin tên của mỗi quốc gia được lưu trữ ở biến khác.
. sdmxuse data OECD, clear dataset(RPOP) dimensions(.2024.90.) mergedsd
56 serie(s) imported
Chúng tôi có thể biến đổi dữ liệu để tạo thành các chuỗi riêng rẽ hoặc xây dựng một dữ liệu bảng. Ở đây, chúng tôi sẽ tạo hai chuỗi nam và nữ, bằng cách thiết lập giá trị 1+2 ở chiều DSEX.
. sdmxuse data OECD, clear dataset(RPOP) dimensions(.2024.1+2.) timeseries 112 serie(s) imported . sdmxuse data OECD, clear dataset(RPOP) dimensions(.2024.1+2.) panel(COUNTRY) 112 serie(s) imported