Tải dữ liệu World Bank trực tiếp trên Stata
Lệnh wbopendata giúp tự động hóa việc tải và cập nhật dữ liệu trên Stata
Sử dụng lệnh wbopendata để truy cập cơ sở dữ liệu của Ngân hàng Thế giới (WB) trên Stata. Lệnh wbopendata lấy từ các bộ dữ liệu chỉ số phát triển chính của Ngân hàng Thế giới, được tổng hợp từ các nguồn quốc tế được chính thức công nhận. Nó trình bày dữ liệu phát triển toàn cầu hiện tại và chính xác nhất hiện có, và bao gồm các ước tính quốc gia, khu vực và toàn cầu. Việc truy cập vào các cơ sở dữ liệu này được thực hiện bởi Sáng kiến Dữ liệu Mở của Ngân hàng Thế giới, tổ chức cung cấp quyền truy cập đầy đủ mở vào các cơ sở dữ liệu của Ngân hàng Thế giới. Ưu điểm của lệnh wbopendata là nhanh chóng và dễ dàng truy xuất cùng với các định nghĩa dữ liệu rõ ràng, rất thuận tiện trong việc kiểm chứng và mô tả dữ liệu.
Phiên bản mới nhất của wbopendata là 16.3, có thể tải xuống và cập nhật dễ dàng qua câu lệnh
ssc install wbopendata, replace
Giới thiệu wbopendata
Lệnh wbopendata cho phép người dùng Stata tải xuống hơn 3.000 chỉ số từ cơ sở dữ liệu của Ngân hàng Thế giới, bao gồm: Chỉ số Phát triển Châu Phi (Development Africa Indicators); Hoạt động kinh doanh (Doing Business); Thống kê Giáo dục (Education Statistics); Khảo sát Doanh nghiệp (Enterprise Surveys); Tài chính Phát triển Toàn cầu (Global Development Finance); Thống kê về giới (Gender Statistics); Dinh dưỡng Sức khỏe và Thống kê Dân số (Health Nutrition and Population Statistics); Hiệp hội Phát triển Quốc tế – Hệ thống Đo lường Kết quả (International Development Association – Results Measurement System); Các mục tiêu phát triển thiên niên kỷ, MDG (Millennium Development Goals); Các Chỉ số Phát triển Thế giới, WDI (World Development Indicators); Các Chỉ số Quản trị Toàn cầu, WGI (Worldwide Governance Indicators). Các chỉ số này được tổng hợp từ hơn 256 quốc gia và khu vực, kể từ năm 1960.
Bạn có thể sử dụng lệnh wbopendata như bất kì lệnh thông thường nào khác trên Stata bằng cách nhập trực tiếp từ dòng lệnh. Bên cạnh đó, bạn cũng có thể thao tác dưới dạng giao diện trực quan bằng cách:
db wbopendata
Ba tùy chọn tải xuống tất cả dữ liệu sẵn có dựa vào 3 thiết lập:
- country – tất cả các chỉ số cho tất cả các năm cho một quốc gia.
- topic – tất cả các chỉ số trong một chủ đề cụ thể, cho tất cả các năm và tất cả các quốc gia.
- indicator – tất cả các năm cho tất cả các quốc gia cho một chỉ số duy nhất.
Người dùng cũng có thể chọn hiển thị dữ liệu ở định dạng rộng hoặc dài (rộng là tùy chọn mặc định). Lưu ý rằng việc định hình lại được thực hiện cục bộ, vì vậy nó sẽ yêu cầu dung lượng RAM thích hợp để hoạt động bình thường.
Ngoài ra, wbopendata còn hỗ trợ giao diện tương tác giúp bạn dễ dàng thao tác lựa tải dữ liệu World Bank một cách trực tiếp. Dù sử dụng giao diện tương tác hay nhập trực tiếp qua cửa sổ lệnh thì để khai thác dữ liệu WB hiệu quả thì đầu tiên cần nắm rõ ý nghĩa các chỉ số, cách tính toán cũng như các quy ước kí hiệu chỉ số, quốc gia, bộ dữ liệu… mà WB công bố.
Tiếp đến, tìm hiểu kỹ để biết cách thiết lập đúng câu lệnh wbopendata. Một trong những cách đơn giản để hiểu rõ câu lệnh là sử dụng công cụ help của Stata (help wbopendata). Phần hướng dẫn của Stata rất chi tiết từ ý nghĩa câu lệnh, cú pháp, diễn giải các tùy chọn đến các ví dụ thực hành để nắm rõ cách vận dụng câu lệnh. Phần trình bày bên dưới sẽ tóm lược một số nội dung cơ bản của wbopendata để các bạn dễ dàng hơn trong việc nắm bắt và sử dụng.
Cú pháp lệnh wbopendata
wbopendata, Parameters [Options]
Câu lệnh chỉ yêu cầu thiết lập 3 tham số chính là:
- country(acronym): liệt kê quốc gia hoặc các quốc gia cần truy xuất dữ liệu. Khi lựa chọn nhiều quốc gia thì mỗi quốc gia cách nhau bởi dấu chấm phẩy (;) và sử dụng mã quy ước 3 kí tự. Tham khảo mã quốc gia (country code) dạng alpha-2 code, alpha-3 code và code numberic tại: https://www.iso.org/obp/ui
- topics(acronym): chỉ định 1 trong 21 chủ đề, bao gồm: Agriculture & Rural Development; Aid Effectiveness; Economy & Growth; Education; Energy & Mining; Environment; Financial Sector; Health; Infrastructure; Social Protection & Labor; Poverty; Private Sector; Public Sector; Science & Technology; Social Development; Urban Development; Gender; Millenium development goals; Climate Change; External Debt; and, Trade. Tham khảo chi tiết những quy ước chủ đề trong phần help wbopendata.
- indicator(acronym): liệt kê các chỉ báo cần truy xuất, các chỉ số được lựa chọn cách nhau bởi dấu (;).
Lưu ý, câu lệnh yêu cầu sử dụng các mã viết tắt quy ước cho quốc gia, chủ đề và chỉ số trong phần khai báo tham số. Thông tin về các chỉ số, chủ đề và quốc gia chúng ta có thể tìm hiểu tại: https://databank.worldbank.org/metadataglossary/all/series