Home | KTL cơ bản | Xử lý dữ liệu

Xử lý dữ liệu

Một số lưu ý về lệnh collpase

Một số lưu ý về lệnh collapse khi hồi quy

Liên quan đến dữ liệu sau khi được gộp (collapsed) bằng câu lệnh collapse (sum) với các quan sát của biến có chứa missing. Điều này sẽ dẫn đến sự thiên chệch trong kết quả ước lượng. Bởi lệnh collapse (sum) và egen sum, hoặc rowsum sẽ chuyển các giá trị missing thành giá trị 0. Ngược lại collapse (mean) hoặc collapse (sd) sẽ ...

Read More »

Sử dụng _n và _N trên Stata

Bộ dữ liệu khảo sát mức sống dân cư VHLSS bao quát rất nhiều mặt của đời sống của hộ gia đình, do vậy, VHLSS được sử dụng trong rất nhiều các nghiên cứu.

_n và _N là các biến hệ thống của Stata. _n cho biết vị trí của quan sát hiện tại trong dữ liệu. Bạn có thể sử dụng _n để tạo một biến số thứ tự cho mỗi quan sát. Trong khi _n cho biết số thứ tự của mỗi quan sát thì _N chính là giá trị lớn nhất ...

Read More »

Tạo biến giả nhanh trên Stata

inlist, inrange, cond, recode Stata

Biến giả được sử dụng rất thường xuyên trong các mô hình phân tích. Để tạo một biến giả, trên Stata chúng ta có rất nhiều công cụ hỗ trợ như inlist, inrange, cond hoặc lệnh recode. Đặc biệt trong trường hợp một biến giả là kết hợp của nhiều phép toán logic, ví dụ, tôi muốn tạo biến giả ...

Read More »

Các phương pháp xử lý missing

Phương pháp xử lý missing

Đây là bài viết thứ 2 trong chuỗi bài viết về dữ liệu missing và các phương pháp xử lý missing. Phần trình bày trước đã giới thiệu sơ lược về dữ liệu missing, cũng như cách phát hiện và tổng hợp nó trong dữ liệu. Tiếp đến, chúng ta sẽ tìm hiểu về các phương . . . Phần ...

Read More »

Biểu đồ hình tròn – Stata

Biểu đồ hình tròn - Pie Chart trên Stata

Biểu đồ hình tròn (pie chart) rất hữu ích trong việc mô tả trực quan dữ liệu. Thông thường, biểu đồ hình tròn được sử dụng để thể hiện với hai mục đích sau đây: (i) thể hiện cơ cấu thành phần các nhóm đối tượng trong mẫu và sự thay đổi hay chuyển dịch cơ cấu theo thời gian ...

Read More »