Please Enable JavaScript in your Browser to visit this site

KTL cơ bảnXử lý dữ liệu

Tạo biến trên Stata

2.

Tạo biến chỉ báo (indicator variables)

Biến chỉ báo là một biến nhị phân, có giá trị bằng 1 nếu thỏa mãn hoặc có tính chất nào đó và sẽ nhận giá trị 0 nếu không thỏa hoặc không có tính chất đó.

Ví dụ, chúng ta muốn tạo một biến chỉ báo là gasGuzzler cho một mẫu xe nếu biến mpg nhỏ hơn 20. Câu lệnh tạo biến như sau:
gen gasGuzzler=(mpg<20)

Chúng ta thử kiểm tra kết quả: l make mpg if gasGuzzler

Như đã biết ở phần giới thiệu file auto thì trong tập dữ liệu này chỉ có biến rep78 chứa giá trị missing, do vậy, câu lệnh trên có vẻ là hợp lý. Tuy nhiên, giả sử biến mpg có chứa giá trị missing thì kết quả sẽ thay đổi. khi đó, ở những quan sát có giá trị missing ở biến mpg sẽ tạo ra các giá trị 0 tương ứng ở biến gasGuzzler. Khi đó, kết quả của gasGuzzler sẽ không còn chính xác.

Trong trường hợp này, chúng ta cần phải bổ sung thêm điều kiện không chứa giá trị missing vào câu lệnh trên:
gen gasGuzzler=(mpg<20) if mpg .

3.

Egen

egen là câu lệnh tạo biến, tuy nhiên ý nghĩa của nó lại khác xa so với câu lệnh gen, nhất là về mặt xử lý missing. Câu lệnh gen xem các missing là các vô cùng lớn, do vậy, các kết quả tính toán bằng gen sẽ bị chệch bởi vấn đề này. Câu lệnh egen chỉ tính toán dựa trên các giá trị có sẳn trong tập dữ liệu hay nói cách khác egen sẽ bỏ qua các quan sát có các giá trị missing.

Câu lệnh egen chỉ sử dụng hạn chế cho một số các phép tính chẳng hạn như trung bình (cột: mean, dòng: rowmean), tổng (total, dòng: rowtotal) hoặc một số lệnh thống kê khác như group
egen meanMPG=mean(mpg)
egen rm=rowmean(mpg rep78)
bro meanMPG rm

Với egen thì biểu thức sau dấu = phải là một hàm đơn lẻ, không phải là một biểu thức toán học. Chẳng hạn, chúng ta muốn tạo một biến có giá trị là một phần hai của trung bình cột mpg thì không thể thực hiện bằng câu lệnh như: egen meanMPG=1/2*mean(mpg) mà chỉ thực hiện bằng câu lệnh egen meanMPG=mean(mpg) sau đó sử dụng thêm lệnh replace để thay thế: replace meanMPG = meanMPG/2

 

Previous page 1 2
Back to top button