Lọc quan sát – Nối dữ liệu
4.2 Lệnh merge
Giả sử bây giờ, chúng ta có 2 tập tin, một tập tin chứa thông tin cá nhân (được gọi là hsdemo) và một tập tin chứa thông tin các điểm kiểm tra (gọi là hstest) và chúng ta muốn hợp nhất các tập tin với nhau để phân tích. Để thực hiện điều này, đầu tiên, chúng ta cần phải mở, sắp xếp và lưu mỗi file dữ liệu. Mỗi file dữ liệu phải được sắp xếp theo cùng một biến. Tiếp theo, chúng ta sử dụng lệnh merge để hợp nhất hai file dữ liệu.
Để merge dữ liệu, trên Stata chúng ta có 3 tùy chọn merge 1:1; merge 1:m; merge m:m minh họa như sau:
Nguồn: http://stataproject.blogspot.com/
Chúng ta chưa có dữ liệu, để minh họa cách thực hiện lệnh merege tôi tạo ra 2 file hsdemo và hstest trên từ file hsb2 ban đầu như sau:
- use hsb2, clear
- keep id female race ses schtyp prog
- save hsdemo, replace
- use hsb2, clear
- keep id read write math science socst
- save hstest, replace
Sau khi đã có 2 file hsdemo va hstest trên, chúng ta thực hiện lệnh merge 2 file này như sau:
- dir
- use hsdem, clear
- list
- sort id
- save hsdem, replace
- use hstest, clear
- list
- sort id
- save, replace
- use hsdem
- merge id using hstest
- list
- tab _merge
- save hsdiss
- cd ..
- dir
Kết thúc quá trình lưu lại file nhật kí bằng cách sử dụng log close
Các bạn có thể xem lại nhật kí làm việc trên bất cứ khi nào bằng lệnh: view managing-data.txt