KTL cơ bảnXử lý dữ liệu
Lọc quan sát – Nối dữ liệu
4. Nối dữ liệu
4.1 Lệnh append
Giả sử, chúng ta có một tập tin với các dữ liệu cho sinh viên nam (gọi là hsmale) và một tập tin cho sinh viên (gọi là hsfemale). Chúng ta cần kết hợp 2 tập tin với nhau để có thể phân tích chung. Trường hợp này được gọi là thêm quan sát (add cases) hay còn gọi là xếp chồng (stacking) dữ liệu.
Quá trình nối dữ liệu có thể được minh họa như sau:
Nguồn: http://stataproject.blogspot.com/
Nhằm mục đích minh họa, trước khi thực hiện điều việc xếp chồng dữ liệu này, các bạn cần tạo 2 file hsmale và hsfemale bên trên bằng cách sử dụng bộ dữ liệu hsb2 ban đầu như sau:
- use hsb2, clear
- keep if female==0
- save hsmale, replace
- use hsb2, clear
- keep if female==1
- save hsfemale, replace
Tiếp đến sử dụng lệnh append để xếp chồng dữ liệu như bên dưới:
- dir
- use hsmale
- tabulate female
- append using hsfemale
- tabulate female
- save hsb, replace
Nhận xét: file hsb mới tạo ở đây chính là file hsb2 ban đầu.