KTL cơ bảnXử lý dữ liệu

Lọc quan sát – Nối dữ liệu

4. Nối dữ liệu

4.1 Lệnh append

Giả sử, chúng ta có một tập tin với các dữ liệu cho sinh viên nam (gọi là hsmale) và một tập tin cho sinh viên (gọi là hsfemale). Chúng ta cần kết hợp 2 tập tin với nhau để có thể phân tích chung. Trường hợp này được gọi là thêm quan sát (add cases) hay còn gọi là xếp chồng (stacking) dữ liệu.

Quá trình nối dữ liệu có thể được minh họa như sau:

Minh họa nối dữ liệu - appending data

Nguồn: http://stataproject.blogspot.com/

Nhằm mục đích minh họa, trước khi thực hiện điều việc xếp chồng dữ liệu này, các bạn cần tạo 2 file hsmalehsfemale bên trên bằng cách sử dụng bộ dữ liệu hsb2 ban đầu như sau:

  • use hsb2, clear
  • keep if female==0
  • save hsmale, replace
  • use hsb2, clear
  • keep if female==1
  • save hsfemale, replace

Tiếp đến sử dụng lệnh append để xếp chồng dữ liệu như bên dưới:

  • dir
  • use hsmale
  • tabulate female
  • append using hsfemale
  • tabulate female
  • save hsb, replace

Nhận xét: file hsb mới tạo ở đây chính là file hsb2 ban đầu.

Trang trước 1 2 3 4Trang sau
Xem thêm
Back to top button