KTL cơ bảnXử lý dữ liệu

Nối dữ liệu với SPSS – Merging data

B. NỐI DỮ LIỆU CÓ SO KHỚP

Khi sử dụng nối các file bằng cách bổ sung biến, có 3 trường hợp xảy ra như sau:

  1. Thứ 1, các quan sát trong file kết quả chỉ chứa dữ liệu từ file hiện hành
  2. Thứ 2, các quan sát trong file kết quả chỉ chứa dữ liệu từ file sử dụng
  3. Thứ 3, các quan sát trong file kết quả chứa dữ liệu trên cả hai file.

Trường hợp thứ 3 đòi hỏi giá trị của các biến trên cả hai file là giống nhau. Còn trường hợp 1 và 2, các quan sát không tương ứng nhau ở cả hai file (nghĩa là quan sát của file này không ứng với một quan sát nào của file kia và ngược lại).

Vì vậy, các biến chung sẽ là những biến làm tiêu chuẩn kết nối (Key Variables) của hai file. Ngoài ra, trước khi nối dữ liệu thì các file (hiện hành và sử dụng) đều phải được sắp xếp (sorted) theo cùng thứ tự.

Ví dụ, thực hiện nối dữ liệu bằng cách thêm biến giữa hai file hsb2.sav (file hiện hành) và hsb.sav (file sử dụng). Ở đây file hsb2.sav bao gồm 100 quan sát và 8 biến (id, female, race, ses, schtyp, prog, read, write) trong khi đó file hsb.sav bao gồm 200 quan sát và 11 biến (thêm 3 biến math, science và socst). Lưu ý, trong 200 quan sát của file hsb.sav có chứa 100 quan sát của file hsb2.sav

1.

Sắp xếp dữ liệu trong SPSS

Thông thường các thao tác gộp, tách đòi hỏi dữ liệu phải được sắp xếp trước theo một trật tự nhất định. Để sắp xếp dữ liệu trong SPSS, ta làm như sau:

  • Mở file hsb2.sav
  • Chọn Sort Cases… từ menu Data
    Sắp xếp dữ liệu trong SPSS
  • Trong cửa sổ Sort Cases đưa biến đại diện cho mỗi quan sát (id) vào ô Sort by:
  • Ở mục Save Sorted Data, chọn Save file with sorted data.
  • Tiếp đến bấm vào nút File… và tìm đến đường dẫn cần lưu file. Bạn có thể tạo file mới hoặc lưu chồng lên file đã có (nên lưu chồng lên file đang cần sắp xếp) và bấm nút Save.
    Sắp xếp dữ liệu trong SPSS
  • Một cửa sổ thông báo cho phép lưu chồng lên file hiện có, bấm Yes để trở về cửa sổ Sort Cases
  • Bấm OK để hoàn tất quá trình sắp xếp và lưu file đã sắp xếp.

Thực hiện tương tự ở file hsb.sav trước khi bắt đầu nối dữ liệu.

2.

Nối hsb.sav vào hsb2.sav

Nghĩa là bổ sung thểm 3 biến math, science và socst của file hsb.sav vào file hsbs.sav

  • Mở file hsb2.sav (file hiện hành hay file hoạt động là file mở trước)
  • Chọn Add Variables… từ menu Data–>Merge Files
  • Chọn An external SPSS Statistics data file và tìm đến file hsb.sav
  • Bấm Open và tiếp đến là Continue

Ở cửa sổ mở ra, dấu (*) kí hiệu cho các biến thuộc file hiện hành (hsb2.sav) và dấu (+) sẽ kí hiệu cho các biến thuộc file sử dụng (hsb.sav).
Nối dữ liệu với SPSS - thêm biến

  • Để thực hiện so khớp các quan sát, chúng ta chọn Match cases on key variables in sorted files, đồng thời đưa biến id ở khung Excluded Variables vào ô Key Variables (bởi 2 file ban đầu được sắp xếp theo biến id, đồng thời id chính là biến chung đại diện cho mỗi quan sát ở 2 file). Lưu ý, giá trị của các biến trong mục Key Variables ở 2 file phải hoàn toàn giống nhau (có sự phân biệt chữ hoa và chữ thường, chẳng hạn: vietlod và Vietlod là 2 quan sát khác nhau).
  • Tiếp đến, có 3 lựa chọn:
    1. Both files provide cases: các quan sát trong file kết quả chứa dữ liệu trên cả hai file (trường hợp 3).
    2. Non-active dataset is keyed table: tìm dữ liệu ở file sử dụng cho mỗi quan sát ở file hiện hành, nghĩa là các quan sát trong file kết quả chỉ chứa dữ liệu từ file sử dụng khớp với file hiện hành (trường hợp 2).
    3. Active dataset is keyed table: tìm dữ liệu ở file hiện hành cho mỗi quan sát ở file sử dụng, nghĩa là các quan sát trong file kết quả sẽ chứa dữ liệu từ file hiện hành có khớp dữ liệu ở file sử dụng (trường hợp 1).
N

ếu bạn chỉ muốn bổ sung 3 biến math, science và socst cho 100 quan sát ở file hiện hành thì chọn Non-active dataset is keyed table. Bởi khi đó 200 quan sát ở file sử dụng sẽ chứa (khớp) 100 quan sát ở file hiện hành.
Nối dữ liệu với SPSS - thêm biến

Kết quả sau khi nối:
Nối dữ liệu với SPSS - thêm biến

N

ếu bạn muốn bổ sung thêm 3 biến math, science và socst; và tăng thêm số quan sát cho file hiện hành thì có thể chọn Both files provide cases hoặc Active dataset is keyed table.

Nối với tùy chọn Both files provide cases
Nối dữ liệu với SPSS - thêm biến

Hoặc nối với tùy chọn Active dataset is keyed table
Nối dữ liệu với SPSS - thêm biến

Cả hai trường hợp sau khi nối cho kết quả giống nhau như sau:
Nối dữ liệu với SPSS - thêm biến

File hiện hành hsb2.sav chỉ chứa 100 quan sát, do vậy, khi so khớp với file hsb.sav thì mặc nhiên SPSS xem những quan sát (id) không có ở hsb2.sav sẽ lần lượt khớp với các giá trị id khác của hsb.sav (chẳng hạn, các giá trị id = 194, 195, 196, 197, 199, 200 không có ở hsbs.sav sẽ khớp với các giá trị id tương ứng ở hsb.sav).

 

Trang trước 1 2
Xem thêm
Back to top button