Home | KTL nâng cao | Tản mạn về mô hình SEM
Toán tử trễ, nghiệm đơn vị, định lí Wold...
Toán tử trễ, nghiệm đơn vị, định lí Wold...

Tản mạn về mô hình SEM

Các phương pháp ANOVA, hồi quy tuyến tính đa biến, ANCOVA, MANOVA trong phương pháp hồi quy tuyến tính tổng quát (GLM) được xem là 1 trường hợp giới hạn của mô hình SEM (Fan, 1997). Vậy mô hình SEM là gì? Vì sao mô hình SEM cho phép thực hiện các phân tích linh hoạt hơn GLM và ngày càng được áp dụng phổ biến trong các nghiên cứu khoa học & thực nghiệm? Mặc dù rất nhiều tài liệu tiếng anh viết về vấn đề này, tuy nhiên, tại Việt Nam các lý thuyết về mô hình SEM là rất hạn chế.

Bài viết này sẽ lần lượt trình bày, phân biệt rõ ràng các khái niệm cơ bản của mô hình SEM như biến quan sát (observed variables hoặc manifest variables), chỉ báo (indicators), biến ẩn (latent variables), khái niệm (constructs) hoặc nhân tố (factors), cũng như phân biệt mô hình SEM với các mô hình/phương pháp thống kê truyền thống. Ngoài ra, bài viết còn đi sâu phân tích các đặc trưng cơ bản của mô hình SEM như yêu cầu cở mẫu lớn, ít tập trung vào các kiểm định thống kê riêng rẻ,… thông qua đó người đọc có thể biết được cách xác định cở mẫu tối ưu cho mô hình SEM, cũng như sử dụng các phép kiểm định thống kê phù hợp.

Xem thêm:

  • Giới thiệu CFA và phân biệt CFA vs EFA
  • Thực hành ước lượng mô hình SEM trên SPSS với AMOS
  • Thực hành ước lượng mô hình SEM trên Stata
  • Một số báo cáo NCKH sử dụng mô hình SEM

Đầu tiên, chúng ta bắt đầu với việc phân biệt rõ ràng các khái niệm cơ bản nhưng rất quan trọng trong mô hình SEM.

SEM là viết tắt của Structural Equation Modelling, tạm hiểu là mô hình hệ phương trình cấu trúc và viết tắt là mô hình SEM. Thuật ngữ SEM không phải là một kỹ thuật đơn nhất, nó đề cập đến một nhánh các phương pháp liên quan. Các thuật ngữ khác như covariance structure analysis, covariance structure modeling, hoặc là analysis of covariance structures cũng được sử dụng trong lý thuyết để phân loại những phương pháp này. Những thuật ngữ này có thể thay thế cho nhau, nhưng chỉ duy nhất thuật ngữ đầu tiên sẽ được sử dụng trong chuỗi bài viết về mô hình SEM.

1. Phân biệt rõ ràng giữa biến quan sát và biến ẩn

Có 2 nhóm biến được sử dụng phổ biến trong mô hình SEM là biến quan sát và biến ẩn (latent variables).

  • Biến quan sát (observed variables) là các biến mà bạn có thể tiến hành thu thập giá trị và nhập vào file dữ liệu. Biến quan sát còn được gọi là biến trực quan (manifest variables). Biến quan sát có thể là biến danh mục (categorical), thứ tự (ordinal) hoặc biến liên tục (continuous), nhưng tất cả các biến ẩn (latent variables) trong mô hình SEM là biến liên tục. có những kỹ thuật thống kê khác để phân tích các mô hình với biến ẩn dạng danh mục, nhưng SEM chỉ xử lý với các biến ẩn dạng liên tục (Kline, 2011).
  • Biến ẩn (latent variables) trong mô hình SEM thông thường đi kèm với các khái niệm giả thuyết (hypothetical constructs) hoặc còn gọi là nhân tố (factors) là các biến giải thích được sử dụng để phản ánh các tác động không quan sát được (Kline, 2011). Một ví dụ liên quan đến biến ẩn là khái niệm sự thông minh. Biến ẩn (Latent variables) là các khái niệm lý thuyết hoặc giả thuyết (theorical or hypothetical constructs) quan trọng trong nhiều ngành khoa học, nó được xem như là biến nhưng không quan sát hoặc đo lường trực quan được. Thông thường, không có một phương pháp đo lường trực tiếp các biến ẩn hoặc một phương pháp chính xác để đánh giá nó (Raykov, T., & Gorge, S.A, 2006). Không có một định nghĩa duy nhất, cụ thể chắc chắn nào về sự thông minh. Thay vào đó, các nhà nghiên cứu sử dụng nhiều biến quan sát khác nhau, chẳng hạn như ngôn ngữ lời nói, trí nhớ,… để đại diện cho sự thông minh.