Tin tức

Giới thiệu Stata

3.

Cú pháp lệnh trong Stata

Phần lớn các lệnh trên Stata sẽ 4 thành phần chính như varlists, if, options, và by. Cú pháp câu lệnh trên Stata có dạng tổng quát như sau:
[by varlist:] command [varlist] [if condition] [, options].

Varlists

Varlists cho phép bạn kiểm soát những biến nào (hoặc cột nào trong dữ liệu) nào sẽ sử dụng. Một varlist đơn giản là một danh sách các biến ngăn cách bởi kí tự khoảng trắng, theo sau câu lệnh.

Ví dụ: tại cửa sổ Commnad, gõ: list make. Câu lệnh này sẽ liệt kê các mẫu xe hơi được sản xuất trong năm 1978 (biến make). Cách khác, chúng ta thử gõ: list make price mpg. Lệnh này sẽ hiện thị các mẫu xe (make) cùng với giá (price) và mức tiêu hao nhiên liệu (mpg) của từng mẫu xe.

Hoặc như, chúng ta gõ: list make-mpg thì kết quả cũng tương tự lệnh trên. Điều này bởi vì dấu “-” đại diện cho tất cả các biến nằm giữa hai biến mà nó ngăn cách theo thứ tự sắp xếp hiển thị ở cửa sổ Variables. Hoặc chúng ta cũng có thể sử dụng các kí tự đại diện như * (đại diện cho bất từ hoặc kí tự nào), ? (chỉ đại diện 1 kí tự). Ví dụ m* sẽ đại diện cho make mpg hoặc x? sẽ đại diện cho x1, x2, x3 nhưng không đại diện cho x10.

If

Các điều kiện If cho phép chúng ta kiểm soát các quan sát (các dòng) được sử dụng trong câu lệnh. Một điều kiện if bao gồm từ khóa if và theo sau bởi các điều kiện (kết quả trả về là đúng hoặc sai), tất cả nằm sau varlist. Stata sẽ xem những điều kiện là đúng sẽ có giá trị bằng 1 và điều kiện sai sẽ có giá trị bằng 0.

Ví dụ: list make mpg if mpg==25. Lệnh này sẽ liệt kê những mẫu xe có mức tiêu hao nhiên liệu là 25 dặm một gallon.

Lưu ý, == trong câu lệnh trên là một phép so sánh với ý nghĩa là có phải là bằng, chứ không phải là phép gán. Nếu chúng ta gõ mpg=25, điều này có nghĩa gán biến mpg bằng một giá trị cố định là 25 (tất cả các quan sát dòng của biến này là 25).

Một số toán tử thường được sử dụng cùng với if

      • == Bằng
      • > Lớn hơn
      • < Nhỏ hơn >= Lớn hơn hoặc bằng
      • <= Nhỏ hơn hoặc bằng
      • != Không bằng (khác)

Điều kiện sau if có thể là sự kết hợp của nhiều biểu thức luận lý khác như and (&) hoặc or (|). Với and (&) thì cả 2 vế so sánh đều đúng thì trả về kết quả là đúng, ngược lại chỉ cần 1 vế sai thì kết quả trả về là sai. Ngược lại, với luận lý or (|) thì chỉ cần 1 vế đúng thì kết quả trả về là đúng và kết quả trả về chỉ sai khi cả 2 vế cùng sai.

Options

Tùy chọn (Options) kiểm soát cách mà một lệnh thực hiện, nó đặt sau dấu phẩy cuối câu lệnh. Chúng ta có thể đưa nhiều option vào câu lệnh. Một số option sẽ có thêm những thông số xác định, các thông số này được đặt trong dấu ngoặc đơn () sau option.

Ví dụ: xem sự khác biệt ở 2 câu lệnh có và không có tùy chọn nolabel bên dưới: list foreign hoặc list foreign, nolabel. Hoặc nếu muốn hiển thị tiêu đề dòng lặp lại sau mỗi 20 quan sát của tập dữ liệu, chúng ta có thể sử dụng câu lệnh: list make-mpg, header(20).

By

by được sử dụng để chạy từng lệnh một cho mỗi giá trị của nhóm (biến định danh). Chẳng hạn, liệt kê tách biệt các mẫu xe hơi nội địa và nước ngoài bằng cách: by foreign: list make foreign

Theo sau by có thể là một danh sách biến định danh và giá trị của các biến này cần phải được sắp xếp trước khi thực hiện câu lệnh. Ví dụ:
sort foreign rep78
by foreign rep78: list make

Thay vì thực hiện 2 lệnh cùng lúc như trên, Stata cho phép gộp chúng lại trong câu lệnh bysort: bysort foreign rep78: list make. Ở đây kết quả hiển thị theo các kết hợp theo thứ tự mẫu xe trong nước và số lần sửa chữa; trong trường hợp muốn hiển thị theo thứ tự số lần sửa chữa và xe trong nước thì chúng ta đảo thứ tự foreign rep78 thành rep78 foreign trong câu lệnh trên.

Lưu ý: mặc định thuật sắp xếp của Stata là không ổn định. Điều này có nghĩa là nó có thể thay đổi thứ tự của các quan sát. Chẳng hạn, nếu chúng ta có một tập dữ liệu bao gồm các thành viên trong một hộ, thực hiện lệnh sort có thể làm thay đổi thứ tự của các thành viên trong hộ. Nếu thứ tự các quan sát là quan trọng, thì chúng ta có thể bổ sung thêm tùy chọn stable sau câu lệnh sort. Khi đó, Stata sẽ chuyển sang thuật sắp xếp chậm hơn nhưng ổn định.

4.

Bộ 3 câu lệnh hữu ích trên Stata

Stata được cộng đồng học thuật sử dụng và hỗ trợ rất nhiều thông qua các công cụ lập sẵn (file ado). Các ado này có thể là các kiểm định thống kê, các thủ tục xử lý dữ liệu… nhằm tạo sự thuận tiện cho người phân tích. Đây là một ưu điểm rất lớn của Stata so với các chương trình thống kê khác. Các công cụ này sẽ được phát triển và cập nhật thường xuyên. Để liệt kê các ado được quan tâm nhiều nhất, bạn có thể sử dụng lệnh:  ssc hot, n(20). Ở đây n(20) chính là 20 công cụ ado được quan tâm nhiều nhất.

Để tải các công cụ này về máy, các bạn có thể sử dụng lệnh findit tên lệnh hoặc lệnh ssc install

Từ các công cụ ado (cũng có thể gọi là các câu lệnh), các bạn sẽ tìm hiểu cách sử dụng của các công cụ này hoặc một số câu lệnh mà bản thân chưa rõ qua lệnh help với cú pháp như sau: help tên lệnh

Ví dụ, để tìm hiểu cách sử dụng lệnh egen: help egen, khi đó, một cửa sổ bao gồm các hướng dẫn vắt tắt về cú pháp lệnh, các thông số, tùy chọn và kể cả các ví dụ minh họa sử dụng egen để các bạn có thể tham khảo.

Hoặc để hiểu tổng thể các hàm trong Stata, các bạn có thể sử dụng lệnh: help functions. Một cửa sổ liệt kê các hàm sẽ được hiển thị –> chọn một dạng hàm cần sử dụng. Mỗi hàm sẽ có các thông số (dòng):

  • Tên hàm, có dạng: abbrev(s,n) –> có 2 biến đầu vào s và n
  • Tập xác định của biến (Domain) –> cho biết kiểu và khoảng giá trị của biến
  • Miền giá trị của hàm (Range) –> cho biết kiểu và khoảng giá trị của hàm
  • Phần mô tả tổng quát của hàm (Description)

 

Trang trước 1 2
Xem thêm
Back to top button