Tải Stata 16 với nhiều tính năng mới
TẢI PHẦN MỀM STATA 16
Kể từ ngày 24/12/2019, với các tài khoản GOLD và PLATINUM đăng ký mới hoặc gia hạn sẽ được hỗ trợ TẢI phần mềm STATA MP 16 mới nhất.
Cứ mỗi hai năm một lần, Stata lại phát hành một phiên bản mới. Stata 16 là bản phát hành lớn nhất, mới nhất (2019) của Stata so với các phiên bản trước đó với nhiều tính năng mới nổi bật như:
1. Dự báo và lựa chọn mô hình với công cụ Lasso
Lasso (Least Absolute Shrinkge and Selection Operator) tạm dịch là toán tử thu nhỏ và chọn lọc tối thiểu (Tibshirani, 1996). Lasso được dùng để giải quyết vấn đề đa chiều trong các mô hình ước lượng (bên cạnh nhóm phương pháp giảm chiều như kỹ thuật phân tích thành phần chính PCA).
Công cụ Lasso trên Stata 16 được sử dụng rất linh hoạt, nhưng phần lớn là được sử dụng trong việc dự báo hoặc lựa chọn mô hình. Sử dụng chính Lasso để chọn các biến có thông tin thực về biến phụ thuộc của bạn. Tính phù hợp của Lasso được kiểm chứng qua mẫu Testing từ các biến được chọn ở mô hình Training.
Giả sử, bạn có 1 biến phụ thuộc y và 1000 biến giải thích từ x1-x1000. Bạn tin rằng trong số chúng sẽ có một tập biến tốt để dự báo y. Lasso cho phép bạn xác định tập biến này bằng cách:
. lasso linear y x1-x1000
Để xem danh sách biến được lựa chọn
. lassocoef
Để thực hiện dự báo với tập dữ liệu mới (testing), bạn nhập:
. use testing
. predict yhat
và xem độ phù hợp với dữ liệu mới này
. lassogof
Lasso cũng được áp dụng với các mô hình Logit, Probit hoặc Poisson
. lasso logit z x1-x1000
. lasso probit z x1-x1000
. lasso poisson c x1-x1000
Công cụ Lasso cũng được áp dụng với các mô hình elastic-net (cũng như hồi quy Ridge)
. elasticnet linear y x1-x1000
. elasticnet logit z x1-x1000
. elasticnet probit z x1-x1000
. elasticnet poisson c x1-x1000
Cũng như Square-root lasso
sqrtlasso y x1-x1000
Bạn cũng có thể bắt buộc Lasso lựa chọn cố định các biến, chẳng hạn x1-x4
lasso linear y (x1-x4) x5-x1000
Xem thêm: https://www.stata.com/new-in-stata/lasso/
2. Mô hình lựa chọn (Choice Models)
Mô hình lựa chọn là biệt ngữ dành riêng cho các mô hình hồi quy logit có điều kiện (conditional logit), logit hỗn hợp (mixed logit), probit đa bậc (multinomial probit) và các mô hình hồi quy xác suất khác. Trong đó, mỗi cá nhân đưa ra lựa chọn cụ thể từ các lựa chọn thay thế có sẵn dựa trên các đặc điểm quan sát thu thập được.
Trước Stata 16, tính phi tuyến và tương quan bổ sung trong hầu hết các mô hình lựa chọn khiến việc trả lời các câu hỏi trở nên khó khăn. Bạn có thể dễ dàng kiểm tra xem một biến tác động có ý nghĩa hay không nhưng không đo lường được tác động của nó đối với xác suất lựa chọn. Hoặc bạn chấp nhận câu trả lời cho các câu hỏi giới hạn hoặc bạn đưa ra giải pháp cho các câu hỏi cụ thể của mình và tính toán chúng bằng tay.
- Nhà hàng yêu thích của bạn giới thiệu một món gà mới?
- Điều đó ảnh hưởng thế nào đến nhu cầu cho các món gà khác, món thịt bò, cá khác?
Với Stata 16, tất cả những vấn đề nêu trên sẽ được giải quyết dễ dàng. Ngay cả với các mô hình phức tạp như probit bậc hoặc logit hỗn hợp, Stata 16 sẽ có công cụ giúp bạn trả lời tất cả. Bạn dễ dàng trả lời các câu hỏi như vậy, bao gồm cả việc tính toán các kiểm định, khoảng tin cậy.
Để bắt đầu với bất kì mô hình lựa chọn nào, bạn cần phải khai báo dữ liệu
. cmset id travelmode
Với các câu lệnh mới như cmsummarize, cmchoiceset, cmtab, và cmsample bạn có thể khai phá tốt hơn các đặc điểm dữ liệu của các biến
Các câu lệnh ước lượng các mô hình lựa chọn trên Stata 16 bắt đầu bằng tiền tố cm trước mỗi câu lệnh:
cmclogit conditional logit (McFadden’s choice) model
cmmixlogit mixed logit model
cmxtmixlogit panel-data mixed logit model
cmmprobit multinomial probit model
cmroprobit rank-ordered probit model
cmrologit rank-ordered logit model
Câu lệnh cmxtmixlogit cho phép ước lượng mô hình logit hỗn hợp trong dữ liệu bảng
Để giải thích kết quả trong các mô hình lựa chọn, Stata 16 cung cấp công cụ margin để trả lời các câu hỏi cụ thể dựa trên kết quả ước lượng. Chẳng hạn như xác suất lựa chọn du lịch bằng xe hơi thay đổi như thế nào nếu thu nhập của bạn tăng thêm 5 triệu đồng? Hay nếu thời gian chờ đợi tại sân bay tăng thêm 30 phút thì điều này ảnh hưởng đến việc lựa chọn từng phương thức vận chuyển như thế nào?
Xem thêm: https://www.stata.com/new-in-stata/choice-models/