Trong nghiên cứu có bao giờ bạn gặp phải việc mình “quá dư dả” với quá nhiều thông tin thu thập được, quá nhiều biến số (thậm chí số biến còn nhiều hơn số quan sát)? Những bạn gặp rồi thì ắt hẳn “vò đầu bứt tóc” suy nghĩ nên sử dụng thông tin nào, biến nào được sử dụng và biến nào phải loại bỏ khỏi mô hình. Còn bạn thì sao? Trường hợp “dư dả” này ngày càng phổ biến trong kỷ nguyên dữ liệu lớn ngày hôm nay. Và bạn sẽ giải quyết vấn đề này như thế nào? May mắn là Stata 16 có …