Các đồ thị phân phối (Distribution plots) rất hữu ích trong việc mô tả dạng phân phối của dữ liệu. Thông thường các đồ thị phân phối được sử dụng để hỗ trợ các kiểm định về tính chất phân phối của biến, cũng như là tính chất phân phối của phần dư. Trong đó, tính chất phân phối chuẩn của biến/phần dư là một trong những tính chất phân phối quan trọng nhất. Bài viết sẽ trình bày 20 dạng đồ thị phân phối quan trong được sử dụng phổ biến trên phần mềm Stata như histogram, boxplot, kdensity…
Xem thêm ý nghĩa và công dụng của đồ thị histogram trên SPSS
Bảng tổng hợp 20 loại đồ thị phân phối quan trọng được thể hiện trong 3 cột gồm: cột đầu tiên chính là loại đồ thị, cột thứ 2 bao gồm dữ liệu được sử dụng minh họa cùng với câu lệnh thực hiện trên Stata, và cột cuối cùng là minh họa kết quả thực hiện.
Để dễ dàng áp dụng các loại đồ thị phân riêng và tất cả các dạng đồ thị khác nói chung trong nghiên cứu của mình, theo kinh nghiệm của bản thân, đầu tiên các bạn hình dung dạng đồ thị mong muốn của mình, kế tiếp tìm loại đồ thị gần giống nhất với đồ thị mình mong muốn (hình dạng, công dụng, kiểu biến…) và cuối cùng là copy và thay thế các biến trong câu lệnh tương ứng ở bảng bên dưới để thực hiện.
Loại đồ thị
Cú pháp lệnh/Diễn giải
Kết quả
Đồ thị mật độ histogram của biến liên tục
webuse sp500, clear
histogram open
Đồ thị tần suất histogram với đường phân phối
webuse sp500, clear
histogram open, frequency kdensity
Đồ thị tần suất histogram với đường cong phân phối chuẩn
webuse sp500, clear
histogram open, frequency normal
Đồ thị boxplot theo biến danh mục
webuse bplong, clear
graph box bp, over(agegrp)
Đồ thị boxplot của 2 biến liên tục
webuse bpwide, clear
graph box bp_before bp_after
Đồ thì boxplot của 2 biến liên tục ở các nhóm biến danh mục