Kiểm định giả thuyết thống kê
I. KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
Khi thực hiện một nghiên cứu định lượng (quantitative research), chúng ta phải cố gắng trả lời các câu hỏi nghiên cứu (research questions) hay các giả thuyết đặt ra. Một phương pháp đánh giá các giả thuyết này thông qua một thủ tục được gọi là kiểm định giả thuyết (hypothesis testing) mà đôi khi còn được gọi là kiểm định ý nghĩa thống kê (significance testing).
Ví dụ: hai giáo viên môn thống kê, Tom và Jerry, đều muốn sử dụng phương pháp tốt nhất để giảng dạy cho sinh viên của mình. Mỗi giáo viên giảng dạy một lớp gồm 50 sinh viên. Trong lớp của Tom, các sinh viên phải thực hiện một bài tiểu luận bên cạnh việc tiếp thu trên lớp. Tom nghĩ rằng việc làm tiểu luận là phương pháp dạy quan trọng trong môn thống kê, trong khi Jerry tin tưởng rằng sẽ tốt hơn nếu sinh viên tập trung lắng nghe tiếp thu trên lớp. Đây là năm đầu tiên mà Tom cho sinh viên làm tiểu luận, và cô ta mong muốn việc làm tiểu luận sẽ giúp sinh viên nâng cao hiệu quả học tập.
Bước đầu tiên của kiểm định giả thuyết là thiết lập giả thuyết nghiên cứu (research hypotheses).
Ở trường hợp của Tom và Jerry, mục đích là xem xét tác động của hai phương pháp giảng dạy khác nhau: tiếp thu trên lớp + làm tiểu luận (Tom) và tập trung tiếp thu trên lớp (Jerry) lên hiệu quả học tập của 50 sinh viên. Cụ thể hơn là họ muốn xác định xem hiệu quả của 2 lớp theo 2 phương pháp giảng dạy có sự khác nhau hay không. Và việc thêm phần tiểu luận có giúp sinh viên của Tom nâng cao hiệu quả học tập so với lớp của Jerry hay không.
Điều này dẫn đến giả thuyết nghiên cứu như sau:
Khi sinh viên thực hiện tiểu luận cộng với nghe giảng thì hiệu quả học tập sẽ gia tăng
Trước khi bước qua bước 2 của kiểm định giả thuyết, chúng ta cần ôn lại các khái niệm về mẫu, tổng thể để hiểu rõ lý do tại sao cần phải thực hiện kiểm định giả thuyết.
Mẫu (sample) và tổng thể (population)
Nếu bạn muốn đánh giá các đối tượng trong một nghiên cứu để biết được sự khác nhau giữa chúng (hay bất kì tác động nào khác), đơn giản bạn chỉ cần tóm tắt (summarize) dữ liệu mà bạn có. Chẳng hạn, nếu Tom và Jerry muốn biết phương pháp dạy nào là tốt hơn thì đơn giản họ chỉ cần so sánh điểm số trung bình của hai lớp họ dạy và kết luận phương pháp nào là tốt (phương pháp có điểm số trung bình cao hơn). Tuy nhiên, kết luận này sẽ bị hạn chế bởi nó chỉ đúng với số sinh viên trong lớp của họ. Ở khía cạnh khác, nếu những sinh viên này có thể đại diện cho tất cả sinh viên theo học môn thống kê trong chương trình thì kết luận trên sẽ có ảnh hưởng rộng hơn.
Theo thuật ngữ thống kê, các sinh viên trong nghiên cứu này được gọi là mẫu (sample) và nhóm lớn hơn mà họ đại diện được gọi là tổng thể (population). Với một mẫu cho trước đại diện cho một tổng thể, bạn có thể sử dụng kiểm định giả thuyết để xem xét liệu có bất kì sự khác biệt hoặc tác động trong nghiên cứu xuất hiện trong tổng thể.
Như vậy, bằng cách kiểm định giả thuyết, Tom và Jerry muốn tổng quát hóa phương pháp giảng dạy của họ ở mức tổng thể thay vì chỉ đối với 50 sinh viên trong lớp. Tuy nhiên, để thực hiện kiểm định giả thuyết bạn cần phải phát biểu lại giả thuyết nghiên cứu dưới dạng giả thuyết không (null hypothesis) và giả thuyết thay thế (alternative hypothesis).
II. QUY TRÌNH KIỂM ĐỊNH GIẢ THUYẾT THỐNG KÊ
- Xác định giả thuyết nghiên cứu.
- Giải thích ý nghĩa và cách đo lường các biến liên quan trong giả thuyết.
- Thiết lập các giả thuyết không và giả thuyết thay thế.
- Chọn một mức ý nghĩa thống kê (significance level).
- Thực hiện dự báo một hoặc hai đuôi (one or two-tailed prediction).
- Xác định dạng phân phối của biến trong tập dữ liệu có phải là phân phối chuẩn không.
- Lựa chọn kiểm định thống kê phù hợp dựa tùy thuộc vào dạng phân phối của biến.
- Thực hiện kiểm định thống kê trên tập dữ liệu và giải thích kết quả.
- Từ chối hay chấp nhận giả thuyết không.
Đây là một quy trình thông thường để thực hiện kiểm định giả thuyết thống kê. Do vậy, không nhất thiết áp dụng cứng nhắc trình tự 9 bước nêu trên. Tuy nhiên, 5 bước đầu được xem là cần thiết và quan trọng trong mỗi nghiên cứu học thuật. Quy trình kiểm định giả thuyết thống kê này chúng tôi sẽ lần lượt trình bày bên dưới.
1.Đo lường biến
Kết quả của phương pháp giảng dạy được đánh giá thông qua khái niệm “hiệu quả” học tập của các sinh viên trong lớp, nhưng “hiệu quả” được đo lường như thế nào? “Hiệu quả” có thể là điểm số các bài tập của sinh viên trong khóa học, hoặc có thể là số lần sinh viên viên trả lời đúng các câu hỏi trong lớp, hoặc là điểm thi của các sinh viên… Tất cả các biến trên đều có thể là những biến đại diện tốt cho khái niệm “hiệu quả” học tập của sinh viên. Trước khi tiến hành kiểm định giả thuyết, bạn cần phải chọn cho một một biến (hoặc tập hợp biến) đại diện tốt nhất cho biến cần đo lường của mình.
Có 3 lí do chính mà chúng ta cần phải làm rõ cách đo lường các biến:
- Thứ nhất, giúp người đọc sáng tỏ về những gì chúng ta đang nghiên cứu, tránh những nghi ngờ không đáng có từ phía người đọc. Đồng thời, điều này sẽ tạo điều kiện kế thừa tốt cho các nghiên cứu trong tương lai về vấn đề này.
- Thứ hai, trừ khi bạn là một chuyên gia nếu không bạn phải xác định bạn đang đo lường cái gì (trong trường hợp này là “hiệu quả”) và quyết định đo lường nó như thế nào.
- Thứ ba, đó là liên quan đến việc lựa chọn loại kiểm định thống kê nào để thực hiện. Bởi vì, kiểm định thống kê phụ thuộc rất nhiều vào kiểu biến mà bạn đo lường. Chẳng hạn, nếu biến “hiệu quả” được đo lường dưới dạng biến liên tục thang điểm từ 1 đến 100; dạng thứ tự với các thang điểm như 0 – 20, 21 – 40, 41 – 60, 61 – 80, và 81 – 100 hoặc các dạng thang đo khác thì các kiểm định được lựa chọn cũng sẽ khác nhau.
Trong ví dụ trên, chúng tôi chọn điểm bài thi là thang đo cho khái niệm “hiệu quả” học tập của sinh viên trong môn học thống kê, bởi 2 lí do.
- Thứ nhất, chúng tôi cảm thấy nhiệm vụ chính của Tom là cố gắng giúp sinh viên của cô ta đạt thứ hạng cao nhất có thể.
- Thứ hai, thông thường môn thống kê không có bài tập và thường kéo dài 2 giờ nên điểm bài thi được xem là thích hợp nhất.
Xác định biến
Bước tiếp theo là xác định các biến được sử dụng trong nghiên cứu.
Vì mục đích của nghiên cứu là xem xét ảnh hưởng của hai phương pháp giảng dạy khác lên hiệu quả (đại diện bởi điểm thi) của sinh viên học môn thống kê. Các biến được đo lường như sau:
- Biến phụ thuộc: điểm bài thi
- Biến độc lập: phương pháp dạy (tiểu luận + tiếp thu trên lớp với chỉ tiếp thu trên lớp)
Giả thuyết không và giả thuyết thay thế
Để thực hiện kiểm định giả thuyết, bạn cần thể hiện giả thuyết nghiên cứu dưới dạng giả thuyết không và giả thuyết thay thế. Giả thuyết không và giả thuyết thay thế là những phát biểu không tính đến sự khác biệt hoặc các ảnh hưởng xảy ra trong tổng thể. Bạn sẽ sử dụng số liệu mẫu để kiểm tra phát biểu nào là phù hợp nhất.
- Giả thuyết không thông thường là các giả thuyết phản biện. Nghĩa là, nó ngầm hiểu rằng chúng ta cố gắng chứng minh phát biểu này không xảy ra. Ở ví dụ này, giả thuyết không cho rằng không có sự khác nhau về kết quả trong 2 phương pháp giảng dạy.
- Giả thuyết thay thế phát biểu điều ngược lại, và thông thường đây là giả thuyết mà chúng ta muốn chứng minh nó xảy ra. Chẳng hạn, có sự khác nhau về kết quả theo 2 phương pháp giảng dạy.
Ban đầu, bạn có thể phát biểu những giả thuyết này dưới dạng tổng quát, đại khái như:
- Giả thuyết không (H0): Thực hiện tiểu luận không tác động đến hiệu quả học tập của sinh viên.
- Giả thuyết thay thế (HA): Thực hiện tiểu luận có tác động dương đến hiệu quả học tập của sinh viên.
Sau đó, tùy thuộc vào biến được chọn đo lường bạn có thể viết lại các giả thuyết dưới dạng cụ thể. Chẳng hạn như:
- Giả thuyết không (H0): Điểm trung bình của lớp theo phương pháp tiếp thu cùng với tham gia tiểu luận và lớp theo phương pháp chỉ tập trung tiếp thu trên lớp là giống nhau trong tổng thể.
- Giả thuyết không (HA): Điểm trung bình của lớp theo phương pháp tiếp thu cùng với tham gia tiểu luận và lớp theo phương pháp chỉ tập trung tiếp thu trên lớp là KHÔNG giống nhau trong tổng thể.
Bây giờ, bạn đã xác định được giả thuyết không và giả thuyết thay thế, bạn cần tìm các bằng chứng củng cố cho giả thuyết không hoặc giả thuyết thay thế. Chúng ta có thể thực hiện điều này với sự hỗ trợ của các lý thuyết thống kê.
4.Mức ý nghĩa thống kê (statistical significance)
Mức ý nghĩa thống kê thường được thể hiện dưới dạng giá trị p (p-value). Tùy thuộc vào loại kiểm định thống kê mà bạn chọn (thống kê t, thống kê F…), bạn sẽ tính toán mức xác suất (chẳng hạn, p-value) của các kết quả quan sát mẫu mà giả thuyết không là đúng.
Giả sử, bạn có một giá trị xác suất p-value là 0,03. Điều này có nghĩa rằng một xác suất 3% cho thấy có sự khác nhau giữa hai phương pháp. Tuy nhiên, bạn muốn biết mức xác suất này có ý nghĩa thống kê hay không.
Thông thường, nếu có một mức xác suất 5% hoặc ít hơn (5 trên 100 lần hoặc ít hơn) thì sự khác nhau trong điểm số trung bình giữa hai phương pháp là có ý nghĩa thống kê (bạn sẽ bác bỏ giả thuyết không và chấp nhận giả thuyết thay thế). Và ngược lại, nếu có một mức xác suất lớn hơn 5% thì bạn sẽ không thể bác bỏ giả thuyết không, cũng như không thể chấp nhận giả thuyết thay thế.
5.Có 3 mức ý nghĩa thường được sử dụng phổ biến là 1%, 5%, và 10%. Trong đó, mức ý nghĩa 5% thường được sử dụng hơn cả trong các nghiên cứu học thuật.
Dự báo một và hai đuôi
Khi chúng ta xem xét bác bỏ giả thuyết không và chấp nhận giả thuyết thay thế, chúng ta cần xem xét thêm đến chiều hướng của phát biểu giả thuyết thay thế. Chẳng hạn, giả thuyết thay thế (HA) là: việc tham gia thực hiện tiểu luận có tác động dương đến hiệu quả học tập của sinh viên. Giả thuyết này cho chúng ta thấy hai điều:
- (i) dự báo về tác động của biến độc lập lên biến phụ thuộc;
- (ii) chiều hướng của tác động này.
Trong ví dụ trên, Tom cho rằng việc kết hợp tiếp thu lắng nghe với thực hiện tiểu luận sẽ có tác động tích cực (dương) đến hiệu quả học tập của sinh viên. Đây chính là dự báo một đuôi.
Một dự báo hai đuôi sẽ không thực hiện việc xác định về chiều hướng của tác động. Nó chỉ đơn thuần là “có tác động” đến đối tượng.
Ví dụ, giả thuyết thay thế hai đuôi như sau: “tham gia thực hiện tiểu luận có tác động đến hiệu quả học tập của sinh viên”.
6.Chấp nhận và bác bỏ giả thuyết
Nếu kết quả phân tích thống kê ở mức ý nghĩa thống kê dưới các mức giới hạn (1%, 5% hay 10%) thì chúng ta bác bỏ giả thuyết không và chấp nhận giả thuyết thay thế. Và ngược lại, nếu kết quả phân tích có mức ý nghĩa thống kê trên các mức giới hạn thì chúng ta chưa thể bác bỏ giả thuyết không, cũng như không thể chấp nhận giả thuyết thay thế. Lưu ý trường hợp này chúng ta sẽ không chấp nhận giả thuyết không nhưng chưa có đủ chứng cứ để phản bác nó.
BÀN LUẬN
Như ta đã biết, có 3 mức ý nghĩa thường được sử dụng phổ biến trong các nghiên cứu định lượng là 1%, 5%, và 10%. Vậy khi nào ta nên sử dụng mức ý nghĩa 1%; 5% và 10%?
Ngoài ra, việc sử dụng các mức ý nghĩa này sẽ ảnh hưởng đến các vấn đề về dự báo như sai lầm loại I, sai lầm loại II như thế nào?