Kiểm định giả thuyết được thực hiện bằng phân tích thống kê. Ý nghĩa thống kê được tính toán bằng cách sử dụng giá trị p, cho biết mức độ xác suất của các kết quả nghiên cứu, với điều kiện là một số phát biểu nhất định (giả thuyết bằng không) là đúng. Nếu giá trị p nhỏ hơn mức ý nghĩa xác định trước (nói chung là 0,05), nhà nghiên cứu có thể kết luận rằng giả thuyết vô hiệu là không đúng và chấp nhận giả thuyết thay thế. Sử dụng phép thử t đơn giản, bạn có thể tính giá trị p và xác định mức ý nghĩa giữa hai bộ dữ liệu khác nhau.
Bươc chân
Phần 1/3: Thiết lập thử nghiệm
Bước 1. Thiết lập giả thuyết
Bước đầu tiên trong phân tích ý nghĩa thống kê là xác định câu hỏi nghiên cứu bạn muốn trả lời và hình thành giả thuyết của bạn. Giả thuyết là một tuyên bố về dữ liệu thử nghiệm của bạn và giải thích những khác biệt có thể có trong dân số nghiên cứu. Đối với mỗi thí nghiệm, một giả thuyết vô hiệu và một giả thuyết thay thế phải được thiết lập. Nói chung, bạn sẽ so sánh hai nhóm để xem chúng giống nhau hay khác nhau.
- Giả thuyết vô hiệu (H0) thường nói rằng không có sự khác biệt giữa hai tập dữ liệu. Ví dụ: nhóm sinh viên đọc tài liệu trước khi giờ học bắt đầu không đạt điểm cao hơn nhóm không đọc tài liệu.
- Giả thuyết thay thế (HMột) là một tuyên bố mâu thuẫn với giả thuyết không và giả thuyết mà bạn đang cố gắng hỗ trợ bằng dữ liệu thực nghiệm. Ví dụ: nhóm sinh viên đọc tài liệu trước khi đến lớp đạt điểm cao hơn nhóm không đọc tài liệu.
Bước 2. Giới hạn mức độ quan trọng để xác định mức độ độc đáo của dữ liệu để nó được coi là quan trọng
Mức ý nghĩa (alpha) là ngưỡng được sử dụng để xác định mức ý nghĩa. Nếu giá trị p nhỏ hơn hoặc bằng mức ý nghĩa, dữ liệu được coi là có ý nghĩa thống kê.
- Theo nguyên tắc chung, mức ý nghĩa (alpha) được đặt là 0,05, nghĩa là xác suất cả hai nhóm dữ liệu bằng nhau chỉ là 5%.
- Bằng cách sử dụng mức độ tin cậy cao hơn (giá trị p thấp hơn) có nghĩa là kết quả thực nghiệm sẽ được coi là có ý nghĩa hơn.
- Nếu bạn muốn tăng mức độ tin cậy của dữ liệu, hãy giảm giá trị p xuống 0,01. Giá trị p thấp hơn thường được sử dụng trong sản xuất khi phát hiện lỗi sản phẩm. Mức độ tin cậy cao là điều cần thiết để đảm bảo rằng mọi bộ phận được sản xuất đều thực hiện được chức năng của nó.
- Đối với các thí nghiệm kiểm định giả thuyết, mức ý nghĩa 0,05 có thể chấp nhận được.
Bước 3. Quyết định sử dụng bài kiểm tra một bên hoặc một bài kiểm tra hai bên
Một trong những giả định được sử dụng khi bạn thực hiện kiểm tra t là dữ liệu của bạn được phân phối bình thường. Dữ liệu được phân phối bình thường sẽ tạo thành một đường cong hình chuông với hầu hết dữ liệu nằm ở giữa đường cong. Kiểm tra t là một bài kiểm tra toán học được sử dụng để xem liệu dữ liệu của bạn có nằm ngoài phân phối chuẩn, bên dưới hoặc phía trên "đuôi" của đường cong hay không.
- Nếu bạn không chắc dữ liệu của mình nằm dưới hoặc cao hơn nhóm kiểm soát, hãy sử dụng kiểm tra hai phía. Thử nghiệm này sẽ kiểm tra ý nghĩa của cả hai hướng.
- Nếu bạn biết hướng của xu hướng dữ liệu của mình, hãy sử dụng kiểm tra một phía. Sử dụng ví dụ trước, bạn mong đợi rằng điểm của học sinh sẽ tăng lên. Do đó, bạn nên sử dụng bài kiểm tra một bên.
Bước 4. Xác định kích thước mẫu bằng phân tích công suất thống kê thử nghiệm
Sức mạnh của thống kê thử nghiệm là xác suất mà một thử nghiệm thống kê nhất định có thể cho kết quả chính xác, với một cỡ mẫu nhất định. Ngưỡng công suất thử nghiệm (hoặc) là 80%. Việc phân tích độ mạnh của một bài kiểm tra thống kê có thể phức tạp nếu không có dữ liệu sơ bộ vì bạn sẽ cần thông tin về giá trị trung bình ước tính của mỗi tập dữ liệu và độ lệch chuẩn của nó. Sử dụng máy tính phân tích công suất kiểm tra thống kê trực tuyến để xác định kích thước mẫu tối ưu cho dữ liệu của bạn.
- Các nhà nghiên cứu thường tiến hành các nghiên cứu thử nghiệm như một tài liệu để phân tích độ bền kiểm tra thống kê và là cơ sở để xác định kích thước mẫu cần thiết cho các nghiên cứu lớn hơn và toàn diện hơn.
- Nếu bạn không có đủ nguồn lực để thực hiện một nghiên cứu thử nghiệm, hãy ước tính giá trị trung bình dựa trên tài liệu và các nghiên cứu khác đã được thực hiện. Phương pháp này sẽ cung cấp thông tin để xác định cỡ mẫu.
Phần 2/3: Tính độ lệch chuẩn
Bước 1. Sử dụng công thức độ lệch chuẩn
Độ lệch chuẩn (còn được gọi là độ lệch chuẩn) là thước đo phân phối dữ liệu của bạn. Độ lệch chuẩn cung cấp thông tin về mức độ giống nhau của từng điểm dữ liệu trong mẫu của bạn. Lúc đầu, phương trình độ lệch chuẩn có vẻ phức tạp, nhưng các bước dưới đây sẽ giúp ích cho quá trình tính toán của bạn. Công thức độ lệch chuẩn là s = ((xtôi -)2/ (N - 1)).
- s là độ lệch chuẩn.
- nghĩa là bạn phải cộng tất cả các giá trị mẫu mà bạn đã thu thập được.
- NStôi đại diện cho tất cả các giá trị riêng lẻ của các điểm dữ liệu của bạn.
- là giá trị trung bình của dữ liệu cho mỗi nhóm.
- N là số lượng mẫu của bạn.
Bước 2. Tính giá trị trung bình của mẫu trong mỗi nhóm
Để tính độ lệch chuẩn, trước tiên bạn phải tính giá trị trung bình mẫu trong mỗi tập dữ liệu. Giá trị trung bình được biểu thị bằng chữ cái Hy Lạp mu hoặc. Để thực hiện việc này, hãy cộng tất cả các giá trị điểm dữ liệu mẫu và chia cho số lượng mẫu của bạn.
- Ví dụ, để lấy điểm trung bình của nhóm sinh viên đọc tài liệu trước khi đến lớp, chúng ta hãy xem dữ liệu mẫu. Để đơn giản, chúng ta sẽ sử dụng 5 điểm dữ liệu: 90, 91, 85, 83 và 94.
- Cộng tất cả các giá trị mẫu: 90 + 91 + 85 + 83 + 94 = 443.
- Chia cho số mẫu, N = 5: 443/5 = 88, 6.
- Điểm trung bình của nhóm này là 88. 6.
Bước 3. Lấy giá trị trung bình trừ mỗi giá trị điểm dữ liệu mẫu
Bước thứ hai là hoàn thành phần (xtôi -) phương trình. Lấy giá trị trung bình được tính trước trừ từng giá trị điểm dữ liệu mẫu. Tiếp tục ví dụ trước, bạn phải thực hiện năm phép trừ.
- (90 - 88, 6), (91- 88, 6), (85 - 88, 6), (83 - 88, 6) và (94 - 88, 6).
- Các giá trị thu được là 1, 4, 2, 4, -3, 6, -5, 6 và 5, 4.
Bước 4. Bình phương mỗi giá trị đã nhận được và cộng tất cả chúng
Bình phương mỗi giá trị bạn vừa tính toán. Bước này sẽ loại bỏ bất kỳ số âm nào. Nếu có giá trị âm sau khi bước này được thực hiện hoặc thời gian sau khi tất cả các phép tính đã được thực hiện, bạn có thể đã quên bước này.
- Sử dụng ví dụ trước, chúng tôi nhận được các giá trị 1, 96, 5, 76, 12, 96, 31, 36 và 29,16.
- Cộng tất cả các giá trị: 1, 96 + 5, 76 + 12, 96 + 31, 36 + 29, 16 = 81, 2.
Bước 5. Chia cho số mẫu trừ đi 1
Công thức biểu thị N - 1 là một điều chỉnh vì bạn không tính toàn bộ dân số; Bạn chỉ lấy một mẫu dân số để ước tính.
- Trừ: N - 1 = 5 - 1 = 4
- Chia: 81, 2/4 = 20, 3
Bước 6. Tính căn bậc hai
Sau khi bạn chia cho số mẫu trừ đi một, hãy tính căn bậc hai của giá trị cuối cùng. Đây là bước cuối cùng để tính độ lệch chuẩn. Có một số chương trình thống kê có thể tính toán độ lệch chuẩn sau khi bạn đã nhập dữ liệu thô.
Ví dụ, độ lệch chuẩn của điểm số của nhóm sinh viên đọc tài liệu trước khi lớp học bắt đầu là: s = √20, 3 = 4, 51
Phần 3/3: Xác định Tầm quan trọng
Bước 1. Tính phương sai giữa hai nhóm mẫu
Trong ví dụ trước, chúng tôi chỉ tính toán độ lệch chuẩn của một nhóm. Nếu bạn muốn so sánh hai nhóm, bạn nên có dữ liệu từ hai nhóm. Tính độ lệch chuẩn của nhóm thứ hai và sử dụng kết quả để tính phương sai giữa hai nhóm trong thí nghiệm. Công thức cho phương sai là sNS = ((s1/N1) + (s2/N2)).
- NSNS là phương sai giữa các nhóm.
- NS1 là độ lệch chuẩn của nhóm 1 và N1 là số lượng mẫu trong nhóm 1.
- NS2 là độ lệch chuẩn của nhóm 2 và N2 là số lượng mẫu trong nhóm 2.
-
Ví dụ, dữ liệu từ nhóm 2 (sinh viên không đọc tài liệu trước khi lớp học bắt đầu) có kích thước mẫu là 5 với độ lệch chuẩn là 5,81. Sau đó, biến thể:
- NSNS = ((s1)2/N1) + ((s2)2/N2))
- NSNS = √(((4.51)2/5) + ((5.81)2/5)) = √((20.34/5) + (33, 76/5)) = √(4, 07 + 6, 75) = √10, 82 = 3, 29.
Bước 2. Tính toán giá trị kiểm tra t của dữ liệu của bạn
Giá trị t-test sẽ cho phép bạn so sánh một nhóm dữ liệu này với một nhóm dữ liệu khác. Giá trị t cho phép bạn thực hiện phép thử t để xác định xác suất mà hai nhóm dữ liệu được so sánh là khác nhau đáng kể. Công thức cho giá trị của t là: t = (µ1 -2)/NSNS.
- ️1 là giá trị trung bình của nhóm đầu tiên.
- ️2 là giá trị trung bình của nhóm thứ hai.
- NSNS là phương sai giữa hai mẫu.
- Sử dụng giá trị trung bình lớn hơn như1 để bạn không nhận được các giá trị âm.
- Ví dụ, điểm trung bình của nhóm 2 (học sinh không đọc) là 80. Giá trị t là: t = (µ1 -2)/NSNS = (88, 6 – 80)/3, 29 = 2, 61.
Bước 3. Xác định bậc tự do của mẫu
Khi sử dụng giá trị t, bậc tự do được xác định bởi kích thước của mẫu. Cộng số lượng mẫu từ mỗi nhóm rồi trừ hai. Ví dụ, bậc tự do (d.f.) là 8 vì có năm mẫu trong nhóm đầu tiên và năm mẫu trong nhóm thứ hai ((5 + 5) - 2 = 8).
Bước 4. Sử dụng Bảng t để xác định mức ý nghĩa
Bảng giá trị t và bậc tự do có thể tìm thấy trong sách thống kê tiêu chuẩn hoặc trực tuyến. Nhìn vào hàng hiển thị bậc tự do bạn đã chọn cho dữ liệu của mình và tìm giá trị p thích hợp cho giá trị t thu được từ các tính toán của bạn.
Với bậc tự do 8 d.f. và giá trị t là 2,61, giá trị p cho phép thử một phía là từ 0,01 đến 0,025. Vì chúng tôi sử dụng mức ý nghĩa nhỏ hơn hoặc bằng 0,05, nên dữ liệu chúng tôi sử dụng chứng minh rằng hai nhóm dữ liệu là có ý nghĩa khác nhau. Với dữ liệu này, chúng ta có thể bác bỏ giả thuyết vô hiệu và chấp nhận giả thuyết thay thế: nhóm sinh viên đọc tài liệu trước khi bắt đầu tiết học đạt điểm cao hơn nhóm sinh viên không đọc tài liệu
Bước 5. Xem xét thực hiện một nghiên cứu tiếp theo
Nhiều nhà nghiên cứu thực hiện các nghiên cứu thí điểm nhỏ để giúp họ hiểu cách thiết kế các nghiên cứu lớn hơn. Thực hiện các nghiên cứu sâu hơn với nhiều phép đo hơn sẽ giúp bạn tự tin hơn vào kết luận của mình.