100 L, thay nước % mỗi ngàỵ Tổng cộng có 36 con tơm Sú mẹ và 52 con tôm Mũ ni ñỏ ñược sử dụng cho nghiên cứu nàỵ Khi cho tôm ăn, người nghiên cứu cho vào mỗi bể một miếng mực tươi và một con nghêụ Sau
3.4.4 So sánh trung bình mẫu bằng kiểm ñịnh tham số
Người làm nghiên cứu thường hay muốn so sánh giá trị trung bình của các tổng thể khác nhaụ Tiến trình so sánh này gồm có 2 cơng ựoạn. đầu tiên ta xem sự khác biệt này có ý nghĩa hay khơng? Sau đó, nếu khác biệt có ý nghĩa, thì xác định mức ý nghĩa là bao nhiêủ Kiểm ựịnh có thể là tham số (so sánh giá trị trung bình dựa trên số liệu thực) hoặc phi tham số (so sánh trung vị bằng cách chuyển số liệu thực sang dạng thứ hạng). Giả thuyết H0 và ựối thuyết H1 cho cả hai loại kiểm ựịnh là như nhau:
Ớ Ho: khác biệt quan sát ựược ựơn thuần là do sai số thu mẫụ Trung bình của các tổng thể này khơng khác nhaụ
Ớ H1: khác biệt có ý nghĩa và khơng phải hồn tồn do sai số thu mẫụ Trung bình của các tổng thể này khác nhaụ
Như ựã ựề cập ở mục 3.6, ta chỉ nên sử dụng kiểm ựịnh phi tham số khi không thể sử dụng kiểm ựịnh tham số. Các giả ựịnh chung cần phải ựược thoả mãn nếu muốn sử dụng kiểm ựịnh tham số là:
Ớ số liệu thuộc dạng có hiệu số (interval) hoặc tỉ số (ratio)
Ớ có phân phối chuẩn (lưu ý chuyển dạng có thể chuẩn hóa phân phối)
Ớ có phương sai ựồng nhất. Nếu không ựảm bảo ựiều này, không dùng kiểm ựịnh ựược bởi vì Ho là: trung bình và phương sai của 2 mẫu bằng nhaụ
Giả ựịnh ựầu tiên cho thấy nếu số liệu là số ựếm thuộc dạng ựịnh danh (nominal) hoặc thuộc dạng thứ hạng (ordinal) thì kiểm ựịnh tham số khơng phải là lựa chọn. Vì thế sẽ phải sử dụng kiểm ựịnh phi tham số. Bạn có thể ựọc thêm về các kiểm ựịnh phi tham số như: Mann-Whitney U-test với số liệu không phải dạng cặp hoặc Wicolxon cho số liệu dạng cặp hay Kruskal Wallis khi số tổng thể cần so sánh lớn hơn 2 từ Fowler et al. (2002) và xem cách gọi các kiểm ựịnh này trên phần mềm thống kê SPSS từ Kinnear & Gray (2004).
để so sánh trung bình của các tổng thể, tuỳ theo thiết kế thắ nghiệm mà ta có thể sử dụng một trong những kiểm ựịnh tham số saụ Nếu số lượng tổng thể cần so sánh là 2:
Ớ z-test nếu kắch thước mẫu n > 30 Ớ t-test nếu kắch thước mẫu n ≤ 30
Ớ ANOVA
Khi số lượng tổng thể cần so sánh bằng 3 hoặc nhiều hơn, dùng ANOVẠ Bạn sẽ phạm phải sai lầm lớn nếu sử dụng t-test nhiều lần ựể so sánh từng cặp một. đơn giản là với mỗi một phép so sánh, bạn sẽ phải chấp nhận một xác suất ựể chấp nhận một giả thuyết sai là 0,05 (với mức có ý nghĩa 0,05). Thực hiện t-test càng nhiều lần, xác suất chấp nhận giả thuyết sai chung càng lớn. đó
chắnh là lý do hình thành của phương pháp phân tắch phương sai Ờ ANOVA nhằm hạn chế tối ựa sai lầm này bằng một phép so sánh chung tất cả các tổng thể với nhaụ
để biết phương sai của 2 mẫu có khác nhau nhiều không ta dùng kiểm ựịnh F. Trước hết tắnh tắnh phương sai của 2 mẫụ Sau đó tắnh F = (phương sai lớn hơn)/(phương sai nhỏ hơn). Tra phụ lục 8 với df là (n1 Ờ1) và (n2 Ờ1) và P = 0,05. Nếu nhỏ hơn giá trị F trong bảng thì tiến hành kiểm ựịnh.
Kiểm tra số liệu bằng biểu ựồ histogram sẽ giúp ta nhanh chóng xác ựịnh xem số liệu có phân phối chuẩn hay khơng. Tiếp theo, tắnh giá trị trung bình (ộ) và ựộ lệch chuẩn (S.D.). Nếu 67% số liệu nằm trong khoảng ộ ổ 2S.D. thì có thể khẳng ựịnh phân phối chuẩn của số liệụ Nếu giả ựịnh này khơng được thoả mãn thì ta chuyển số liệu sang dạng căn bậc hai, logarithm hoặc arcsinẹ Trong ựa số trường hợp sau khi chuyển dạng (transform) số liệu sẽ có phân phối chuẩn hoặc tương ựối chuẩn. Nếu hai giả ựịnh trên khơng ựược thỏa mãn thì sử dụng kiểm ựịnh phi tham số Mann- Whitney U-test.
Các kiểm ựịnh t-test và z-test ựều rất ựơn giản, có thể thực hiện mà không cần ựến sự hỗ trợ của máy tắnh và sẽ khơng được ựề cập ựến trong tài liệu nàỵ Khi sử dụng kiểm ựịnh t-test cần xác ựịnh số liệu có phải dạng cặp (paired) hay khơng. Chẳng hạn như nếu ta muốn so sánh khối lượng thân của tôm Thẻ Penaeus merguiensis mẹ trước và sau khi tham gia sinh sản ựể xem tiêu hao năng lượng cho hoạt động này có ảnh hưởng ựến sinh trưởng của tơm khơng. Trước mùa sinh sản, ta bắt ngẫu nhiên 100 con từ ao ni tơm mẹ có tất cả là 1.500 con, cân khối lượng thân của từng con một. Kết thúc mùa sinh sản, ta bắt ngẫu nhiên 100 con nữa, cân khối lượng của từng con. Nếu ta tiến hành so sánh giá trị trung bình của 2 lần ựo với cách thu mẫu như trên thì đây khơng phải là số liệu dạng cặp. Nhưng nếu ở lần ựo ựầu tiên ta ựánh dấu từng con một bằng số trước khi ựo và thả lại aọ Ở lần thứ hai ta tháo cạn ao bắt lại được 86 con (vì có 14 chết), cân từng con một thì ta có 86 cặp số liệụ So sánh sử dụng số liệu dạng cặp chắnh xác hơn.
Trong nghiên cứu NTTS, kiểm ựịnh t-test với số liệu dạng cặp rất hữu dụng vì kắch thước mẫu hay qui mơ thắ nghiệm thường khơng lớn. Ta có thể sử dụng t-test ựể so sánh giá trị ựo ựược trước và sau một sự kiện (xảy ra trong tự nhiên hoặc do dàn xếp trong ựiều kiện nhân tạo của người nghiên cứu). Vắ dụ như so sánh mật ựộ vi khuẩn Vibrio trong bể ương ấu trùng cua trước và sau khi ựưa một loại hoá dược vào ựể ựánh giá hiệu quả của loại hoá dược này; hay hàm lượng chất hữu cơ trong nước trước khi vào và khi ra khỏi bể xử lý ozone ựể ựánh giá hiệu quả xử lý nước của thiết bị này trong hệ thống nuôi tái sử dụng nước.
Tuy nhiên, nếu ta bố trắ thắ nghiệm ựơn giản chỉ với 2 nghiệm thức: một cho biện pháp kỹ thuật mới và một làm ựối chứng và sử dụng t-test để so sánh thì hiệu quả nghiên cứu thường không cao mặc dù thiết kế thắ nghiệm vàưphương pháp xử lý số liệu ựều ựúng. Lý do là thực tiễn phức tạp hơn nhiều, khơng phải chỉ có một ựiều kiện duy nhất khơng giống với nghiệm thức ựối chứng. Thiết kế thắ nghiệm theo kiểu này hạn chế khả năng ứng dụng của kết quả nghiên cứụ Underwood (2005) thậm chắ cịn hơi cực ựoan khi ựề nghị không nên sử dụng t-test.