Chuyển dạng số liệu

Một phần của tài liệu Phương pháp nghiên cứu khoa học trong nuôi trồng thủy sản (Trang 59 - 61)

100 L, thay nước % mỗi ngàỵ Tổng cộng có 36 con tơm Sú mẹ và 52 con tôm Mũ ni ñỏ ñược sử dụng cho nghiên cứu nàỵ Khi cho tôm ăn, người nghiên cứu cho vào mỗi bể một miếng mực tươi và một con nghêụ Sau

3.5.2 Chuyển dạng số liệu

Chuyển dạng số liệu là một phần hết sức quan trọng trong xử lý số liệụ Chuyển dạng số liệu có thể giúp làm cho:

• số liệu có phân phối chuẩn

• tăng tính đồng nhất của phương sai giữa các nghiệm thức hoặc nhóm cần so sánh

• giảm thiểu ảnh hưởng của các số liệu bất thường (quá cao hoặc quá thấp so với các số liệu cịn lại)

• cải thiện độ tuyến tính khi phân tích hồi qui

ðiều kiện cần đảm bảo là sau khi ñược chuyển dạng, thứ tự cao thấp của các số liệu vẫn khơng thanh đổi như khi dùng ñơn vị gốc. Ta chỉ chuyển dạng số liệu nếu thực sự cần thiết. Sau khi chuyển dạng xong phải kiểm tra xem hiệu quả ra saọ Với phân tích phương sai, nếu kiểm ñịnh Cochran cho kết quả có ý nghĩa (P < 0,05), thì tiến hành chuyển dạng số liệụ Sau đó dùng kiểm ñịnh Cochran kiểm tra lạị Nếu kết quả của kiểm định là khơng có ý nghĩa (P > 0,05), triển khai phân tích phương sai với số liệu ở dạng đã chuyển đổị Có 3 cách chuyển dạng số liệu chính thường dùng trong nghiên cứu sinh học, được sắp xếp theo thứ tự quan trọng là:

Power-transformation: là dạng hữu dụng nhất trong sinh học. Nó chuyển số liệu từ (x) thành (xp) với p > 0. Với các số liệu là số ñếm tần suất quan sát (có phân phối Poisson’s, phương

sai phụ thuộc vào giá trị trung bình - khi giá trị trung bình khác nhau, phương sai sẽ khác nhau) hoặc có phân phối lệch phải dùng p = ½ (tức là chuyển x thành căn bậc hai của x). Nếu có số liệu bằng zero thì cộng thêm một hằng số nữa (thường là 1) khi chuyển dạng. Khi đó x sẽ chuyển thành (x+1)½. Nếu số liệu có phân phối quá lệch, giảm giá trị p xuống còn 0,33 (căn bậc 3) hoặc 0,25 (căn bậc 4).

Log-transformation: dùng cho số liệu dạng cường độ, hàm lượng hoặc tỉ lệ. Thông thường

với số liệu dạng này khi giá trị trung bình lớn, phương sai cũng rất lớn và có phân phối dạng log-normally (tức là khi chuyển sang dạng logarithm thì số liệu sẽ có phân phối chuẩn). Ví dụ như số mồi một con cá bắt trung bình trong ngày (tổng số con mồi dùng chia cho tổng số cá) hay sức sinh sản tương ñối (số trứng ñếm ñược chia cho khối lượng thân. Cả số trứng và khối lượng thân ñều là 2 biến nghiên cứu). Ta có thể phát hiện bằng cách vẽ đồ thị tương quan giữa ñộ lệch chuẩn và giá trị trung bình của từng mẫụ Nếu là tương quan tuyến tính thì chuyển dạng log sẽ làm mất tương quan này đi và nhờ đó loại bỏ bất ñồng về phương saị Khi chuyển dạng có thể dùng bất cứ cơ số nào của log (10 hay 2,16), khơng ảnh hưởng đến kết quả. Tuy nhiên, trong báo cáo phải nêu rõ ñể người ñọc biết trong trường hợp muốn so sánh với các kết quả khác. Khi trong các số liệu có giá trị zero, ta phải cộng thêm hằng số khi chuyển dạng (có thể là 1 hoặc 0,1). Nếu giá trị của các quan sát lớn hơn 10 ñơn vị ño ñạc, dùng hằng số 1. Nếu một số nhỏ hơn 0,1 trong khi số cịn lại lớn hơn 1 thì nên chỉ thêm 0,1 mà thơi vì nếu thêm 1 thì khác biệt giữa các số liệu sẽ rất lớn vì các số liệu có giá trị nhỏ bị ảnh hưởng nhiều hơn.

Arcsin-transformation: áp dụng với số liệu dạng tỉ lệ phần trăm. Các số liệu dạng tỉ lệ phần

trăm có phân phối binominal. Phương sai của tỉ lệ trên dưới 50% lớn hơn nhiều so với các số liệu có tỉ lệ gần 10% và 90%. Ta chuyển số liệu từ (x) sang thành arcsin( x ), tức là góc có số đo bằng x. Trong nghiên cứu về NTTS, các số liệu dạng phần trăm tương ñối nhiều, ví dụ như tỉ lệ sống của tơm cá, tỉ lệ chết khi áp dụng liệu pháp sốc ñể kiểm tra chất lượng tôm cá giống, tỉ lệ thành thục, tỉ lệ đẻ trứng v.v.

Khi phân tích phương sai, trong một số trường hợp khi transform cũng không loại bỏ ñược bất ñồng giữa các phương sai (heterogeneity). Nếu thí nghiệm tương đối lớn (≥ 5 nghiệm thức) với số lần lặp lại cao (≥ 6) và bằng nhau thì cứ dùng ANOVA (Underwood 2005). Với kích thước mẫu lớn, khả năng toàn bộ quan sát dồn hết về một ñầu của phân phối là thấp và sự khác biệt của 1

nghiệm thức so với các nghiệm thức khác sẽ không ảnh hưởng nhiều ñến ước lượng MS trong từng nghiệm thức. Nếu qui mơ thí nghiệm nhỏ, số lần lặp lại khơng nhiều thì thử dùng ANOVẠ Nếu kết quả là khơng có khác biệt (chấp nhận H0) thì tốt. Bạn đã kết luận đúng vì bất đồng giữa các phương sai làm gia tăng sai lầm loại I (bác bỏ giả thuyết ñúng). Nhưng nếu kết quả cho phép bác bỏ giả thuyết H0 thì chỉ nên sử dụng kết quả nghiên cứu vừa thu ñược ñể tham khảo và tiến hành lại thí nghiệm với qui mơ lớn hơn, thực hiện một cách tỉ mỉ hơn (nhằm loại trừ mọi sai số có thể).

Một phần của tài liệu Phương pháp nghiên cứu khoa học trong nuôi trồng thủy sản (Trang 59 - 61)

Tải bản đầy đủ (PDF)

(93 trang)