Phân tích tương quan

Một phần của tài liệu Phương pháp nghiên cứu khoa học trong nuôi trồng thủy sản (Trang 56 - 57)

v ới mức ý nghĩa α= 0,01 là 16,81) Ta có thể kết luận “Tần suất phân bố củ a 4 loài th ự c ậ t th ủ y sinh nghiên c ứ u có liên quan m ậ t thi ế t ớ i ñộ phú

3.4.6Phân tích tương quan

Trong tự nhiên cĩ rất nhiều biến cĩ quan hệ với nhaụ Tương quan chính là mối quan hệ, liên kết giữa hai biến (Fowler et al. 2002). Khi sự gia tăng của một biến xảy ra đồng thời với sự gia tăng của một biến khác: tương quan giữa 2 biến gọi là tương quan thuận (positive, direct). Ví dụ ở cá khi chiều dài thân cá tăng, khối lượng thân cũng tăng. Ngược lại, khi sự gia tăng của một biến xảy ra đồng thời với sự suy giảm của một biến khác: tương quan giữa 2 biến gọi là tương quan nghịch (negative, inverse). Ví dụ: tuổi cá càng lớn và tốc độ tăng trưởng tương đối càng nhỏ.

Lưu ý là tương quan khơng ngầm định một trong hai biến là nguyên nhân gây ra sự gia tăng hay suy giảm của biến kiạ Cả hai biến đều là biến độc lập so với nhaụ Trong thống kê, tương quan giữa 2 biến phải được định lượng dựa trên số liệu thuộc loại thứ hạng (ordinal) hoặc số liệu cĩ hiệu số (interval). Muốn xác định giữa 2 biến quan tâm cĩ tương quan khơng, ta thực hiện các bước sau:

(1)Vẽ biểu đồ đám mây (scattergram), xem xét và đưa ra một số phỏng đốn như: cĩ tương quan hay khơng? Nếu cĩ thì tương quan thuộc dạng nàỏ Mạnh hay yếủ

(2)Tính hệ số tương quan - r (correlation coefficient). Giá trị của r dao động từ - 1 (tương quan nghịch tuyệt đối) đến +1 (tương quan thuận tuyệt đối). Tương quan tuyệt đối hường khơng gặp nhiều trong sinh học. Càng gần ± 1, tương quan càng mạnh. Khi r = 0, khơng cĩ tương quan. Mức ý nghĩa của hệ số tương quan r như sau: rất yếu (|r| = 0,00 – 0,19), yếu (0,20 – 0,39), trung bình (0,40 – 0,69), mạnh (0,70 – 0,89) và rất mạnh (0,90 – 1,00).

(3)Tính hệ số xác định - r2 (coefficient of determination): bằng bình phương của hệ số tương quan. Hệ số này đo lường mức độ tác động của sự biến động của biến này đối với sự biến động biến kiạ Chẳng hạn như khi xem xét tương quan giữa kích thước của đá tai và khối lượng thân của cá, ta tính được r2

= 0,703. ðiều đĩ cĩ nghĩa là 29,7% biến động về khối lượng thân khơng phải do biến động về kích thước đá tai qui định. ðiều này là đúng vì khối lượng thân cịn phụ thuộc vào lượng thức ăn trong ruột cá, giai đoạn thành thục, v.v. Những biến này chẳng cĩ liên quan gì đến chiều dài đá tai cả. Nếu ta tìm tương quan giữa chiều dài đá tai và chiều dài thân, r2 ví dụ bằng 0,963. Khi đĩ 96,3% những thay đổi về chiều dài cĩ liên hệ trực tiếp đến thay đổi về chiều dài đá taị Khi r = +1 hoặc –1, cứ 1 đơn vị thay đổi của biến A sẽ tương đương với 1 thay đổi đơn vị của biến B.

Khi muốn xác định tương quan giữa 2 biến, kích thước mẫu rất quan trọng. Kích thước mẫu càng lớn, ước lượng tương quan càng chính xác. Lưu ý rằng tăng kích thước mẫu là để loại trừ sai số, giảm thiểu xác suất ước lượng một tương quan khơng cĩ thực do tình cờ hoặc sai sĩt khi nghiên cứụ Tăng kích thước mẫu khơng giúp biến khơng cĩ tương quan thành cĩ, hoặc tương quan yếu thành tương quan mạnh.

ðể xác định tương quan giữa 2 biến ta cĩ thể dùng kiểm định tham số hoặc phi tham số. Khi số liệu của một trong 2 biến nghiên cứu ở dưới dạng tỉ lệ, số đếm hoặc xếp hạng ta dùng kiểm định phi tham số Spearman Rank Coefficient Correlation rs. Cơng thức tính như sau:

rs = 1 -       − ∑ ) ( 6 3 2 n n d

với n: số lượng mẫu, d: khác biệt về thứ hạng và 6 là hằng số.

Kiểm định phi tham số này thích hợp với kích thước mẫu từ 7 ÷ 30. Trong phần mềm SPSS, ta cĩ thể gọi kiểm định này ở Analyze/Correlate/Bivariatẹ Nếu cĩ nhiều số liệu trùng nhau (tied rank, > 50%) thì kiểm định khơng chính xác.

Khi số liệu thuộc dạng cĩ hiệu số (interval) thì phải dùng kiểm định tham số với giả định là số liệu cĩ phân phối chuẩn. Cách đơn giản nhất để kiểm tra giả định này là kết hợp quan sát histogram với tính thử giá trị trung bình (µ) và độ lệch chuẩn (S.D.) xem cĩ đúng là 70% số liệu nằm trong khoảng x ± s khơng? Khi biểu diễn các số liệu dạng cặp này bằng scattergram, thì với số liệu cĩ phân phối chuẩn đám mây sẽ cĩ dạng trịn hoặc elip. Hệ số tương quan được tính như sau:

r = (nxy - xy)/√[nx2 – (x)2][ny2 – (y)2]

Khơng nên phân tích tương quan với số liệu dạng bimodal (phân phối cĩ 2 đỉnh) hoặc multimodal (phân phối cĩ nhiều đỉnh) mà phải tách riêng từng nhĩm rạ Tương quan ở đây là tương quan kiểu tuyến tính chứ khơng phải dạng đường cong. Số liệu dạng tỉ lệ hoặc số đếm sẽ được chuyển dạng (arcsine hoặc logarithm) trước khi tính tốn r. ðừng vội vàng kết luận biến này là nguyên nhân của biến kiạ Cĩ thể cĩ một hoặc một vài biến khác tác động lên 2 biến nàỵ Ví dụ như “tương quan” giữa hàm lượng oxy hịa tan và độ đục vơ cơ của nước ao phát hiện được là do một biến khác (mật độ cá chép thả nuơi) qui định. Lưu ý vấn đề quan trọng là nếu phát hiện tương quan giữa 2 biến thì người nghiên cứu phải tìm được cơ sở sinh học để giải thích tương quan nàỵ Tương tự như thế, khơng nên xem xét tương quan giữa 2 biến nếu khơng cĩ cơ sở nghi vấn về quan hệ giữa 2 biến nàỵ Nĩi cách khác, việc xem xét tương quan giữa 2 biến phải dựa trên cơ sở của một giả thuyết nghiên cứu (xem Chương 2).

Một phần của tài liệu Phương pháp nghiên cứu khoa học trong nuôi trồng thủy sản (Trang 56 - 57)