100 L, thay nước % mỗi ngàỵ Tổng cộng có 36 con tơm Sú mẹ và 52 con tôm Mũ ni ñỏ ñược sử dụng cho nghiên cứu nàỵ Khi cho tôm ăn, người nghiên cứu cho vào mỗi bể một miếng mực tươi và một con nghêụ Sau
3.4.7 Phân tích hồi qu
Phân tích hồi qui chính là xác định tương quan giữa 2 biến bằng phương trình tuyến tính y = a
Khi phân tích hồi qui, trước hết phải xác định biến nào là biến độc lập (independent variable) và biến nào là biến phụ thuộc (dependent variable). Lưu ý, phụ thuộc khơng cĩ nghĩa là biến độc lập là nguyên nhân gây thay đổi của biến phụ thuộc. Ta phải phân tích đặc điểm của đối tượng nghiên cứu để xem thực sự cĩ phải là quan hệ nhân quả hay khơng. Theo qui ước khi biểu diễn trên đồ thị, biến độc lập sẽ ở trục x và biến phụ thuộc ở trục y. Khi sử dụng phương trình tuyến tính để dự đốn giá trị của biến phụ thuộc (y), phán đốn chỉ chính xác trong khoảng số liệu đã thu thập để xây dựng lên phương trình. Vượt ngồi khoảng này, ước đốn chỉ mang tính tham khảo mà thơị
Lấy ví dụ về phân tích hàm lượng NH3-N trong nước aọ Trước hết, phân tích viên sẽ tạo một dãy mẫu chuẩn cĩ hàm lượng NH3-N đã xác định trước, từ 0,1 đến 2,0 mg/L. Sau đĩ dùng các hố chất để tạo phức màu với NH3-N. Hàm lượng NH3-N càng cao, cường độ màu càng lớn và khả năng hấp phụ ánh sáng của dung dịch sẽ tăng lên. Tiếp theo, phân tích viên dùng máy đo quang phổ để xác định độ hấp phụ (absorbance) của từng dung dịch trong dãy mẫu chuẩn, tương ứng với một hàm lượng NH3-N đã biết trước. Từ các số liệu này, phân tích viên xây dựng được phương trình tuyến
tính: y = a + bx với y là hàm lượng NH3-N và x là độ hấp phụ. Các mẫu nước thu từ ao, sau đĩ, sẽ
được lọc và tiếp xúc với hố chất để tạo phức màụ Mẫu nước khơng cĩ NH3-N sẽ khơng cĩ màụ Các mẫu cĩ NH3-N sẽ cĩ cường độ màu khác nhau tuỳ theo hàm lượng NH3-N. Khi độ hấp phụ của các mẫu này được xác định, phân tích viên sẽ dùng phương trình tuyến tính vừa xác định được để ước lượng hàm lượng NH3-N cĩ trong mẫu nước. Ước lượng này chỉ chính xác nếu độ hấp phụ của mẫu nước nằm trong khoảng cho phép, được xác định là từ độ hấp phụ của mẫu chuẩn cĩ hàm lượng NH3-N nhỏ nhất (0,1 mg/L) đến độ hấp phụ của mẫu chuẩn cĩ hàm lượng NH3-N lớn nhất (2,0 mg/L). Nếu độ hấp phụ của mẫu nước vượt ra ngồi khoảng này, đặc biệt là khi cao hơn giá trị cao nhất thì cần phải pha lỗng mẫu ra (để giảm cường độ màu và độ hấp phụ). Sau khi đã xác định được hàm lượng NH3-N trong mẫu pha lỗng, phân tích viên sẽ nhân với hệ số pha lỗng để được hàm lượng chính xác cĩ trong mẫụ
ðể phân tích hồi qui cĩ ý nghĩa, cần phải đảm bảo các điều kiện sau:
• Quan hệ tuyến tính giữa biến phụ thuộc (y) và biến độc lập (x) được hiểu là quan hệ chức năng (functional) hoặc nhân quả (causal). Ví dụ: phân tích hồi qui của mối quan hệ giữa hàm lượng phân bĩn PO43- với sinh khối của tảo nuơi sau 24 h.
• Biến độc lập (x) khơng phải là một biến ngẫu nhiên. Các giá trị của nĩ do người quan sát kiểm sốt (vì thế dạng này thường thích hợp với thí nghiệm điều khiển).
• Tương ứng với mỗi giá trị của x là một tổng thể lý thuyết của y. Tổng thể này phải cĩ phân phối chuẩn và phương sai của các tổng thể này tương ứng với các giá trị khác nhau của x là tương đương nhaụ
Trong phần mềm SPSS, phân tích hồi qui cĩ thể gọi từ Analyze/Regression. Nếu tự tính thì cơng thức tính là:
b = (n∑xy - ∑x∑y)/(n∑x2
– (∑x)2
)
a = y−bx
Khi sử dụng phương trình đã xây dựng để dự báo giá trị y tương ứng với một giá trị x, cần phải tính sai số chuẩn của phương trình (xem Fowler et al. 2002). Lưu ý rằng sai số này là sai số của cả đường tuyến tính. Với một điểm ước đốn đơn lẻ, sai số sẽ lớn hơn. Lúc đĩ khoảng tin cậy của điểm này sẽ tràn ra ngồi vùng tin cậy 95% của phương trình tuyến tính.
Trong sinh học, rất nhiều tương quan thể hiện qua đường cong. Khi gặp trường hợp này ta phải chuyển dạng số liệu trước (bằng logarithm, arcsine, căn bậc 2 hoặc phân số 1/x hoặc 1/y) rồi mới phân tích hồi qui được. Vì thế rất cần phải quan sát đám mây số liệu trước. Nếu nĩ cĩ dạng đường
cong, ta chuyển dạng 1 biến trước, vẽ lại biểu đồ scattergram. Tiếp theo chuyển dạng biến 2, rồi cả 2 biến, xem đám mây nào cĩ dạng tuyến tính nhất thì sử dụng cách chuyển dạng đĩ. Nếu vẫn khơng quyết định được thì tính hệ số tương quan r2 rạ Kiểu nào cĩ r2 lớn nhất thì dùng số liệu đĩ để phân tích hồi quị Với số đếm ta cĩ thể chuyển sang dạng logarithm. Sau khi tính được b và a rồi thì phương trình cĩ dạng y’ = a + bx. Nếu ta thay x vào để ước y’ thì sau đĩ phải dùng antilog để chuyển y’ thành y mới ra đơn vị thực. Hoặc ta cĩ thể viết phương trình tuyến tính dưới dạng log y =
log a + bx hay y = a × 10bx với a = antilog a’.
Tĩm lại, ta chỉ phân tích hồi qui khi cần phải ước lượng giá trị của biến A thơng qua đo đạc biến B mà thơị Nếu chỉ muốn biết hai biến này cĩ liên hệ gì với nhau hay khơng thì chỉ cần phân tích tương quan là đủ. Số liệu phải là dạng bivariate, tức là từ một đơn vị thu mẫu, đo được 1 cặp số liệụ Khi phân tích hồi qui, giá trị r khơng cĩ ý nghĩa nếu hai biến x và y khơng cĩ phân phối chuẩn và mẫu khơng được thu một cách ngẫu nhiên. Vì ý nghĩa thống kê của phân tích hồi qui cĩ thể được xác định qua kiểm định t-test hoặc phân tích phương sai – ANOVA nên khi trình bày kết quả, nhớ đề cập đến phương pháp mà bạn đã sử dụng.