4. Những đóng góp mới của luận án
2.3.2.7. Phương pháp phân tích thống kê và vẽ bản đồ
Các tập dữ liệu bao gồm 20 chỉ số hình thái ngoài (TL, HL, PD, PA, E, IO, AD, PDH, T, TR, HL/TL, PD/TL, PA/TL, TR/TL, AD/TL, PDH/TL, T/TL, E/HL, IO/HL và màu sắc hình thái ngoài) và 11 chỉ số môi trường phân bố (nhiệt độ, độ mặn, pH, DO, độ sâu, nền đáy, màu nước, chế độ thủy triều, chu kì trăng, thời tiết, thời gian) của cá Chình hoa đã được xử lý theo phương pháp thống kê sinh học trên mềm Excel 2016.
Sử dụng phần mềm SPSS 22.0 để phân tích thành phần chính (Principal Component Analysis - PCA) và phân tích cụm thứ bậc (Cluster analysis – CA) của cấu trúc quần thể cá Chình hoa phân bố ở Thừa Thiên Huế dựa trên các chỉ số hình thái và môi trường. Trong đó, phương pháp phân tích thành phần chính (Principal Component Analysis - PCA) đã được sử dụng để mô tả và đánh giá sự sai khác của các đặc điểm hình thái và môi trường. Một ma trận tương quan đã được sử dụng trong phân tích các đặc điểm hình thái, môi trường phân bố. Các mô tả đồ họa của các vị trí mẫu vật dọc theo vectơ đã được khảo sát cho các nhóm riêng biệt. Phương pháp này được chọn vì nó không yêu cầu một giả định tiên nghiệm nào về nhận dạng phân loại của mẫu vật [186].
Phân tích cụm thứ bậc (cluster analysis) bằng phương pháp Ward đã sử dụng để đánh giá mối quan hệ giữa các cá thể nghiên cứu. Phương pháp này thường được gọi là phương pháp phương sai tối thiểu của Ward. Thuật toán chuỗi gần nhất có thể được sử dụng để xác định các nhóm, theo thời gian tỷ lệ với kích thước của ma trận khoảng cách đầu vào và tuyến tính không gian theo số điểm được phân tích. Tiêu chí phương sai tối thiểu của phương pháp Ward là giảm thiểu tổng phương sai trong cụm. Để thực hiện phương pháp này, khoảng cách ban đầu giữa các đối tượng riêng lẻ phải bằng (hoặc tỷ lệ với) khoảng cách Euclide bình phương. Do đó, khoảng cách cụm ban đầu trong phương pháp phương sai tối thiểu của Ward được xác định là khoảng cách Euclid bình phương giữa các điểm:
dij= d({Xi}, {Xj}) = ||Xi - Xj||2 (4)
Trong đó, Xi và Xj là các điểm nghiên cứu; dij là bình phương khoảng cách Eculid giữa điểm Xi và Xj [229].