Sau khi tiến hành điện di sự hiện diện hay vắng mặt của các band trên bảng gel sẽ đƣợc ghi nhận ở mỗi cá thể, đƣợc dùng để phân tích bằng phần mềm NTSYS. Số liệu này sẽ đƣợc sử dụng để xây dựng ma trận tƣơng đồng (Similarity matrix) hoặc ma trận khoảng cách (Distance matrix). Các ma trận này biểu hiện cho mối quan hệ xa gần về mặt di truyền giữa các mẫu phân tích và đƣợc xây dựng trên công thức toán học của Dice (1979).
2a Sxy=
2a +b+c a: Số band chung giữa hai mẫu.
b: Số band mẫu x có mà mẫu y không có. c: Số band mẫu y có mà mẫu x không có. Sxy: Hệ số tƣơng đồng giữa 2 mẫu x và y.
Từ Sxy ta tính đƣợc khoảng cách di truyền giữa x và y: Dxy = 1 – Sxy
Trên cơ sở toán học này, các nhà toán học đã xây dựng các phần mềm WINDIST và NTSYS cho máy tính. Chƣơng trình WINDIST tạo ra ma trận tƣơng đồng từ bộ dữ liệu nhập sẵn. Chƣơng trình NTSYS version 2.1 tạo ra sơ đồ hình cây phản ánh mối quan hệ di truyền giữa các cá thể nghiên cứu (Kangle Zheng và ctv, 1995). Hiện nay 2 chƣơng trình WINDIST và NTSYS đƣợc gộp lại thành chƣơng trình package – NTSYS để tiện dụng hơn.
Cách nhập số liệu:
Dữ liệu thu đƣợc từ sản phẩm PCR sẽ nhập vào excel theo những quy định chung. Nếu nhƣ sản phẩm có band hiện diện thì ta sẽ nhập là 1 và 0 nếu không hiện diện band. Sau khi nhập số liệu, ở ô A3 nhập số “1” (đối với ma trận hình chữ nhật), ô B3 ghi số hàng, ô C3 ghi số cột, và D3 nhập số “0” nếu không có số liệu thiếu. Sau đó, bản số liệu trong excel sẽ đƣợc dùng để xây dựng ma trận tƣơng đồng trong phần mềm NTSYSpc version 2.1. Dùng hệ số DICE để tính mức tƣơng đồng. Sơ đồ
cây phát sinh loài sẽ đƣợc tạo ra khi sử dụng phƣơng pháp UPGMA trong phần mềm NTSYS.
Sau khi có cây phân nhóm di truyền, tiến hành kiểm tra độ tin cậy bằng cách dựng bootstrap bằng phần mềm Winboot. Đây là phần mềm được phát triển bởi Immamnuel V. Yap và Rebecca j. Nelson (1996), có thể tải miễn phí tại trang wep http://www.irri.org/science/software/winboot.asp.
Dữ liệu thu được từ sản phẩm PCR sẽ nhập vào excel tương tự như file excel của phần mềm NTSYS chỉ khác là dữ liệu của các mẫu được trình bày theo hàng ngang: có band hiện diện thì ta sẽ nhập là 1 và 0 nếu không hiện diện band. Ô A1 là số hàng tương đương với số mẫu, ô B1 là số cột tương đương với số band. Chọn hệ số DICE và lặp lại 10000 lần. Phần mềm sẽ cho kết quả là độ lặp lại của các phân nhóm tương đương với độ chính xác của các phân nhóm đó.