Đoạn trình tự tham khảo dài 582 cặp base của DNA ty thể chó nhà (có mã số GenBank là U96639.2) được chọn là trình tự chuẩn [37]. Trình tự này được đưa vào cơng cụ BLAST [8] để tìm tất cả các trình tự tương đồng được lưu trữ trong cơ sở dữ liệu nucleotide GenBank. Với thông số E-value của công cụ BLAST là 10e-94,
hầu hết các trình tự thu thập được từ kết quả BLAST đều là những trình tự DNA ty thể tương tự như trình tự chuẩn và đều thuộc các cá thể thuộc lồi Canis lupus. Với mỗi trình tự thu được, mã số truy cập của trình tự (accession number) ở GenBank được sử dụng để tải về tồn bộ thơng tin của trình tự đó được lưu trữ trong cơ sở dữ liệu GenBank như trình tự nucleotide, tên của sinh vật có trình tự đó, chú giải trình tự…v..v… Do vẫn cịn một số trình tự DNA ty thể của các cá thể thuộc chi, loài khác như Lycalopex, Cerdocyon…trong kết quả BLAST, một bộ lọc thứ hai được
thiết lập để chỉ những trình tự nào thuộc về các loài trong loài Canis lupus mới
được ghi nhận, tách các thông tin và được lưu vào cơ sở dữ liệu. Ngồi các thơng tin có sẵn trên bản ghi từ GenBank như trên, cơ sở dữ liệu cịn lưu trữ thơng tin có được do phân tích trình tự. Thơng tin về haplotype, vị trí bắt đầu và vị trí kết thúc của vùng HV1, HV2, vùng 582 cặp base của mỗi trình tự DNA ty thể cũng được xác định và lưu vào cơ sở dữ liệu. Tồn bộ quy trình này được thực hiện với một chương trình máy tính tự tạo, được viết bằng ngơn ngữ lập trình Perl (Hình 2.3).