Nhiễm sắc thể Y có rất nhiều loại chỉ thị đa hình khác nhau, các chỉ thị này đƣợc sử dụng rộng rãi trong các nghiên cứu về bệnh di truyền, tiến hóa và hình sự. Chúng đƣợc chia thành hai nhóm chính: nhóm các chỉ thị hai allele và nhóm các chỉ thị đa allele [75].
19
Chỉ thị hai allele
Các chỉ thị 2 allele bao gồm các SNP (các đa hình nucleotide đơn) và chèn hoặc mất đoạn (insertion/deletion - indel). Các SNP là dạng đa hình phổ biến nhất, chiếm hơn 90% trong tổng số các loại đa hình hai allele [19]. SNP có đặc điểm là tốc độ đột biến thấp, do đó nó đƣợc sử dụng trong nghiên cứu về nhân khẩu học đối với lịch sử loài ngƣời. Tốc độ đột biến của các chỉ thị SNP dự đoán khoảng 2x10-8 base từ thế hệ này sang thế hệ khác [55].
Sự sắp xếp lại, chủ yếu là mất đoạn trên vùng các gen đặc hiệu nhiễm sắc thể Y (nhân tố vô sinh - Azospermia Factor - AZFa, AZFb, AZFc) là nguyên nhân dẫn đến bệnh vô sinh nam. Tuy nhiên, không phải tất cả thay đổi chèn hoặc mất đoạn đều ảnh hƣởng đến tính vô sinh ở nam giới, những thay đổi xảy ra liên tục từ thế hệ này sang thế hệ khác là những đa hình thông thƣờng. Một ví dụ cụ thể cho trƣờng hợp này là sự mất đoạn 2 kb ở chỉ thị 12f2, dẫn đến hình thành nhóm đơn bội J theo hệ thống định danh hiện nay. Một số indel đã phát sinh một cách độc lập trong lịch sử loài ngƣời. Có thể lấy ví dụ nhƣ sự lặp lại hoặc bị xóa đi vùng 50f2/C (DYS7C) giữa các nhóm đơn bội có thể khác nhau ít nhất bảy đến tám lần [41]. Một ví dụ khác là, mất đoạn vùng DAZ3/DAZ4, các cá thể bị mất đoạn này thuộc nhóm đơn bội N [23], phân bố rộng rãi ở phía Bắc đại lục Á-Âu.
Chỉ thị đa allele
Một loại đa hình phổ biến khác, có mặt trên nhiễm sắc thể Y, là các đoạn lặp lại ngẫu nhiên, chủ yếu nằm trên các vùng không mang mã. Phụ thuộc vào chiều dài của đơn vị lặp lại, có thể phân chia các loại lặp lại thành: DNA vệ tinh (satellite-DNA), có chiều dài đoạn lặp lại từ một nghìn đến một vài nghìn nucleotide; minisatellite (VNTR), có chiều dài đoạn thay đổi từ 10 đến 100 bp; và microsatellite hay STR, với chiều dài đoạn lặp lại nhỏ hơn 10 bp, chủ yếu từ 2 đến 6 bp. Với đặc điểm là các đoạn lặp lại chủ yếu từ 2 – 6 bp, các STR đƣợc sử dụng rộng rãi hơn trong các nghiên cứu về nhiễm sắc thể Y so với các loại đa hình đa allele khác [8;40].
20
Microsatellite là các chỉ thị đa allele với số lƣợng các allele dao động từ 3 đến 49 allele trên một locus, loại chỉ thị này đƣợc sử dụng đầu tiên vào năm 1989. Trong nghiên cứu về tiến hóa, STR đƣợc sử dụng kết hợp với các chỉ thị hai allele để phân tích sự đa dạng di truyền trong nhóm đơn bội. Số lƣợng các STR trên nhiễm sắc thể Y đƣợc sử dụng rộng rãi là không nhiều, khoảng 250 STR đã đƣợc mô tả [45].
Các phân tích khác nhau đã chỉ ra tốc độ đột biến trung bình của đoạn lặp lại 4 nucleotide là khoảng 2×10-3 bp trên một thế hệ. Sử dụng 17 STR trên nhiễm sắc thể Y, với đoạn lặp lại là 4 nucleotide, trong một nghiên cứu sâu một phả hệ, Heyer và nhóm nghiên cứu cũng thu đƣợc kết quả tƣơng tự nhƣ kết quả của Weber và Wong đã công bố trƣớc đó. Tốc độ đột biến ở cặp bố - con trai trung bình là 2,8×10- 3, trong khi đó một nhóm tác giả khác, sử dụng mạng lƣới kiểu đơn bội của ngƣời Mỹ bản địa đã tìm thấy tốc độ đột biến trung bình của cặp bố-con trai là 2,6 × 10–4 trên thế hệ cho một locus, khác với kết quả đã công bố của Heyer và nhóm nghiên cứu [34].