CHƯƠNG 2 ĐỐI TƯỢNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU
2.2. PHƯƠNG PHÁP NGHIÊN CỨU
2.2.3. Map các đoạn đọc (reads) với hệ gen tham chiếu và lọc chất lượng
chất lượng bằng phần mềm bwa, samtools
Bwa aln tìm tọa độ (suffix array) SA của các đoạn đọc đầu vào. Các thơng số được sử dụng bao gồm -l 1000 vơ hiệu hĩa các seed để sử dụng cho các đoạn đọc ty thể cổ (aDNA). Bwa samse tạo các căn chỉnh (agliment) ở định dạng SAM cho các đoạn đọc single – end (đầu ra của bước giải trình tự chỉ xuất một dạng đoạn đọc với một chiều duy nhất). samtools hiển thị đầu ra trước đĩ dưới dạng tệp BAM (b), đầu vào là SAM (S) và bao gồm tiêu đề - header (h). Sau đĩ, samtools lọc ra những lần đọc chưa được sắp xếp và chất lượng thấp. -q hiển thị kết quả đầu ra trước đĩ dưới dạng tệp BAM (b) và bao gồm tiêu đề (h), nhưng bỏ qua căn chỉnh với MAPQ nhỏ hơn 30 (-q 30) và căn chỉnh cĩ đánh dấu 4 (phân đoạn 0x4 khơng được ánh xạ). Tiếp đĩ, loại bỏ các bản sao PCR tiềm năng: nếu nhiều cặp đọc cĩ tọa độ bên ngồi giống hệt nhau, chỉ giữ lại cặp cĩ chất lượng ánh xạ cao nhất. Loại bỏ bản sao cho các đoạn đọc single - end.
2.2.4. Ước tính các mẫu bị tổn thương (deamination) và chỉnh lại các file BAM bằng phần mềm mapDamage
Sử dụng mapDamage [50] để ước tính các tổn thương của các mẫu DNA cổ. Đồng thời, sử dụng --rescale để chỉnh lại chất lượng ánh xạ trong khi tính các tổn thương. Điều này quan trọng đối với các lệnh gọi kiểu gen sau này. Hơn nữa, vì một số mẫu sẽ khơng cĩ nhiều lượt đọc (ví dụ: khoảng trống hoặc mẫu cĩ hàm lượng nội sinh thấp) nên cần tạo một ngưỡng ra. Điều này đảm bảo rằng các mẫu cĩ quá ít lần đọc để chỉnh vẫn cĩ thể được xử lý trong bước tiếp theo bằng cách sao chép tệp .bam chưa được chỉnh vào quy trình tiếp theo.