3.4. Ước tính các mẫu bị tổn thương (deamination) và chỉnh lại các file BAM bằng phần mềm mapDamage lại các file BAM bằng phần mềm mapDamage
Hình 3.13: Thơng tin tổn thương DNA cổ đại của mẫu CCNM24WG được tạo ra bởi mapDamage 2.0
Hình 3.14: Thơng tin tổn thương DNA cổ đại của mẫu CCNM55WG được tạo ra bởi mapDamage 2.0
Bốn hình phía trên thể hiện tần số base trong và ngồi các đoạn đọc, nơi mà các hộp màu xám khơng khép kín tương đương với một đoạn đọc. Hai
hình bên dưới thể hiện vị trí thay thế base đặc trưng từ đầu 5’ (trái) và đầu 3’ (phải) của một đoạn đọc. Đường màu đỏ tương ứng với thay thế C thành T, đường màu xanh dương tương ứng với thay thế G thành A, các đường mờ cịn
lại là các loại thay thế base khác.
Kết quả cho thấy hai mẫu DNA đều cĩ tổn thương DNA, cụ thể là sự khử amin và sự phân mảnh. Sự thay thế C thành T diễn ra đầu tiên đầu 5’, sự thay thế G thành A diễn ra đầu tiên ở đầu 3’. Ở bước này tùy chọn - - rescale
tạo ra file BAM đã được để chỉnh lại chất lượng ánh xạ trong khi tính các tổn
thương (CCNM24WG.uniq.rescaled.bam và
CCNM55WG.uniq.rescaled.bam). Các file này sẽ được sử dụng làm đầu vào cho bước gọi biến thể và tạo consensous file.
3.5. Gọi các biến thể (variants) và tạo ra VCF (Variant Call Format) Format)
File BAM đã được rescaled với mapDamage được sử dụng làm đầu vào cho việc gọi biến thể sử dụng samtools mpileup để tạo file vcf từ file bam và bcftools view để thêm các cài đặt để tùy chỉnh và lọc file VCF. Đầu ra cuối cùng ở giai đoạn này là hai tệp VCF, một tệp được lọc cho độ bao phủ của các đoạn đọc lớn 1x và tệp cịn lại thì khơng. Các tệp VCF được tạo ra cĩ thể được sử dụng làm đầu vào cho mtDNA haplotyping trong Haplogrep2.