Các thơng số của quá trình giải trình tự

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu mối tương quan di truyền giữa người việt cổ thuộc giai đoạn hậu thời kỳ đồ đá mới với người việt hiện đại bằng phân tích trình tự toàn bộ hệ gen ty thể (Trang 41 - 46)

3.2. Phân tích đánh giá chất lượng giải trình tự của hệ thống Ion S5™ bằng phần mềm FastQC Ion S5™ bằng phần mềm FastQC

Hình 3.10: Chất lượng trình tự của mẫu xương cổ thứ nhất (CCNM24WG)

Hai trình tự ty thể thu được sau giải trình tự với hệ thống Ion S5™ cĩ tên gọi là CCNM24WG và CCNM55WG. Các trình tự này được kiểm tra về điểm chấtlượng (QC), đã loại bỏ adapter hay chưa. Kết quả thu được từ phần mềm FastQC cho thấy, cả hai trình tự này đều đã được loại bỏ adapter và cĩ chất lượng trình tự khá tốt (phần lớn QC > 20) (Hình 3.10 và Hình 3.11). Điều này cho thấy chất lượng trình tự thu được sau giải trình tự cĩ độ tin cậy cao. Các thơng tin chi tiết về chất lượng trình tự được trình bày trong bảng 3.3.

Bảng 3.3: Chất lượng mỗi trình tự thu được của CCNM24WG và CCNM55WG Quality Sequence name CCNM24WG CCNM55WG 14 5 7 15 72 111 16 415 464 17 1250 1519 18 2668 2816 19 3991 4214 20 4923 5113 21 5253 5303 22 5447 5557 23 5985 6076 24 6868 6873 25 8085 8030 26 9802 9219 27 12052 10640 28 15522 12900 29 21406 16343 30 32707 24522 32 54534 41010 32 56821 38246 33 2384 1760 34 1 0

3.3. Map các đoạn đọc (reads) với hệ gen tham chiếu và lọc chất lượng bằng phần mềm bwa, samtools chất lượng bằng phần mềm bwa, samtools

Hệ gen tham chiếu được sử dụng là Reconstructed Sapiens Reference Sequence (RSRS). Reconstructed Sapiens Reference Sequence - (RSRS) là một trình tự mtDNA tham chiếu sử dụng cả việc lấy mẫu tồn cầu của mẫu người hiện đại và mẫu từ người các bộ tộc cổ đại. Nĩ được giới thiệu vào đầu năm 2012 (Behar et al., 2012) để thay thế cho rCRS (trình tự tham chiếu Cambridge đã sửa đổi). Bởi vì nĩ dựa trên kiểu haplotype của tổ tiên chung cho cả người hiện đại và các nhĩm cổ đại như người Neanderthal.

Bwa aln lấy file trình tự tham chiếu (RSRS.fasta) và file ty thể thu được sau giải trình tự (CCNM24WG.fastq và CCNM55WG.fastq) làm đầu vào. bwa samse sử dụng CCNM24WG.aln.sai – đầu ra từ bwa aln để tạo ra SAM file (aln.sam) từ alignments cho các đoạn đọc single-end. samtools hiển thị đầu ra trước đĩ dưới dạng tệp BAM (CCNM24WG.aln.bam). "-q30" bỏ qua các alignment với MAPQ nhỏ hơn 30 (mapping quality: mơ tả tính duy nhất của alignments, 0 = khơng phải duy nhất, > 10 cĩ thể là duy nhất. Nếu xác suất của một lần ánh xạ (map) đúng tăng lên 0,999, điểm MAPQ sẽ tăng lên 30), samtools view sẽ loại bỏ các đoạn đọc khơng map hoặc map tại vùng lặp

lại. Đầu ra cuối cùng là file

Một phần của tài liệu (LUẬN văn THẠC sĩ) nghiên cứu mối tương quan di truyền giữa người việt cổ thuộc giai đoạn hậu thời kỳ đồ đá mới với người việt hiện đại bằng phân tích trình tự toàn bộ hệ gen ty thể (Trang 41 - 46)

Tải bản đầy đủ (PDF)

(76 trang)