Bản ko đầy đủ hoặc tóm tắt phải ghi rõ
Header Page of 126 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN Nguyễn Thị Hồng Nhung ĐÁNH GIÁ BỘ KIT FORENSEQ TRÊN HỆ THỐNG MiSeq FGx ỨNG DỤNG TRONG ĐỊNH DANH CÁ THỂ NGƢỜI VIỆT NAM dẫNLUẬN VĂN THẠC SĨ KHOA HỌC Hà Nội - 2016 Footer Page of 126 Header Page of 126 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN Nguyễn Thị Hồng Nhung ĐÁNH GIÁ BỘ KIT FORENSEQ TRÊN HỆ THỐNG MiSeq FGx ỨNG DỤNG TRONG ĐỊNH DANH CÁ THỂ NGƢỜI VIỆT NAM Chuyên ngành : Di truyền học Mã số: 60420121 dẫNLUẬN VĂN THẠC SĨ KHOA HỌC Cán hƣớng dẫn: TS Nguyễn Văn Sáng dẫn: TS Võhị Thươn Lan Hà Nội - 2016 Footer Page of 126 Header Page of 126 Lời cảm ơn Để thực thành công khóa luận tốt nghiệp này, em xin gửi lời cảm ơn sâu sắc đến Đại tá Hà Quốc Khanh nguyên Viện phó Viện Khoa học Hình với thầy Nguyễn Văn Sáng, người hướng dẫn, bảo tận tình suốt thời gian em thực đề tài Em xin gửi lời cảm ơn đến Thạc sĩ – Trung tá Trịnh Tuấn Toàn Thạc sĩ Nguyễn Quang Vinh, cán giám định viên Phòng giám định Sinh học Pháp lý, nhân viên công ty Cổ phần dịch vụ phân tích di truyền GENTIS, nhân viên công ty Cổ phẩn Khoa học Vật tư BIOMEDIC cung cấp mẫu trường, mẫu quần thể người Việt thông tin cần thiết tạo điều kiện thuận lợi cho em thực tốt đề tài Trong thời gian hoàn thành khóa luận, em nhận quan tâm, giúp đỡ động viên Đại tá Hà Quốc Khanh anh chị bạn Phòng Kỹ thuật Ứng dụng, thuộc công ty BIOMEDIC Em xin chân thành cảm ơn! Cuối em xin gửi lòng biết ơn tới gia đình, bạn bè thân thiết động viên, bên cạnh em thời gian em thực khóa luận Hà Nội, ngày 20 tháng 12 năm 2016 Sinh viên Nguyễn Thị Hồng Nhung Footer Page of 126 Header Page of 126 Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH KÝ HIỆU VÀ CHỮ CÁI VIẾT TẮT bp : base pair Cluster : Cụm khuếch đại ADN khuôn gắn bề mặt flowcell Mỗi cụm khuếch đại từ sợi ADN khuôn ban đầu có khoảng 1000 Mỗi cluster tạo trình tự đọc CODIS : Combined DNA Index System cs : cộng DNA : Deoxyribonucleic acid H2O : Nước kb : kilobase = 1000 bp Index : Là trình tự ADN tag gắn vào trình tự đích, cho phép kết hợp nhiều mẫu bể thư viện phân tách liệu sau hoàn thành lần chạy NGS : Next – Generation Sequencing PCR : Polymerase Chain Reaction STR : Short Tandem Repeats SNP : Single Nucleotide Polymorphism SBS : Sequencing by Synthesis stutter : Hiện tượng polymerase bị trượt xuất trình khuếch đại trình tự lặp lại, quy trình chuẩn bị thư viện, tạo cluster Có thể tạo đoạn ADN đích có kích thước bé lớn kích thước trình tự đích RFLP Footer Page of 126 : Restriction Fragment Length Polymorphism Header Page of 126 Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH DANH MỤC CÁC BẢNG Trang Bảng 1.1: Các kit STRs thương mại phổ biến thị trường Bảng 1.2: So sánh thị STRs SNPs Bảng 3.1: Số alen quan sát STR SNP dải pha loãng đối chứng dương 2800M 28 Bảng 3.2: Kết thí nghiệm kit Identifiler Plus 29 Bảng 3.3: Kết thí nghiệm kit ForenSeq 30 Bảng 3.4: Nồng độ mẫu đo phương pháp qPCR 32 Bảng 3.5: Độ độ bao phủ alen locus khác 38 Bảng 3.6: Bảng khảo sát tần số SNPs quần thể người Việt Nam 38 Bảng 3.7: Tần suất xuất alen locus hệ ForenSeq 40 Bảng 3.8: Số lượng kiểu gen quan sát locus D4S2408 41 Bảng 3.9: Số lượng kiểu gen quan sát locus D6S1043 42 Bảng 3.10: Số lượng kiểu gen quan sát locus D9S1122 43 Bảng 3.11: Số lượng kiểu gen quan sát locus D17S1301 44 Bảng 3.12: Số lượng kiểu gen quan sát locus D20S482 44 Footer Page of 126 Header Page of 126 Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH DANH MỤC CÁC HÌNH Trang Hình 1.1: Hệ thống CODIS 13 STR loci vị trí nhiễm sắc thể Hình 1.2: Hình ảnh máy điện di mao quản 3130xl với 16 mao quản 11 Hình 1.3: Quy trình giải trình tự hệ Illumina 16 Hình 1.4: Bộ kit chuẩn bị thư viện ForenSeqTM DNA Signature Prep 17 Hình 2.1: Khái quát kit ForenSeqTM DNA Signature Prep 23 Hình 3.1: Số lượng đoạn đọc đại diện mẫu từ dải pha loãng 2800M 28 Hình 3.2: Phân biệt tượng isometric alen 31 Hình 3.3: Kết mẫu chất lượng hai phương pháp 33 Hình 3.4: Hồ sơ ADN hai mẫu cho nhận ngẫu nhiên 15/16 locus 34 Hình 3.5: Hồ sơ ADN hai mẫu A B thực ForenSeq 35 Hình 3.6: Hiện tượng isometric alen alen 29 locus D21S11 hai mẫu A B 36 Hình 3.7: Phân biệt alen kích thước khác trình tự mẫu lẫn 37 Footer Page of 126 Header Page of 126 Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH MỤC LỤC Mở đầu Chƣơng 1: TỔNG QUAN TÀI LIỆU 1.1 Lịch sử nghiên cứu thị ADN ứng dụng khoa học hình 1.2 Chỉ thị ADN sử dụng khoa học hình 1.2.1 STR – Short Tandem Repeats 1.2.2 SNP – Single Nucleotide Polymorphism 1.3 Các phƣơng pháp phân tích sử dụng thị ADN 1.3.1 Đa hình chiều dài đoạn cắt giới hạn (RFLP – Retriction Fragment Length Polymorphism) 1.3.2 Phương pháp PCR thị STRs 10 1.3.3 Điện di phát STRs 10 1.3.4 Giải trình tự hệ – Next Generation Sequencing (NGS) 11 1.4 Hệ thống giải trình tự hệ ILLUMINA – MiSeq FGx 14 1.4.1 Công nghệ giải trình tự Illumina 14 1.4.2 Giải pháp NGS cho linh vực hình Illumina 16 1.4.3 Tình hình thực tế Việt Nam 17 Chƣơng 2: NGUYÊN LIỆU VÀ PHƢƠNG PHÁP NGHIÊN CỨU 19 2.1 Nguyên liệu, hóa chất thiết bị 19 2.1.1 Đối tượng nghiên cứu 19 2.1.2 Hóa chất 19 2.1.3 Dụng cụ thí nghiệm 19 2.2 Phƣơng pháp nghiên cứu 19 Footer Page of 126 Header Page of 126 Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH 2.2.1 Tách chiết mẫu ADN chelex 20 2.2.2 Tách chiết mẫu ADN giấy FTA 20 2.2.3 Tinh mẫu ADN 21 2.2.4 Định lượng nồng độ ADN sau tách chiết 21 2.2.5 Chuẩn bị thư viện mẫu ADN cho giải trình tự hệ 22 2.2.6 Phương pháp giải trình tự hệ MiSeq FGx 24 2.2.7 Xử lý thống kê số liệu tính tần suất locus gen 24 2.3 Sơ đồ nghiên cứu 26 Chƣơng 3: KẾT QUẢ VÀ THẢO LUẬN 27 3.1 Thông tin lần chạy máy MiSeq FGx 27 3.2 Đánh giá độ nhạy 27 3.3 Đánh giá độ tƣơng đồng 29 3.4 Đánh giá độ phân giải 31 3.5 Trƣờng hợp mẫu có chất lƣợng 32 3.6 Trƣờng hợp mẫu cho nhận ngẫu nhiên quần thể 33 3.7 Trƣờng hợp mẫu lẫn 36 3.8 Khảo sát tần suất iSNPs quần thể ngƣời Việt Nam (Kinh) 38 3.9 Khảo sát tần suất locus STR ForenSeq quần thể ngƣời Việt Nam (Kinh) 40 3.9.1 Locus D4S2408 41 3.9.2 Locus D6S1043 42 3.9.3 Locus D9S1122 43 3.9.4 Locus D17S1301 44 Footer Page of 126 Header Page of 126 Luận văn cao học - 2016 3.9.5 Nguyễn Thị Hồng Nhung – K23CH Locus D20S482 44 KẾT LUẬN VÀ KIẾN NGHỊ 45 Tài liệu tham khảo 48 Footer Page of 126 Header Page 10 of 126 Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH Mở đầu Từ Ray White lần mô tả thị ADN (DNA marker) dựa phương pháp đa hình chiều dài đoạn cắt giới hạn (Restriction Fragment Length Polymorphisms – RFLP) vào năm 1980 loạt thị ADN nghiên cứu ứng dụng di truyền học động vật nói chung di truyền người nói riêng Đến năm 1984, Alec J Jeffreys nghiên cứu phát thị minisatellite ông nhận thấy tính đa hình đoạn gen mã hóa cho myoglobin người Ông phát cá thể khác số lượng đoạn lặp khác hay gọi số lượng đa hình đoạn lặp (Variable Number of Tandem Repeat – VNTR) Từ đó, ông cộng phòng thí nghiệm liệt kê ứng dụng thị minisatellite Và ứng dụng quan trọng chị thị Jeffreys nghiên cứu sử dụng giám định ADN hình (DNA Forensic) để phân biệt người người khác Trong khoảng 15 năm phát triển, ứng dụng thị phân tử lĩnh vực hình có tiến vượt bậc đạt nhiều thành tựu Các quy trình xây dựng, hoàn thiện phổ biến sử dụng phân tích mẫu sinh học hình Theo ông Bruce Budowle – Cục điều tra Liên bang Mỹ, lĩnh vực hưởng lợi ích nhiều từ công cụ sinh học phân tử khoa học hình Với công nghệ ADN, nhà khoa học loại bỏ đối tượng tình nghi sai với mẫu thu nhận được, từ khoanh vùng, định hướng điều tra Những chứng phạm tội chứng mạnh mẽ để kết luận tội phạm Công nghệ giải trình tự phương pháp điện di mao quản tiêu chuẩn vàng để thực phân tích ADN hình Tuy nhiên, công nghệ bị giới hạn với khó khăn đặc thù mẫu án hình hàm lượng mẫu ít, độ đứt gãy cao, nhiều tạp chất, chí lẫn từ nhiều nguồn khác nhau,… Hệ thống giải trình tự hệ (Next Generation Sequencing – NGS) Illumina – Footer Page 10 of 126 Header Page 16 of 126 Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH AmpFLSTR® Identifiler® Direct PCR Amplification Kit (16 locus) GlobalFiler STR kit (24 locus) Promega PowerPlex 16 (16 locus) PowerPlex 23 (23 Power Plex Fusion (24 locus) locus) Qiagen Investigator HDPlex Kit Investigator (12 locus) Argus – X Kit (12 locus) 1.2.2 SNP – Single Nucleotide Polymorphism Một biến đổi trình tự cá thể điểm cụ thể hệ gen thường gọi tính đa hình đơn nucleotide hay gọi SNP (Single Nucleotide Polymorphism) [5] SNP phong phú hệ gen người sử dụng để nghiên cứu mối tương quan với bệnh di truyền Hàng triệu SNP tồn cá thể riêng biệt Do SNP sử dụng để giúp phân biệt cá thể [5, 6] Có nhiều nghiên cứu SNP thị phân tử đầy tiềm SNP có đủ khả để thay STRs ứng dụng tương lai [6] Những SNPs có số ưu điểm vượt trội so với STRs Đầu tiên quan trọng sản phẩm PCR SNPs có kích thước bé 100bp Điều có nghĩa thị SNPs có khả khôi phục lại thông tin ADN từ mẫu bị đứt gãy mạnh tốt so với STRs (các amplicon có kích thước từ 300bp – 400bp) [6] Thứ hai theo nguyên tắc kết hợp nhiều SNPs so với STRs không bị giới hạn phương pháp phát Thứ ba xử lý mẫu phân tích liệu tự Footer Page 16 of 126 Header Page 17 of 126 Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH động hóa hoàn toàn Thứ tư tượng stutter, đơn giản hóa dễ dàng giải thích kết gọi tên alen Cuối cùng, khả dự đoán nguồn gốc chủng tộc đặc điểm kiểu hình thực với lựa chọn cẩn thận SNPs ancestry SNPs phenotype [5,6] Bảng 1.2 So sánh thị STRs SNPs [5] Đặc điểm Tần số xuất STRs – Short Tandem SNPs – Single Nucleotide Repeats Polymorphism 15kb 1kb hệ gen Khả cung Cao Thấp, khoảng 20% - 30% thông cấp thông tin tin STRs Tỉ lệ đột biến 1/ 1000 1/ 100000000 2, 3, chí Thường thị bi-allelic với khả Loại thị nucleotide lặp lại với nhiều năng: A/G, A/C, A/T, G/C, G/T, Số lượng alen Phương alen C/T Thường từ – 20 Phổ biến pháp Điện di gel điện di mao Phân tích trình tự, lai microchip phát quản Kích thước đoạn Thường < 100bp 75 – 400bp amplicon Khả dự Giới hạn Một vài SNPs có liên kết với nguồn đoán nguồn gốc gốc chủng tộc chủng tộc Footer Page 17 of 126 Header Page 18 of 126 Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH Thông tin kiểu Không Có thể dự đoán đặc điểm hình kiểu màu mắt, màu tóc, … Lợi Nhiều alen cho phép tăng tỉ lệ Sản phẩm PCR có kích thước nhỏ ứng dụng thành công việc cho phép tăng tỉ lệ thành công khoa hoc hình phát mẫu lẫn với mẫu đứt gãy Tỉ lệ đột biến thấp hỗ trợ phân tích quan hệ huyết thống dễ dàng Có khả dự đoán kiểu hình Giới hạn Giải thích liệu phải tính Yêu cầu cần kết hợp nhiều locus ứng dụng hình yếu tố nhiễu Gặp khó khăn giải mẫu tượng stutter, tượng lẫn nhiễu màu thuốc nhuộm, alen giả hình kiếm, … Cả hai thị phân tử STRs SNPs có ưu điểm nhược điểm định phân tích ADN hình Theo nghiên cứu nhà khoa học, phân tích 50 SNP độ tin cậy đạt tương đương với hệ thống CODIS Hiện nay, số phòng thí nghiệm phân tích ADN giới ứng dụng SNP giải vụ việc nhằm xác định quan hệ huyết thống trực hệ 1.3 Các phƣơng pháp phân tích sử dụng thị ADN 1.3.1 Đa hình chiều dài đoạn cắt giới hạn (RFLP – Restriction Fragment Length Polymorphism) Phương pháp phân tích ADN sử dụng để nhận dạng người phương pháp RFLP Trong phương pháp này, hệ gen cắt ngẫu nhiên enzyme cắt giới hạn vị trí đặc hiệu biết trước trình tự Kỹ thuật nhận biết khác người với người khác thông qua độ dài Footer Page 18 of 126 Header Page 19 of 126 Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH đoạn ADN sau điện di để phân tách dựa vào kích thước Sự xuất hay vắng mặt vị trí đặc hiệu mẫu ADN tạo sản phẩm có kích thước khác Sau đó, sản phẩm ADN phân tách gel phát cách lai với đầu dò trình tự bổ sung với ADN mẫu RFLP không sử dụng lâu hình nhận dạng ADN người nhanh chóng bị thay phương pháp khác sử dụng kỹ thuật PCR Nguyên nhân phương pháp dựa vào PCR giúp làm tăng số lượng copy lượng mẫu tương đối nhỏ, giúp phân tích mẫu bị đứt gãy Ngược lại, phương pháp RFLP yêu cầu lượng lớn mẫu tốt, không bị đứt gãy [12] 1.3.2 Phương pháp PCR thị STRs Chỉ thị STRs có tính đa hình cao Trong quần thể người có số lượng lớn tính đa hình dựa vào độ dài thị STRs Sự khác biệt người người khác số lần lặp lại đơn vị trình tự Mỗi cá thể bình thường có alen cặp nhiễm sắc thể sử dụng để xác định mối quan hệ trực hệ (bố - con, mẹ - con) Nhiễm sắc thể Y có STRs Các Y – STRs xuất nam giới ứng dụng để xác định quan hệ huyết thống theo dòng nội [5] Ngoài ra, nhiễm sắc thể X có STR ứng dụng để phân tích số mối quan hệ huyết thống có liên quan đến nhiễm sắc thể X [5] Mồi cho phản ứng PCR STRs thiết kế bổ sung với trình tự nằm vùng biên (flanking regions) trình tự lặp lại Phương pháp sử dụng để phân tích ADN hình sự, hai mồi gắn màu huỳnh quang Các alen khác locus khác phải phân biệt màu sắc khác kết hợp nhiều locus phản ứng PCR Như việc gắn huỳnh quang để ngăn chặn alen locus khác bị trùng kích thước lên [12] 1.3.3 Điện di phát STRs Điện di gel sử dụng để phân tách đoạn ADN sử dụng phương pháp RFLP phân tích STRs trước hệ thống điện di mao quản trở nên có sẵn Sử dụng kết điện di mao quản giúp phân tích nhanh xác Hiện nay, công nghệ điện di mao quản coi “tiêu chuẩn 10 Footer Page 19 of 126 Header Page 20 of 126 Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH vàng” phân tích giám định hình [20] Hầu hết hệ thống điện di mao quản sản xuất công ty Applied Biosystems Điện di mao quản sử dụng mao quản dài hẹp có chứa polymer đặc biệt cho phép phân tách đoạn ADN khác theo kích thước Sản phẩm PCR bổ sung vào ống mao quản Trong suốt trình điện di, đoạn có kích thước nhỏ chạy nhanh đoạn lớn Trong trình phân tách, đoạn sản phẩm PCR chiếu chùm tia laser cho phép phát màu huỳnh quang khác gắn mồi để phát ánh sáng có bước sóng riêng Hệ thống phát bước sóng cho phép so sánh với hệ thống thang chuẩn điện di song song với mẫu Từ đó, loạt đỉnh dựng lên thể mối quan hệ tín hiệu huỳnh quang gắn vào đoạn STR với thuốc nhuộm đặc biệt so với thời gian di chuyển Hệ thống phần mềm máy tính xử lí thông tin cung cấp kích thước alen khác trình điện di kiểu gen chúng (số lần đơn vị lặp lại) [12] Hình 1.2 Hình ảnh máy điện di mao quản 3130xl với 16 mao quản 1.3.4 Giải trình tự hệ – Next Generation Sequencing (NGS) 1.3.4.1Tổng quan NGS 11 Footer Page 20 of 126 Header Page 21 of 126 Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH Công nghệ giải trình tự hệ với đặc điểm hiệu suất cao, giảm chi phí phát triển nhanh chóng năm gần trở thành công cụ phân tích quan trọng cho nhiều nhà di truyền học Hàng triệu hàng tỉ phân tử ADN giải trình tự đồng thời Do đó, hiệu suất trình giải trình tự tăng lên cách đáng kể giảm thiểu việc phải tách dòng trình tự đích giống phương pháp Sanger trước [20] Năm 2005, Roche giới thiệu hệ thống giải trình tự hệ genome 454 – hệ thống giải trình tự liệu đầu lớn theo phương pháp pyrosequencing giới Hệ thống tạo 200 000 đoạn đọc có độ dài khoảng 110bp [13] Năm 2007, Applied Biosystems (ABI) giới thiệu hệ thống giải trình tự hệ thứ hai SOLiD dựa công nghệ nối đoạn oligonucleotide Hệ thống SOLiD sử dụng việc nhân cầu pha cứng (solid – phase bridge amplification), đoạn tiếp hợp đầu 5’ 3’ gắn vào đầu khuôn ADN Cũng thời gian đó, Illumina cho mắt hệ thống giải trình tự Solexa Hệ thống đơn giản hóa phương pháp xây dựng thư viện đảo đầu phương pháp huỳnh quang dẫn dến việc tạo đoạn đọc có độ dài 35bp [3] Năm 2010, hệ thống giải trình tự nhanh hơn, chi phí thấp dựa công nghệ bán dẫn Ion Torrent giới thiệu Đây hệ thống xác định trình tự không dựa vào tín hiệu huỳnh quang mà dựa vào việc đo thay đổi pH việc giải phóng ion H+ gắn nucleotide công nghệ bán dẫn [16] Tất phương pháp giải trình tự dẫn tới ba cải tiến đáng kể so với công nghệ truyền thống [20] - Đầu tiên công nghệ không yêu cầu tách dòng đoạn ADN, mà thay vào cần chuẩn bị thư viện NGS theo mục đích - Thứ hai thay hàng trăm phản ứng giải trình tự công nghệ thực hàng triệu phản ứng đồng thời - Thứ ba, trình tự xuất trực tiếp mà không cần phải điện di Số lần đọc NGS vô lớn, cho phép trình giải trình tự toàn hệ 12 Footer Page 21 of 126 Header Page 22 of 126 Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH gen thời gian ngắn ứng dụng rộng rãi nhiều lĩnh vực khoa học đời sống Tuy nhiên, nhược điểm hệ thống giải trình tự độ dài đoạn đọc tương đối ngắn, dẫn đến khó khăn việc cắt nối trình tự, lắp ráp, thích phân tích tin sinh học [20] 1.3.4.2Triển vọng ứng dụng công nghệ NGS phân tích ADN hình So với lĩnh vực nghiên cứu khác, phân tích ADN hình phải đối mặt với nhiều thách thức lượng mẫu ít, số thấp, nhiều chất ức chế, mẫu đứt gãy mạnh bị nhiễm nhiều nguồn mẫu khác nhau, phải có độ xác cao phải cân nhắc vấn đề thời gian chi phí [20] Hiện nay, công nghệ sử dụng phân tích hình PCR kết hợp với điện di mao quản dựa phương pháp phân tích đoạn ADN phát khác độ dài thị STR Đây coi tiêu chuẩn vàng phân tích với ưu điểm công nghệ là: - Thời gian thực từ khâu tách chiết mẫu tới phân tích kết tương đối ngắn - Quy trình thực đơn giản, có khả linh động việc lựa chọn kit khác tùy theo mối quan hệ muốn phân tích Tuy nhiên, công nghệ tồn nhiều hạn chế định trình PCR giới hạn việc phát tồn yếu tố nhiễu làm ảnh hưởng tới trình đọc kết [5, 12, 20] - Đòi hỏi kỹ thuật viên có kinh nghiệm trình độ tốt để nhận định kết trường hợp nhiễu nhận định alen thật, alen giả, alen hiếm, mẫu lẫn từ nhiều nguồn - Trong trường hợp mẫu trường thường mẫu có chất lượng kém, bị đứt gãy mạnh độ phân giải hệ thống không cao 13 Footer Page 22 of 126 Header Page 23 of 126 Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH Thường không đủ số locus => giám định viên phải thực lại nhiều lần thu kết để đối chiếu so sánh - Các yếu tố nhiễu phát sinh trình PCR tượng stutter, phát sinh trình điện di mao quản tượng lẫn màu, băng không đặc hiệu, tín hiệu cao, tượng alen không gọi cách tự động Từ khó khăn tồn đọng hệ thống giải trình tự hệ cũ, nhà khoa học hình nghiên cứu khám phá lợi hệ thống giải trình tự hệ Đồng thời nhà nghiên cứu nhận định hệ thống giải trình tự giải pháp đầy hứa hẹn cho giám định ADN khoa học hình tương lai [17] 1.4 Hệ thống giải trình tự hệ Illumina - MiSeq FGx 1.4.1 Công nghệ giải trình tự Illumina [22] Hệ thống máy giải trình tự Illumina sử dụng công nghệ giải trình tự theo phương pháp tổng hợp (Sequencing by Synthesis) kết hợp với việc sử dụng nucleotide có gắn tín hiệu huỳnh quang khóa dừng thuận nghịch để đọc nhận biết trình tự cách trực tiếp Nguyên tắc công nghệ giải trình tự Illumina giống với giải trình tự điện di mao quản ADN polymerase xúc tác cho trình ghép deoxyribonucleotide triphosphates gắn huỳnh quang vào mạch khuôn ADN suốt chu kì tổng hợp Trong suốt chu kì, nucleotit có kết hợp phát xạ huỳnh quang Đặc điểm khác thay vào việc giải trình tự sợi ADN, công nghệ giải trình tự hệ cho phép giải trình tự đồng thời nhiều gen lúc Công nghệ giải trình tự phương pháp tổng hợp (SBS) đưa kết có xác cao, tăng tỉ lệ đọc đoạn ADN Quy trình giải trình tự hệ gồm có bước chính: Chuẩn bị thư viện (Library Preparation) 14 Footer Page 23 of 126 Header Page 24 of 126 Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH Bao gồm việc chuẩn bị thực theo quy trình kit ForenSeq DNA Signature Prep Mẫu khuếch đại đoạn ADN đặc hiệu gắn thêm adapter riêng biệt để phân biệt mẫu với Cuối cùng, mẫu trộn lại chung đưa vào máy giải trình tự Tạo Cluster Thư viện sau chuẩn bị máy đưa tự động lên flow cell – nơi có đoạn nhỏ oligo nucleotit gắn lên bề mặt có tương thích với adapter Mỗi đoạn khuếch đại riêng biệt tách thành nhóm cluster thông qua phản ứng khuếch đại đường cầu Sau trình tạo cluster mạch khuôn sẵn sàng cho việc giải trình tự Giải trình tự Giải trình tự công nghệ tổng hợp Kết có độ xác đến base Phân tích kết Hệ thống có server kèm sử dụng phần mềm riêng biệt để phân biệt so sánh mẫu với Chuẩn bị thư viện 15 Footer Page 24 of 126 Header Page 25 of 126 Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH Tạo Cluster Giải trình tự Hình 1.3 Quy trình giải trình tự hệ Illumina 1.4.2 Giải pháp NGS cho lĩnh vực hình Illumina [23] Hệ thống MiSeq FGx hệ thống hãng Illumina giới thiệu sử dụng riêng cho hình Hệ thống mắt vào tháng năm 2015 đứng thứ hai top 10 danh sách sản phẩm khoa học đổi cho năm 2015 Hệ thống MiSeq FGx đánh giá giải pháp hoàn chỉnh cho lĩnh vực hình Với đặc điểm như: - Chỉ sử dụng kit hoàn thiện phân tích thị ADN hình STRs SNPs - Tổng số dấu chuẩn kit chuẩn bị thư viện 233 Từ cung cấp lượng thông tin lớn mang độ tin cậy xác cao - Kết hợp đồng thời STR nhiễm sắc thể thường (28 locus), nhiễm sắc thể giới tính Y (24 locus) nhiễm sắc thể giới tính X (7 locus) Bên 16 Footer Page 25 of 126 Header Page 26 of 126 Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH cạnh có 94 SNPs mang thông tin giúp phân biệt nhận diện cá thể - Kích thước đoạn amplicon sau khuếch đại từ 60 – 460bp Điều có ý nghĩa phân tích mẫu bị đứt gãy mạnh, mẫu có chất lượng mẫu xương - Có khả dự đoán kiểu hình nguồn gốc chủng tộc cá thể có chứa ancestry SNPs phenotyping SNPs - Số lượng mẫu tối đa thực 96 mẫu - Lượng ADN khuyến cáo tương đối thấp - Tất hóa chất phải sử dụng gói gọn kit 1ng Hình 1.4 Bộ kit chuẩn bị thư viện ForenSeqTM DNA Signature Prep 1.4.3 Tình hình thực tế Việt Nam Hiện Việt Nam, giải trình tự phương pháp điện di mao quản tiêu chuẩn vàng phòng giám định gen Viện Khoa học Hình Tuy nhiên sau thời gian dài sử dụng, giới hạn mặt công nghệ phương pháp cũ xuất mà chưa có giải pháp cụ thể giải trường hợp án khó Tháng năm 2015, Viện bắt kịp đơn vị mua cài đặt hệ thống máy MiSeq FGx Illumina Để đánh giá thực tế lợi máy MiSeq FGx mang lại, tiến hành đề tài: “Đánh giá kit ForenSeq hệ thống MiSeq FGx ứng dụng định danh cá thể ngƣời Việt Nam” Đề tài thực Trung tâm giám định Sinh học pháp 17 Footer Page 26 of 126 Header Page 27 of 126 Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH lý - Viện Khoa học Hình Trung tâm dịch vụ phân tích di truyền - GENTIS hỗ trợ công ty BIOMEDIC hãng ILLUMINA 18 Footer Page 27 of 126 Header Page 28 of 126 Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH Tài liệu tham khảo Tiếng Việt Nguyễn Văn Đức (2002), Phương pháp kiểm tra thống kê Sinh học, Nhà xuất khoa học kỹ thuật, Hà Nội Phạm Xuân Kiều (2005), Giáo trình Xác suất thống kê, NXB GD, Hà Nội Tiếng Anh Bentley D R (2006), “Whole-genome resequencing”, Current Opinion in Genetics & Development, 16 (6), pp 545-552 Buckleton J., Triggs C M., Walsh S J (2005), “Forensic DNA evidence interpretation”, CRC Press, USA Butler J M (2011), “Advanced Topics in Forensic DNA Typing: Methodology”, Academic Press, China Butler J M., Coble M D., Vallone P M (2007), “STRs vs SNPs: thought on the future of forensic DNA testing”, Forensic Sci Med Pathol, 3, pp 200-205 ILLUMINA (2015), ForenSeqTM DNA Signature Prep Reference Guide, Illumina, San Diego ILLUMINA (2015), MiSeq FGxTM Instrument Reference Guide, Illumina, San Diego ILLUMINA (2011), CASAVA v1.8.2 User Guide, Illumina, San Diego 10 Jennifer D C (2016), “Evaluation of the Illumina® Beta Version ForenSeqTM DNA Signature Prep Kit for use in genetic profiling”, Forensic Science International: Genetics, 20, pp 20-29 11 Juan J S (2006), “A multiplex assay with 52 single nucleotide polymorphisms for human identification”, Electrophoresis, 27, pp 17131724 48 Footer Page 28 of 126 Header Page 29 of 126 Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH 12 Kobilinsky L., Levine L.; Margolis – Nunno H (2007), “Forensic DNA Analysis”, Chelsea House, USA 13 Mardis E R (2008), “The impact of nextgeneration sequencing technology on genetics”, Trends in Genetics, 24 (3), pp 133-141 14 Martin P D., Schmitter H., Schneider P.M (2001), “A brief history of the formation of DNA databases in forensic science within Europe”, Forensic Science International, 119 (2), pp 225-231 15 Patel J (2014), “Forensic Conception: DNA typing of FTA Spotted Samples”, Journal of Applied Biology & Biotechnology, 2(10), pp 021-029 16 Rothberg J M., Hinz W., Rearick T M., Schultz J et al (2011), “An integrated semiconductor device enabling non – optical genome sequencing”, Nature, 475 (7356), pp 348-352 17 Stefano C (2015), “MiSeq FGx sequencing system: A new platform for forensic genetics, Forensic Science International: Genetics Supplement Series 5, pp 98-100 18 Walsh P S (1991), “Chelex 100 as a medium for simple extraction of DNA for PCR – based typing from forensic material”, BioTechniques,10(4), pp 506-513 19 Wing Kam Fung, Yue – Qing Hu (2008), Statistical DNA Forensic: Theory, Methods and Computation, John Wiley & Sons, Hong Kong 20 Yang Y., Xie B., Yan (2014), “Application of Next – Generation Sequencing Technology in Forensic Science”, Genomicis Proteomics Bioinformatics, 12 (5), pp 190-197 21 Zagorski N (2006), “Profile of Alec J Jeffreys”, PNAS, 103 (24), pp 89188920 22 http://www.illumina.com/documents/products/techspotlights/techspotlight_s equencing.pdf 49 Footer Page 29 of 126 Header Page 30 of 126 Luận văn cao học - 2016 Nguyễn Thị Hồng Nhung – K23CH 23 http://www.illumina.com/content/dam/illuminamarketing/documents/products/datasheets/miseq-fgx-system-spec-sheet1470-2014-004.pdf 50 Footer Page 30 of 126 ... MiSeq FGx giới Vì vậy, thực đề tài: Đánh giá kit ForenSeq hệ thống MiSeq FGx ứng dụng định danh cá thể ngƣời Việt Nam Trước đây, chưa có nghiên cứu đánh giá khả ứng dụng hệ thống MiSeq FGx phân... cài đặt hệ thống máy MiSeq FGx Illumina Để đánh giá thực tế lợi máy MiSeq FGx mang lại, tiến hành đề tài: Đánh giá kit ForenSeq hệ thống MiSeq FGx ứng dụng định danh cá thể ngƣời Việt Nam Đề... Hồng Nhung ĐÁNH GIÁ BỘ KIT FORENSEQ TRÊN HỆ THỐNG MiSeq FGx ỨNG DỤNG TRONG ĐỊNH DANH CÁ THỂ NGƢỜI VIỆT NAM Chuyên ngành : Di truyền học Mã số: 60420121 dẫNLUẬN VĂN THẠC SĨ KHOA HỌC Cán hƣớng dẫn: