Bài giảng tin sinh học chương 5 ths nguyễn thành luân

25 472 0
Bài giảng tin sinh học  chương 5   ths  nguyễn thành luân

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

10/19/2012 TRƢỜNG ĐẠI HỌC CNTP TPHCM KHOA CNSH & KTMT HỆ LIÊN THÔNG ĐẠI HỌC Chƣơng Giải mã trình tự toàn bộ gen ThS Nguyễn Thành Luân Email: luannt@cntp.edu.vn Tại cần thiết phải giải mã toàn bộ gen?       Sự minh chứng cho việc giải mã trình tự gene Bản hướng dẫn cho ngành sinh học thể sống Khám phá gen mã hóa gen loài động vật –trong việc đoạn trình tự gen, “đoạn gen cần quan tâm” giải mã Phân biệt dòng giống từ khác biệt trình tự gen Khám phá kiểu di truyền gây đột biến khác Khám phá đột biến gây bệnh di truyền 10/19/2012 Phản ứng giải mã trình tự đƣợc phát minh Fred Sanger  Sử dụng enzyme DNA polymerase để tổng hợp sợi DNA bổ sung cho mảnh DNA mà bạn muốn giải mã trình tự  Các phản ứng chứa „điểm đích‟ để tạm dừng trình tổng hợp –cung cấp sản phẩm DNA với kích cỡ riêng biệt (bp) 10/19/2012 Giải mã trình tự Sanger  Hoạt động thực phản ứng nhẹ nhàng phá gãy đoạn DNA chuẩn tái tạo, xúc tác enzyme DNA polymerase Phản ứng giải mã trình tự 10/19/2012 Các bƣớc giải mã trình tự Thêm đoạn mồi: mảnh ngắn DNA đƣợc kết hợp đến nơi mẫu khuôn DNA Thêm enzyme cắt DNA polymerase: có nhiệm vụ tổng hợp sợi DNA Thêm nhóm bazơ nitric (4 nitrogenous bases): kết hợp chặt chẽ sợi Thêm nhóm dideoxynucleotide (ddNTPs– đƣợc gọi điểm đích đƣợc thêm vào sợi DNA đƣợc tổng hợp nhƣng kết thúc phản ứng 10/19/2012 Sản phẩm phản ứng giải mã trình tự      Phản ứng diễn 1000 lần từ sợi DNA khuôn - Mỗi vị trí có đánh dấu nhiều lần Chấp nhận chuỗi hỗn hợp phản ứng vào gel polyacrylamide SDS Gel phân chia đoạn DNA phân mảnh thành kích cỡ khác Đoạn DNA ngắn di chuyển xuống dƣới nhanh Gel có khả phân giải đoạn phân mảnh khác base riêng lẻ 10/19/2012    Với việc sử dụng phần mềm khác nhau, cung cấp cho chúng ta1 hình ảnh gel nhƣ Mỗivạch (band) tƣơng ứng cho mảnh đoạn DNA khác đoạn chiều dài nucleotide Màu sắc vạch biểu thị cho việc ddNTPs đƣợc kết hợp đoạn DNA Giải mã trình tự đơn giản đọc lại kết gel Giải mã trình tự khu vực gel để đọc kết giải mã 10/19/2012 Phản ứng giải mã trình tự tiên phát (primary)    Không sử dụng thuốc nhuộm (dyes) chưa phát minh Các ký tự đích (terminator) đánh dấu chất phóng xạ Thực phản ứng riêng biệt, phản ứng khác với ký tự đích khác Quá trình giải mã trình tự chậm cho Genomics   Trong việc xác định phản ứng trình tự riêng lẻ, hầu hết tối đa khoảng 500 base/1 lần giải mã trình tự Mỗi base phải đọc film X-ray ghi lại kết cách thủ công (tay, thuê nhân công ) 10/19/2012 Quá trình giải mã trình tự chậm cho Genomics    Bacteriophage có 5000bp – Mất năm để hoàn thành việc giải mã Các loài đơn giản (Vi khuẩn) có genome khoảng 2,000,000 bp –Mất khoảng1,600 năm cho việc giải mã 10/19/2012 Phƣơng pháp tạo phản ứng việc giải mã  Các mục tiêu việc giải mã trình tự phân mảnh lớn DNA  PP Walking  PP Shotgun Phản ứng Walking  Phản ứng giải mã trình tự cung cấp 500 bp trình tự thông tin Việc giải mã 500 bp phụ thuộc vào trình tự thông tin DT đoạn mã trước Tuy nhiên, trình tự genome dài  Quy trình phản ứng đạt tối đa 1kbase/2 ngày Việc giải mã trình tự toàn bộ genome 6,000,000 ngày 10/19/2012 Phƣơng pháp Shotgun   Lấy nhiều đoạn copy DNA ngẫu nhiên gen, giải mã trình tự 500bp từ đoạn DNA Sau xếp tất trình tự thành trình tự gen hoàn chỉnh Phải giải mã trình tự gen nhiều lần để chắn không bị trùng lặp PP làm nhiều phản ứng trình tự đồng thời lúc Walking vs Shotgun     Walking hiệu –giải mã trình tự Walking thường chậm hơn, đến 2-3 ngày để thiết kế tổng hợp mồi (primer) cho trình tự Shotgun hiệu giải mã trình tự ngẫu nhiên, cần phải giải mã trình tự 10 lần lặp lại Nhanh Walking –không cần tổng hợp thiết kế mồi (primer) –sử dụng loại giống cho tất phản ứng 10 10/19/2012 Các khó khăn gặp phải giải mã trình tự genome     Bất kỳ genome phải phân mảnh để giải mã trình tự Hầu hết, phải đạt 500 base pair cho trình tự từ đoạn phân mảnh Sau giải mã, trình tự phải đặt vào với thành gen hoàn chỉnh Mỗi đoạn phân mảnh 500 bp phải so sánh với đoạn trình tự phân mảnh 500 bp khác Vận hành phƣơng pháp Shotgun  Các phân mảnh phân chia ngẫu nhiên, trình tự phân mảnh phải giải mã để đảm bảo độ bao phủ tất trình tự  Một số phân mảnh chứa nhiều thông tin trình tự diện trình tự khác = đoạn lặp (overlaps)  Các đoạn lặp cần thiết cho việc kết nối phân đoạn DNA lại với 11 10/19/2012 Vận hành phƣơng pháp Shotgun  Quy tắc chung –giải mã 10 lần kích cỡ gen để đảm bảo độ bao phủ hoàn toàn trình tự giải mã  VD: genome 5kbase=5000base, máy giải mã phải giải mã 5000*10/500 trình tự = 100 đoạn Để kết hợp lại, phải làm phép so sánh đoạn phân mảnh DNA (comparisons) = C(100,2) C(100,2) = 4,950 phép so sánh Các phép so sánh  Đối với genome ngƣời, có nhiều phép so sánh cần phải thực hiện, phải nhiều năm để tính toán thời gian hoàn thành 12 10/19/2012 CÁC HƢỚNG KHẮC PHỤC  Giải pháp 1: Mô hình huy động quỹ cộng đồng  Giải pháp 2: Mô hình hỗ trợ cá nhân Giải pháp 1: Mô hình huy động quỹ cộng đồng Phân chia genome thành “khúc” (chunks) lớn theo thứ tự định, sau giải mã trình tự khúc PP shotgun  Những khúc xếp cầu thành đồ vật chất genome  Đặt khúc vào thứ tự (bản đồ vật chất) tạo nên điểm cốt yếu thời gian  Quay lại điểm sau giải mã  Ƣớc lƣợng chi phí: 1000 ngƣời làm việc vòng 30 năm = tỷ US dollars  13 10/19/2012 Mô hình phân chia kết hợp Mô hình cộng đồng cho việc giải mã trình tự Genome ngƣời  I: Cung cấp đồ vật chất genome  II: Trình diễn (perform) phản ứng giải mã trình tự  III: Kết hợp phân mảnh/miếng (piece) trình tự với 14 10/19/2012 Bản đồ vật chất      Bộ genome người –3.3 gigabase (Gb) (3.3 x 109 bp) Mỗi NST lớn để quan sát phân tích trình tự Khởi đầu genome phải phân đoạn thành miếng/mảnh nhỏ hơn, quan sát phân tích trình tự Làm phân mảnh –tạo nên nguồn nguyên liệu vô tận Tạo nên đồ vật chất để kết hợp mảnh nhỏ lại với để xây dựng đồ gene Sự phân đoạn   Quyết định việc phát sinh đoạn DNA lặp (overlapping) Nguyên liệu khởi đầu hàng triệu NST –Sự phân cắt enzyme cắt hạn chế (RE disgestion) –Sự dịch chuyển học (Mechanical shearing) –Sự chia cắt NST (Chromosomal separation) 15 10/19/2012 Enzyme cắt hạn chế (RE Digestion)  Phân cắt enzyme cắt hạn chế (RE): mục tiêu cung cấp phân mảnh 10-150 kbase, RE có chiều dài khác nhau: –Nhóm RE 4-base cắt lần khoảng 256 bases/trình tự –Nhóm RE 6-base cắt lần khoảng 4096 bases/trình tự –Nhóm RE 8-base cắt lần khoảng 65 kbases/trình tự  Tuy nhiên, thực tế, phần cắt mảnh DNA chủ yếu dùng nhóm RE base 16 10/19/2012     Sự chia cắt vật chất NST thường sử dụng FACS (máy phân loại tế bào hoạt động gắn huỳnh quang) Vạch đích huỳnh quang gắn vào NST Số lượng vạch đánh dấu đích cân xứng với kích cỡ NST Các giọt nhỏ giọt, loại chứa NST di chuyển qua đầu điện cực Sự di chuyển điện cực phổ biến thành giọt nhỏ đủ tiêu chí kích cỡ vạch đích (dye) Một số giọt nhỏ bị lệch chia cắt từ số NST khác Bất tử phân mảnh  Bằng việc xây dựng ngân hàng genome – Đặt phân mảnh DNA vào sợi DNA thể VSV phòng thí nghiệm – Một phân mảnh/1 Vi khuẩn – Phân lập loại VSV – Có trình chuẩn bị cho phân mảnh – Có thể phát triển vi khuẩn môi trường nuôi cấy để cung cấp số lượng lớn phân mảnh 17 10/19/2012 Mỗi đoạn DNA đƣợc phân lập cách cấy đĩa loại vi khuẩn riêng lẻ Thực tế, phân mảnh đƣợc mã hóa (số hóa) cho việc theo dõi thuận tiện 18 10/19/2012 Triển vọng hạn chế ứng dụng tin sinh học giải mã trình tự gen  Hầu hết trình tự sau đƣợc phân mảnh phải thời gian xếp lại theo thứ tự  Ví dụ: xác định đoạn lặp (overlap) số với đoạn số 18, 18 với 1078… Tìm kiếm đoạn lặp  Đòi hỏi số cách tính toán trình tự đoạn phân mảnh  Sử dụng trình cắt hạn chế (Restriction digest)  Xử lý qua điện di phân mảnh (gel agarose) 19 10/19/2012 Gel điện di agarose đƣợc sử dụng để chia cắt phân đoạn DNA dựa vào kích cỡ (size) Các đoạn lặp có số vạch chung giếng khác Mô hình hỗ trợ cá nhân  Kế hoạch giải mã trình tự toàn bộ genome PP Shotgun  Bỏ qua giai đoạn lập đồ vật chất  Phân mảnh genome, giải mã trình tự nhiều mảnh 500 bp sau cố gắng đặt chúng lại với  Sử dụng phát minh –mô hình cặp bạn bè (mate-pair) mô hình khung giáo (scaffold) 20 10/19/2012 Mô hình “Mate-Pair” “Scaffold”    Mã hóa mảnh thông tin bổ sung cách đọc khoảng cách xác cặp trình tự Genome phân mảnh thành đoạn lặp biết chiều dài –2 kbase –10 kbase –50 kbase –150 kbase Giải mã trình tự đầu đoạn phân mảnh DNA Mô hình Shotgun thông thƣờng  Ngẫu nhiên phân mảnh giải mã đoạn DNA 500 bp, xác định đoạn lặp  Mỗi nhóm phân đoạn lặp đƣợc gọi đoạn tiếp giáp (contig)= phân mảnh liền kề trình tự DNA 21 10/19/2012 Mô hình Shotgun qua Mate-Pair  Phân mảnh sợi DNA thành đoạn lặp giống hệt kích thước trọng lượng (VD: 50 kbase)  Các đoạn phân mảnh giống hệt chiều dài trọng lượng anh em nên gọi „Mate-Pair‟ Mỗi đoạn phân mảnh tiếp giáp nhỏ đƣợc lắp ráp máy vi tính theo phƣơng pháp Shotgun thông thƣờng, nhƣng nhóm đoạn tiếp giáp riêng lẻ có phân đoạn “bạn bè” đầu đoạn DNA 50 kb đƣợc giải mã trình tự 22 10/19/2012 Mô hình giàn khung (Scafffold)  Scaffold thay cho việc lập đồ vật chất –do quy trình thực nhanh Về lý thuyết, kết nối thành gen hoàn chỉnh từ trình tự giải mã sử dụng mô hình giàn khung  Trình tự genome cuối kết nối hướng việc chứa đoạn khoảng trống (gaps) trình tự lặp Mô hình kết hợp giúp cho việc bù đắp đoạn gaps  Vì thế, mô hình hỗ trợ cá nhân sử dụng thông tin đồ vật chất thiết kế mô hình gây quỹ cộng đồng để giúp cho việc bù đắp đoạn gap   Các đoạn tiếp giáp gia nhập nhóm DNA bạn bè nên gọi mô hình nhóm bạn bè (Mate-pairs) hướng theo đặt nhóm tiếp giáp liên quan với nhóm khác Khi ngày nhiều cặp bạn bè so sánh, giàn khung giáo (scaffold) từ từ xây dựng 23 10/19/2012 Mất bao lâu?   Dự đoán đầu tiên: 30 năm Với ứng dụng KHKT với máy giải mã trình tự tự động (automated sequencer) bỏ qua việc tìm hiểu đồ vật chất cho genome người hoàn chỉnh –Một robot giải mã trình tự phòng TN giải mã trình tự 4.96 x 106bases ngày –Bộ genome người 3.3 x 109bases –Cần đảm bảo độ bao phủ nên phải 3.3 x 1010bases –Tốn 6,653 ngày cho phòng thí nghiệm = 18 năm –Xây dựng 20 phòng thí nghiệm có quy mô PTN –Giải mã toàn bộ genome khoảng 330 ngày Các hƣớng giải việc giải mã gen Một nhà máy giải mã trình tự tự động hóa 24 10/19/2012 Tài liệu tham khảo http://www.youtube.com/watch?v=8n2LvJm0n0&feature=related KẾT THÚC CHƢƠNG V 25 [...]... sẽ chứa nhiều thông tin trình tự đã hiện diện ở trình tự khác = đoạn lặp (overlaps)  Các đoạn lặp này rất cần thiết cho việc kết nối các phân đoạn DNA lại với nhau 11 10/19/2012 Vận hành phƣơng pháp Shotgun  Quy tắc chung –giải mã ít nhất 10 lần kích cỡ bộ gen để đảm bảo độ bao phủ hoàn toàn trình tự giải mã  VD: 1 bộ genome 5kbase =50 00base, máy giải mã phải giải mã 50 00*10 /50 0 trình tự = 100 đoạn... dịch chuyển cơ học (Mechanical shearing) –Sự chia cắt NST (Chromosomal separation) 15 10/19/2012 Enzyme cắt hạn chế (RE Digestion)  Phân cắt bằng enzyme cắt hạn chế (RE): mục tiêu là cung cấp các phân mảnh 10- 150 kbase, các RE có chiều dài khác nhau: –Nhóm RE 4-base cắt 1 lần khoảng 256 bases/trình tự –Nhóm RE 6-base cắt 1 lần khoảng 4096 bases/trình tự –Nhóm RE 8-base cắt 1 lần khoảng 65 kbases/trình... nhiều mảnh 50 0 bp sau đó cố gắng đặt chúng lại với nhau  Sử dụng 1 phát minh mới –mô hình các cặp bạn bè (mate-pair) và mô hình khung giáo (scaffold) 20 10/19/2012 Mô hình “Mate-Pair” và “Scaffold”    Mã hóa 1 mảnh thông tin bổ sung bằng cách đọc các khoảng cách chính xác giữa các cặp trình tự Genome được phân mảnh thành các đoạn lặp đã biết được chiều dài như –2 kbase –10 kbase 50 kbase – 150 kbase...    Bất kỳ bộ genome nào cũng phải được phân mảnh để có thể giải mã trình tự Hầu hết, phải đạt 50 0 base pair cho mỗi trình tự từ đoạn phân mảnh Sau khi giải mã, các trình tự phải được đặt vào với nhau thành 1 bộ gen hoàn chỉnh Mỗi đoạn phân mảnh 50 0 bp phải được so sánh với 1 đoạn trình tự phân mảnh 50 0 bp khác Vận hành phƣơng pháp Shotgun  Các phân mảnh được phân chia ngẫu nhiên, các trình tự của... DNA có thể đƣợc phân lập bằng cách cấy đĩa mỗi loại vi khuẩn riêng lẻ Thực tế, mỗi phân mảnh đƣợc mã hóa (số hóa) cho việc theo dõi thuận tiện hơn 18 10/19/2012 Triển vọng và hạn chế của ứng dụng tin sinh học trong giải mã trình tự bộ gen  Hầu hết các trình tự sau khi đƣợc phân mảnh phải mất thời gian sắp xếp lại theo đúng thứ tự  Ví dụ: xác định đoạn lặp (overlap) số 3 với đoạn số 18, 18 với 1078…... (comparisons) = C(100,2) C(100,2) = 4, 950 phép so sánh Các phép so sánh  Đối với bộ genome ngƣời, có quá nhiều phép so sánh cần phải thực hiện, sẽ phải mất rất nhiều năm để tính toán thời gian hoàn thành 12 10/19/2012 CÁC HƢỚNG KHẮC PHỤC  Giải pháp 1: Mô hình huy động quỹ cộng đồng  Giải pháp 2: Mô hình hỗ trợ cá nhân Giải pháp 1: Mô hình huy động quỹ cộng đồng Phân chia genome thành các “khúc” (chunks) lớn... Shotgun thông thƣờng  Ngẫu nhiên phân mảnh và giải mã đoạn DNA 50 0 bp, và xác định các đoạn lặp  Mỗi nhóm của phân đoạn lặp sẽ đƣợc gọi là 1 đoạn tiếp giáp (contig)= 1 phân mảnh liền kề của trình tự DNA 21 10/19/2012 Mô hình Shotgun qua Mate-Pair  Phân mảnh các sợi DNA thành các đoạn lặp giống hệt nhau về kích thước và trọng lượng (VD: 50 kbase)  Các đoạn phân mảnh giống hệt nhau về chiều dài và... để quan sát và phân tích trình tự Khởi đầu genome phải được phân đoạn thành các miếng/mảnh nhỏ hơn, có thể quan sát và phân tích trình tự Làm bất tử các phân mảnh –tạo nên các nguồn nguyên liệu vô tận Tạo nên 1 bản đồ vật chất để kết hợp những mảnh nhỏ lại với nhau để xây dựng bản đồ gene Sự phân đoạn   Quyết định trong việc phát sinh ra các đoạn DNA lặp (overlapping) Nguyên liệu khởi đầu là hàng triệu... giờ mỗi nhóm đoạn tiếp giáp riêng lẻ có thể có các phân đoạn “bạn bè” bởi vì cả 2 đầu của mỗi đoạn DNA 50 kb đƣợc giải mã trình tự 22 10/19/2012 Mô hình giàn khung (Scafffold)  Scaffold thay thế cho việc lập bản đồ vật chất –do quy trình thực hiện nhanh hơn Về lý thuyết, chúng ta có thể kết nối thành bộ gen hoàn chỉnh từ các trình tự giải mã sử dụng mô hình giàn khung  Trình tự bộ genome cuối cùng... 3.3 x 1010bases –Tốn mất 6, 653 ngày cho 1 phòng thí nghiệm = 18 năm –Xây dựng 20 phòng thí nghiệm có quy mô như PTN trên –Giải mã toàn bộ bộ genome chỉ mất khoảng 330 ngày Các hƣớng giải quyết mới trong việc giải mã bộ gen Một nhà máy giải mã trình tự tự động hóa 24 10/19/2012 Tài liệu tham khảo http://www.youtube.com/watch?v=8n2LvJm0n0&feature=related KẾT THÚC CHƢƠNG V 25 ... VD: genome 5kbase =50 00base, máy giải mã phải giải mã 50 00*10 /50 0 trình tự = 100 đoạn Để kết hợp lại, phải làm phép so sánh đoạn phân mảnh DNA (comparisons) = C(100,2) C(100,2) = 4, 950 phép so... phải đạt 50 0 base pair cho trình tự từ đoạn phân mảnh Sau giải mã, trình tự phải đặt vào với thành gen hoàn chỉnh Mỗi đoạn phân mảnh 50 0 bp phải so sánh với đoạn trình tự phân mảnh 50 0 bp khác... Shotgun Phản ứng Walking  Phản ứng giải mã trình tự cung cấp 50 0 bp trình tự thông tin Việc giải mã 50 0 bp phụ thuộc vào trình tự thông tin DT đoạn mã trước Tuy nhiên, trình tự genome dài  Quy

Ngày đăng: 06/12/2015, 17:07

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan