Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 13 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
13
Dung lượng
3,61 MB
Nội dung
6/3/2021 HỆ GEN HỌC: CẤU TRÚC VÀ CHỨC NĂNG Learning materials HỆ GEN HỌC: CẤU TRÚC VÀ CHỨC NĂNG HỆ GEN HỌC: CẤU TRÚC VÀ CHỨC NĂNG Bản đồ di truyền Bản đồ vật lý Giải trình tự hệ gen Chú giải hệ gen - Công cụ tin sinh SNP (Single-Nucleotide Polymorphisms) Số (Copy-Number Variations) Metagenomics Sinh học tổng hợp - Synthetic Biology Nghiên cứu hệ phiên mã Nghiên cứu hệ protein (proteomics) CẤU TRÚC HỆ GEN Bản đồ di truyền ‒ đồ vị trí gen nhiễm sắc thể xác định tần số hốn vị gen Ví dụ 1: Gen A B nằm NST – khoảng cách A B? f(ab) = 25% Khoảng cách A B = 25 cM Ví dụ 2: Gen A, B C nằm NST – khoảng cách A, B C? f(ab) = 25%, f( ac) = 15%, f (bc) = 10% A cm (m.u) C B 6/3/2021 More accurate CẤU TRÚC HỆ GEN Limited accurate Bản đồ di truyền Nhược điểm CẤU TRÚC HỆ GEN Bản đồ vật lý : đồ vị trí gen dựa trình tự nucleotit (lập đồ tần số tái tổ hợp) Nghiên cứu gen ̶ => gen không biểu kiểu hình=> khơng xác định tần số trao đổi chéo => khơng xác định vị trí Độ phân giải thấp ̶ Hệ gen người 3.2 tỷ bp có 4000 cM => cM = 800,000 bp Có sai sót điểm nóng trao đổi tréo ̶ Ưu điểm ̶ Làm sở để xây dựng đồ vật lý Làm để đọc trình tự tồn nhiễm sắc thể GIẢI TRÌNH TỰ HỆ GEN NGƯỜI Figure 20.4 TECHNIQUE Bacterial plasmid ampR gene Hummingbird cell lacZ gene Restriction site Hệ gen người 2003: phương pháp lập đồ Sticky ends Nhắc lại phương pháp: Ghép lại Ghép lại Cắt ADN enzyme giới hạn Nhân dòng chọn lọc vector mang gen mong muốn Gene of interest Hummingbird DNA fragments Nhân dòng DNA (Vector) Recombinant plasmids Nonrecombinant plasmid Bacteria carrying plasmids Ghép nối đoạn DNA (Chọn đoạn ADN với số lượng nhất) Giải trình tự đoạn RESULTS Colony carrying nonrecombinant plasmid with intact lacZ gene Colony carrying recombinant plasmid with disrupted lacZ gene One of many bacterial clones 6/3/2021 GIẢI TRÌNH TỰ HỆ GEN NGƯỜI Ghép lại Cắt ADN enzyme giới hạn Ghép lại GIẢI TRÌNH TỰ HỆ GEN Ghép đoạn ADN Hệ gen người 2003: phương pháp lập đồ Nhân dòng DNA (Vector) Bản đồ giới hạn ─ Xác định vị trí cắt enzyme giới hạn ADN Đoạn ADN 13 (13-kb) Cắt enzyme giới hạn với EcoRI BamHI: Ghép nối đoạn DNA (Chọn đoạn ADN với số lượng nhất) Giải trình tự đoạn GIẢI TRÌNH TỰ HỆ GEN NGƯỜI GIẢI TRÌNH TỰ HỆ GEN NGƯỜI Ghép đoạn ADN Phương pháp lai chỗ: In situ hybridization Ghép đoạn ADN Bản đồ giới hạn Sử dụng mẫu dò DNA, RNA có gắn huỳnh quang – Bước 1: ủ => mẫu dị bám vào vị trí tương đồng – Bước 2: rửa => rửa mẫu dò – Bước 3: Quan sát (kính hiển vi huỳnh quang) Phương pháp giải trình tự đoạn ADN 6/3/2021 CẤU TRÚC HỆ GEN GIẢI TRÌNH TỰ HỆ GEN NGƯỜI Bản đồ vật lý : xác định vị trí gen dựa trình tự nucleotit Ghép đoạn ADN • Sử dụng đồ di truyền Ghép lại Ghép lại Cắt ADN enzyme giới hạn Nhân dịng ADN Giải trình tự hệ gen dựa phương pháp lập đồ Giải trình tự đoạn Dự án hệ gen người Hệ gen người: Giải trình tự hệ gen thơng qua lập đồ Chính xác Tốn kèm Giải trình tự phương pháp shotgun sequencing Kém xác Giá rẻ Thách thức giải trình tự hệ gen Loại bỏ trình tự nhiễu từ trình tự ngắn ?? Several assemblers available, which is best ?? Lắp ráp hệ gen từ trình tự ngắn ?? Annotation and validation of assembled genome ?? 6/3/2021 6/3/2021 GIẢI TRÌNH TỰ THẾ HỆ MỚI (NGS) Giải trình tự hệ NGS (Next generation sequencing) Giải trình tự hệ 2: GIẢI TRÌNH TỰ THẾ HỆ MỚI (NGS) • Pyro-sequencing 3’ GCGCCGTCCGGAAGCA3’ 5’ CGCGG.………………….5’ (giải trình tự song song lượng lớn) o Roche (454 pyrosequencing) o Illumina (MiSeq/HiSeq) o Life Technologies (Ion Proton/SOLiD) o BGI (DNA nanoball) Một số công nghệ hệ o Pacific biosciences (Single-molecule real-time sequencing) o Oxford Nanopore Technologies (Nanopore) dGTP dGTP Một số cơng nghệ khác o Giải trình tự kính hiển vi điện tử Electron microscopy image of DNA 6/3/2021 GIẢI TRÌNH TỰ THẾ HỆ dGMP + Pi GIẢI TRÌNH TỰ THẾ HỆ Mục tiêu o Giảm giá thành o Tăng độ xác o Giải trình tự phân tử • Pyro-sequencing Giải trình tự song song lượng lớn Một số cơng nghệ hệ o Pac-bio (Single-molecule real-time sequencing) o Oxford Nanopore Technologies (Nanopore) Giải trình tự hệ (NGS) -giải trình tự hệ 2: Roche (454 pyrosequencing) Illumina (MiSeq/HiSeq) Life Technologies (Ion Proton/SOLiD) BGI (DNA nanoball) Nhược điểm hệ 2: trình tự ngắn => Sai sót với ADN lặp lại 6/3/2021 GIẢI TRÌNH TỰ THẾ HỆ Pac-bio (Single-molecule real-time sequencing: SMRT) 6/3/2021 GIẢI TRÌNH TỰ THẾ HỆ Pac-bio (Single-molecule real-time sequencing: SMRT) Tín hiệu huỳnh quang thu lại sát đáy giếng Một nucleotit gắn vào vị trí sợi tổng hợp => phải đến vị trí DNA pol đáy giếng Tín hiệu huỳnh quang sát đáy giếng (gần với phân tử DNA pol) => ghi lại Sau hình thành liên kết phosphodiester tín hiệu huỳnh quang giải phóng khuếch tán ngồi DNA pol dịch chuyển tới vị trí bắt đầu lần đọc GIẢI TRÌNH TỰ THẾ HỆ Pac-bio (Single-molecule real-time sequencing: SMRT) 6/3/2021 Khuôn mạch vịng => đọc nhiều lần khn GIẢI TRÌNH TỰ THẾ HỆ Pac-bio (Single-molecule real-time sequencing: SMRT) Có thể giải trình tự dài >50 kb Đọc sai 10% 6/3/2021 GIẢI TRÌNH TỰ THẾ HỆ Nanopore sequencing GIẢI TRÌNH TỰ THẾ HỆ Nanopore sequencing - + Motor protein: đẩy mạch DNA vào kênh xuyên màng Khi bazơ nitơ (A, T, G, C) qua kênh protein xuyên màng làm thay đổi khả dẫn điện kênh => tín hiệu thay đổi Đọc trình tự dài tới > Mb GIẢI TRÌNH TỰ THẾ HỆ Nanopore sequencing • Phương pháp đẫn đến đọc sai (mất nu q trình đọc) • Đọc sai 5-10% Dự án hệ gen người Kết dự án hệ gen người (2003) Kỳ vọng: thiết kế hoàn chỉnh tế bào thể Kết quả: sách có chữ xếp khơng có quy luật Chúng ta biết q ngơn ngữ tế bào Đoạn ADN gen? Vùng tham gia vào điều khiển gen? ̶ Promoter ? ̶ Enhancer ? ̶ Silencer ? ̶ Intron ? Ngôn ngữ tế bào 6/3/2021 Dự án hệ gen người Dự án hệ gen người Kết dự án hệ gen người (2003) Kết dự án hệ gen người (2003) Lợi ích: ─ Tạo cách mạng giải trình tự gen: mục tiêu($1,000/ genome) ─ Công cụ tin sinh phát đa dạng di truyền hệ gen người (liên quan đến tính trạng, bệnh tật v.v ) Đặc biệt SNP (đa hình đơn nucleotit) Hạn chế: Lạm dụng thông tin hệ gen: Phân biệt đối xử với người mang gen gây bệnh USA: Cấm công ty bảo hiểm/ bảo hiểm y tế sử dụng thông tin hệ gen ─ Phát gen liên quan đến trình phát triển thể ─ Nghiên cứu tiến hóa Bioinformatics CHÚ GIẢI HỆ GEN Genomes CHÚ GIẢI HỆ GEN Genes CƠNG CỤ TIN SINH Trình tự gen biết Các khung đọc mở ORF (open reading frame): Start Stop codon (same frame) Các trình tự DNA bảo thủ sinh vật Trình tự Promoter Trình tự vị trí cắt nối intron/exon Dự đốn Trình tự biểu Trình tự protein Found a gene => BLAST search to find similar sequences 6/3/2021 6/3/2021 Bioinformatics Bioinformatics GenBank DNA DataBank of Japan (DDBJ) European Molecular Biology Laboratory (EMBL) GenBank (NCBI) ĐA HÌNH ĐƠN NUCLEOTIT (SNP) Hệ gen người: 99.9% giống ĐA HÌNH ĐƠN NUCLEOTIT (SNP) SNP phân bố khắp hệ gen: ~1 SNP/1000 bp=> marker đa dạng di truyền 3.2 109 bp x 0.1 % =3.2 106=> làm cho Đặc biệt (UNIQUE) quy định: ─ Kiểu hình ─ Sức khỏe Cá thể A ─ Trí tuệ Cá thể B ─ Cá tính Cá thể C Cá thể D single-nucleotide polymorphism (SNP=“snip”) Là vị trí hệ gen mà cá thể loài khác cặp Nu 6/3/2021 6/3/2021 Single-Nucleotide Polymorphisms ĐA HÌNH ĐƠN NUCLEOTIT (SNP) TRONG HỆ GEN Haplotypes • Là nhóm SNP nhiễm sắc thể • Tải tổ hợp SNP = trao đổi chéo NST ĐA HÌNH ĐƠN NUCLEOTIT (SNP) TRONG HỆ GEN ĐA HÌNH ĐƠN NUCLEOTIT (SNP) TRONG HỆ GEN Haplotypes SNPs – gần => liên kết chặt với xuất Những SNP với => tag SNPs Hệ gen người có 10 triệu SNPs Có khoảng 100,000 Tag SNPs—có thể sử dụng để xác định kiểu haplotype người ĐA DẠNG SỐ BẢN SAO TRONG HỆ GEN Phân tích số đoạn DNA (> 1000 bp) Ứng dụng SNP ─ Mất đoạn => có hệ gen ─ Lặp đoạn => có nhiều hai gen Phân bố toàn hệ gen=> SNPs markers tốt nghiên cứu tính trạng liên kết SNP gần locus gen gây bệnh=> marker xác định gen gây bệnh SNPs marker hiệu RFLPs marker => ảnh hưởng đến mức độ biểu gen ─ Liều lượng gen (Gene dosage) ─ Vị trí gen (ảnh hưởng đến mức độ biểu gen yếu tố điều hòa nằm cạnh) Số gen=> tự kỷ, rối loạn phát triển, ví dụ: bệnh down 10 6/3/2021 ĐA HỆ GEN(METAGENOMICS) Metagenomics: nghiên cứu nhiều hệ gen mẫu thu từ môi trường Rất nhiều vi sinh vật chưa nghiên cứu=> không phân lập SINH HỌC TỔNG HỢP (Synthetic Biology) Thiết kế xây dựng thực thể sinh học 2002: tạo virus poliovirus từ đoạn DNA tổng hợp hóa học 2010: Daniel Gibson et al tổng hợp hệ gen vi khuẩn Mycoplasma mycoides (1.08-million-bp) Synthesized genome of Mycoplasma mycoides NGS => Metagenomics o Tìm phân tử sinh học mới: enzyme, sản phẩm chuyển hóa ứng dụng o Y học: phát tác nhân gây bệnh mẫu bệnh phẩm o Y học cá thể Hệ gen học chức Hệ gen Hệ phiên mã Hệ gen học chức Hệ protein Hệ chất chuyển hóa 11 6/3/2021 NghiênCỨU cứuHỆ hệ phiên NGHIÊN PHIÊNmã MÃ NGHIÊN CỨU HỆ PHIÊN MÃ • Ứng dụng: =>biểu gen mô (mức độ phiên mã) => So sánh mức độ biểu => chức gen (tham gia vào trình nào) Nghiên cứu hệ protein - Proteomics Mẫu nghiên cứu Nghiên cứu hệ protein - Proteomics Phương pháp điện di chiều Chiều 1: pH đẳng điện protein Mẫu nghiên cứu pH3 Mẫu protein pH10 Dải pH pH10 Loại mẫu Vd Mẫu ung thư Xếp trồng mẫu Loại mẫu Vd Mẫu bình thường Xác định tất protein biểu mô ? Nhuộm mầu khác Tìm vị trí protein khác Loại mẫu Vd Mẫu ung thư Loại mẫu Vd Mẫu bình thường Xác định protein liên quan đến ung thư? Chiều 2: khối lượng phân tử Điện di chiều Loại mẫu Vd Mẫu ung thư Độ tính điện Thêm SDS Loại mẫu Vd Mẫu bình thường 12 6/3/2021 Nghiên cứu hệ protein - Proteomics FUNCTIONAL GENOMICS Mẫu nghiên cứu Nghiên cứu hệ protein Proteomics Loại mẫu Vd Mẫu ung thư Loại mẫu Vd Mẫu bình thường Điện di chiều Xác định tất protein biểu mô Nhuộm mầu khác Kỹ thuật phối phổ Xác định xác khối lượng phân tử (1 dalton) Protein gì? Xếp trồng mẫu Xác định thời gian bay => khối lượng phân tử Loại mẫu Vd Mẫu ung thư Tìm vị trí protein khác Loại mẫu Vd Mẫu bình thường FUNCTIONAL GENOMICS Nghiên cứu hệ protein Proteomics Kỹ thuật phối phổ Tìm vị trí protein khác FUNCTIONAL GENOMICS Cắt trypsin 2017- CryoEM Structural Proteomics X-ray crystallography nuclear magnetic resonance (NMR) Máy khối phổ Protein gì? Tìm vị trí protein khác 13