1. Trang chủ
  2. » Giáo án - Bài giảng

Đề cương tin sinh _Chương 16

14 49 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Câu 3: Trình tự sinh học là gì? Hãy nêu một vài ví dụ về việc phân tích trình tự tin học Trình tự sinh học là trình tự các nucleotide hoặc các trình tự các amino accid Ví dụ • Phân tích trình tự genome để phát hiện gene (các gene đột biến, ung thư)  xác định các phương pháp điều trị • Mô phỏng tương tác phân tử như tương tác protein – protein peptide; enzyme – cơ chất hoặc ligand – chất tương tác

CHƯƠNG I Câu 1: Trình bày khái niệm Tin sinh học? Tin sinh học ngành khoa học ứng dụng tốn học (thống kê) khoa học máy tính vào lĩnh vực sinh học (sinh học phân tử y học) Tin sinh học liên quan đến xây dựng phát triển sở liệu, thuật tốn, thống kê kỹ thuật máy tính để giải vấn đề liên quan đến lý thuyết thực nghiệm việc quản lý phân tích liệu sinh học Mơ dự đoán tương tác phân tử trình sinh học hướng tin sinh học ngày tập trung nghiên cứu ứng dụng rộng rãi Câu 2: Vai trò tin sinh học Thu thập, tổ chức quản lý liệu sinh học (databases/ big data) Phát triển cơng cụ hỗ trợ tìm kiếm truy xuất liệu (search tools, data mining) Phân tích trình tự (sequence analysis), mơ tả genome (genome annotation), so sánh genome (whole genome comparison) Mô cấu trúc, mô tương tác phân tử (molecular interaction modelling), dự đốn cấu trúc protein (protein structure prediction) Phân tích chức protein (protein function analysis), tương tác protein đường chuyển hóa (protein interactions and metabolism pathways), mơ hình hóa hệ thống sinh học (modeling biological systems), phân tích mơ hình biểu gene (analysis of gene expression profile) So sánh trình tự nhiều genome genome để phát gene, gene đột biến, ung thư, xác định vai trò gene, mối quan hệ tiến hóa Lắp ráp mơ tả genome tự động (automatic genome assembly and genome annotation) Phát triển thuật toán, phần mềm để giải nhu cầu nhà khoa học lĩnh vực sinh học Câu 3: Trình tự sinh học gì? Hãy nêu vài ví dụ việc phân tích trình tự tin học - Trình tự sinh học trình tự nucleotide trình tự amino accid Ví dụ  Phân tích trình tự genome để phát gene (các gene đột biến, ung thư)  xác định phương pháp điều trị  Mô tương tác phân tử tương tác protein – protein / peptide; enzyme – chất ligand – chất tương tác Câu 4: Thế so sánh trình tự? Mục đích việc so sánh trình tự để làm gì? - So sánh trình tự xác định tương đồng hai hay nhiều trình tự - Thiết lập tương ứng mối liên hệ trình tự genome trình tự amino acid đặc điểm genome hay biểu sinh vật khác Câu 5: Tại phải nghiên cứu cấu trúc đại phân tử? Tin sinh học hỗ trợ việc dự đoán cấu trúc phân tử - Vì đại phân tử axit nucleic protein – đóng vai trị quan trọng giới sống DNA mang thông tin di truyền, RNA liên quan sinh tổng hợp protein tham gia vào điều hòa hoạt động sống tế bào Tinh sinh học cung cấp thuật toán dựa sở tính tốn liên kết hóa học, khả hình thành kiên kết, tương tác phân tử, phân tích nhiệt động học, lượng tự do, lương liên kết để xây dựng lên mơ hình cấu trúc không gian Câu 6: Những hiểu biết vai trò gene, mối liên hệ gene có vai trị y học đại? - Vai trò gen Câu 7: Mối quan hệ tiến hóa sinh vật là: trang 34 Tikn hóa mlt q trình dmn sӵ thay đәi vӅ vӕn gen cӫa mӝt quҫn thӇ theo thӡi gian Mһc dùi vӅ vӕn gen cӫa mӝt quҫn thӇ theo thӡi gian Mһc dùn gen cӫa mӝt quҫn thӇ theo thӡi gian Mһc dùa mlt quҫn thӇ theo thӡi gian Mһc dùn thӇ theo thӡi gian Mһc dùi gian Mһc dùc dù bxn chyt cӫa mӝt quҫn thӇ theo thӡi gian Mһc dùa tikn hóa dizn ӣ mӭc đӝ quҫn thӇ, nhiên viӋc xác đӏnh phân tích mӕi c đl quҫn thӇ theo thӡi gian Mһc dùn thӇ, nhiên viӋc xác đӏnh phân tích mӕi c xác đӏnh phân tích mӕi nh phân tích mӕn gen cӫa mӝt quҫn thӇ theo thӡi gian Mһc dùi quan hӋc xác đӏnh phân tích mӕi tikn hóa có thӇ ӣ nhiӅu mӭc đӝ quҫn thӇ, nhiên viӋc xác đӏnh phân tích mӕi c đl khác nhѭ quҫn thӇ theo thӡi gian Mһc dùn thӇ, lồi, nhóm cá thӇ, tk bào, bào quan ӣ mӭc đӝ quҫn thӇ, nhiên viӋc xác đӏnh phân tích mӕi c đl phân tӱ Trong lĩnh vӵc tin sinh hӑc ӭng dөng viӋc phân tích mӕi c ӭc đӝ quҫn thӇ, nhiên viӋc xác đӏnh phân tích mӕi ng dөng viӋc phân tích mӕi ng viӋc xác đӏnh phân tích mӕi c phân tích mӕn gen cӫa mӝt quҫn thӇ theo thӡi gian Mһc dùi quan hӋc xác đӏnh phân tích mӕi tikn hóa chӫa mӝt quҫn thӇ theo thӡi gian Mһc dù yku dӵa vào phân tích ӣ mӭc đӝ quҫn thӇ, nhiên viӋc xác đӏnh phân tích mӕi c đl phân tӱ hay tikn hóa phân tӱ Chҷng hҥnng hҥnn gҫn thӇ theo thӡi gian Mһc dùn ngѭӡi gian Mһc dùi ta dӵa vào viӋc xác đӏnh phân tích mӕi c phân tích trình tӵ DNA mã hóa cho ribosome, cytochrome c, Rubisco ribolose (RuBisCo), gene ti thӇ đӇ phân loҥni sinh vұt xӃp chúng vào đơn vӏ t xkp chúng vào đơn vӏnh phân tích mӕi phân loҥni (taxon) Tyt nhiên viӋc xác đӏnh phân tích mӕi c phân tích ӣ mӭc đӝ quҫn thӇ, nhiên viӋc xác đӏnh phân tích mӕi c đl phân tӱ chѭa đӫa mӝt quҫn thӇ theo thӡi gian Mһc dù cҫn thӇ theo thӡi gian Mһc dùn phxi kkt hӧp vӟi p vӟi i kkt qux cӫa mӝt quҫn thӇ theo thӡi gian Mһc dùa nghiên cӭc đӝ quҫn thӇ, nhiên viӋc xác đӏnh phân tích mӕi u khác Cơng nghệ thông tin tin sinh học hỗ trợ nhà nghiên cứu sinh học nhiều khía cạnh, bao gồm: - - Phát tiến hóa nhiều sinh vật nhờ vào việc so sánh, tìm thay đổi DNA chúng kiểm tra đặc điểm sinh lý phân loại dựa vào mô tả hình thái So sánh tồn genome cho phép nghiên cứu phức tạp lớn kiện tiến hóa, chẳng hạn như: lặp đoạn, trao đổi vật chất di truyền lấy phần vật chất di truyền lồi (nhưng khơng phải hậu duệ lồi horizontal gene transfer lateral gene transfer: biến nạp, cộng sinh, tái tổ hợp genome, chuyển gene) (phân biệt với vertical gene transfer) Xây dựng mơ hình máy tính để dự đốn đầu (hệ quả) quần thể theo thời gian Theo dõi chia sẻ thông tin số lượng lớn loài cá thể Xây dựng tranh tổng thể phát sinh chủng loại Câu 8: Hãy nêu nhiệm vụ hướng nghiên cứu tin sinh học Câu 9: Hãy nêu chủ đề nhà tin sinh học tập trung nghiên cứu Câu 10: Để trở thành nhà nghiên cứu lĩnh vực tin sinh học cần phải có tiêu chuẩn gì? CHƯƠNG II 1.Trình bày thành phần cấu tạo cấu trúc axitnucleic? xit nucleic cấu tạo loại base khác nhau: cytosine (C), uracil (U), thymine (T), adenine (A) guanine (G) Tuy nhiên, U có mặt phân tử RNA C có mặt DNA Phân tử DNA RNA không khác thành phần base mà cịn khác phân tử đường RNA có đường ribose DNA chứa đường 2-deoxyribose Phân tử DNA gồm chuỗi polynucleotide xoắn với theo hướng đối song Phân tử DNA tồn dạng sợi đơn (ssDNA) dạng sợi kép (dsDNA) Trong phân tử DNA, hai sợi gắn với qua liên kết hydro base Hai liên kết hydro A T liên kết hydro C G Hai sợi DNA bổ sung với biết trình tự sợi suy trình tự sợi cịn lại DNA RNA cấu tạo đơn phân nucleotide ribonucleotide Trong phân tử DNA, nucleotide cấu tạo gốc axit phosphoric, phân tử đường pentose base Các nucleotide nối với liên kết phosphodiester giӳa nhóm 5’PO4 phân tử a nhóm 5’PO4 phân tử đường pentose nucleotide nhóm 3’OH cӫa mӝt quҫn thӇ theo thӡi gian Mһc dùa phân tử đường pentose mộtt nucleotide Vì phân tử axit nucleic tồn đầu 5’PO4 3’OH Theo quy quy ước axit nucleic viết theo hướngg 5‘ - 3‘ theo chiều từ trái sang phải Câu 2: Thế mã di truyền, đặc điểm mã di truyền - Mã di truyền phần mật mã quy định thơng tin trình tự amino acid mã hố dạng trình tự nucleotide gen Đặc điểm     Mã di truyền đọc liên tục từ mã khởi đầu (AUG với codon) theo ba nucleotide mà không gối lên Mã di truyền có tính đặc hiệu: Một codon mã hoá cho amino acid Mã di truyền có tính phổ biến: amino acid giống sinh vật khác mã hoá codon Mã di truyền có tính thối hố: amino acid mã hoá nhiều codon khác nhau, trừ AUG UGG Tính suy thối mã di truyền có ý nghĩa tích cực với sống cịn tế bào Câu 3: Trình bày nội dung luận thuyết trung tâm Luận thuyết trung tâm hay học thuyết trung tâm, giáo lý trung tâm (central dogma) học thuyết sinh học (chủ yếu di truyền học sinh học phân tử) cho DNA trung tâm tính di truyền: DNA vật chất mang thông tin di truyền sinh vật, từ quy định tính trạng thể thơng qua vai trị trung gian RNA tổng hợp nên prôtêin Nội dung học thuyết DNA - RNA  protein Phiên mã Dịch mã Câu 3: Trình bày mối liên hệ cấu trúc chức protein Bậc1 trình tự xếp axit amin Thể tính đặc thù axit chuỗi axit amin amin Bậc Những vùng không gian cục bọ chuỗi polypeptide Bậc hình dạng khơng gian chiều Thể chức sinh học protein cấu trúc bậc cuộn xếp tạo protein thành kiểu đặc trưng Bậc cấu trúc số loại protein gồm hai nhiều chuỗi axit amin loại hay khác loại kết hợp với Câu 4: Genome gì? Ý nghĩa việc nghiên cứu genome? - genome tồn thơng tin di truyền sinh vật - Ý nghĩa việc nghiên cứu genome: giải thích nguồn gốc tiến hóa sinh vật trình sinh học VD: quang hợp Câu 5: Hãy mô tả cấu trúc gene sinh vật prokaryote eukaryote Hình 11 Sơ đồ cấu trúc gene prokaryote Ở prokaryote, mặt quy ước đầu 5’ gene đặt bên trái, đầu 3’ bên phải Cấu trúc gene điển hình minh họa hình 11 Hình 12 Sơ đồ cấu trúc vùng trình tự promoter prokaryote cấu trúc hệ gên eukaryote gồm Vùng promoter Tín hiệu bắt đầu Các tín hiệu loại bỏ intron Tín hiệu kết thúc phiên mã Tín hiệu polyadenyl hóa Hình 13 Cấu trúc gene eukaryote (trên) vùng promoter (dưới) Câu 5: Điều hịa hoạt động gene là: Q trình kích hoạt gen hoạt động bất hoạt gen gọi chế điều hòa hoạt động gen Mỗi tế bào cho phép biểu bật hoạt động phần nhỏ số gen Phần gen cịn lại bị ức chế biểu bị bất hoạt Câu 6: Tại phải nghiên cứu mối quan hệ tiến hóa sinh vật CHƯƠNG III Hãy nêu bước q trình tìm kiếm thơng tin sử dụng cơng cụ tìm kiếm? Dựa sở để đánh giá độ tin cậy thơng tin tìm kiếm Hãy nêu ví dụ cụ thể bước tìm kiếm nội dung nghiên cứu (chẳng hạn nghiên cứu chuyển gene kháng thuốc trừ cỏ vào thuốc lá) công cụ Google? - Q trình bao gồm: (i) xác định cơng cụ tìm tin trang web hỗ trợ tìm tin, (ii) xác định nội dung thơng tin cần tìm, (iii) xây dựng từ khóa đại diện cho nội dung tìm kiếm (nên sử dụng từ khóa dạng cụm từ thay từ đơn, tiếng Anh khơng nên dùng mạo từ, nên dùng danh từ), (iv) sử dụng toán tử logic để kết hợp chẳng hạn hàm boolean như: and, or, not, +, -, dấu ngoặc kép “”, dấu *, để lọc thu hẹp kết nghiên cứu - Ví dụ: + Cơng cụ tìm: Google +Nội dung cần tìm: nghiên cứu chuyển gene kháng thuốc trừ cỏ vào thuốc + Keyword: chuyển gen, kháng thuốc trừ cỏ, thuốc Tìm số hình ảnh vi khuẩn E.coli, vi khuẩn gây bệnh bạc Xanthomonas oryzae pv oryzae, nguyên lý kỹ thuật PCR Sử dụng cơng cụ tìm kiếm, tìm tài liệu kỹ thuật PCR ứng dụng kỹ thuật Yêu cầu: Xác định từ khóa, số kết tìm Trong số kết tìm chọn tài liệu đáng tin cậy nhất? Từ khóa: PCR technique, PCR principle, PCR application Research Techniques Made Simple: Polymerase Chain Reaction (PCR) Lilit Garibyan1 and Nidhi Avashia (2014) Sử dụng kiến thức học tìm kiếm địa truy cập vào trang chủ Ngân hàng gen giới NCBI, EMBL, EBI, DDJB, PubMed trang chủ Viện nghiên cứu lúa quốc tế (IRRI) Thực hành Truy cập vào trang PubMed, tìm kiếm tài liệu liên quan đến virus HIV bệnh viêm gan Tìm kiếm khoảng 10 báo (full text) CSLD Pubmed sau dùng chương trình Endnote để lưu giữ quản lý báo dạng thư viện Thực hành Trên sở thư viện vừa xây dựng tìm kiếm báo theo trường (tên tác giả, tên báo, năm công bố, từ khóa) Từ kết xây dựng thư viện, áp dụng chương trình Endnote để trích dẫn tự động báo, cơng trình nghiên cứu cho luận văn tốt nghiệp Thực hành CHƯƠNG Thế CSDL sinh học? CSDL sinh học bao gồm loại liệu gì? Là trình tự sinh học có thông tin khoa học sống Gồm : CSDL sơ cấp CSDL thứ cấp, CSDL khác (ngân hàng gene) Nêu vai trò ngân hàng gene (Genebank, EMBL, DDBJ) mối liên hệ chúng - Là sở liệu tích hợp, tìm kiếm, cung cấp thơng tin trình tự nuclotide lồi sinh vật Đều CSDL trình tự sơ cấp - CSDL GenBank/EMBL/DDBJ liên kết với để hình thành INSDC CSDL đối tác trao đổi với hàng ngày, thực thao tác tìm kiếm trình tự ngân hàng Mặc dù định dạng cho entry NCBI DDBJ so với EMBL có khác biệt thông tin chứa đựng cho entry Thế CSDL sơ cấp, CSDL thứ cấp Nêu khác biệt hai loại CSDL Làm để đăng ký trình tự sinh học vào ngân hàng gene ? Hãy nêu vài cơng cụ điển hình  Trình tự đăng ký vào GenBank điển hình bao gồm sợi DNA Trình tự đăng ký vào GenBank điển hình bao gồm sợi DNA RNA đơn kèm với mơ tả chi tiết  Trình tự đăng ký vào GenBank điển hình bao gồm sợi DNA Các thông tin phải tuân theo tiêu chuẩn INSDC (International Nucleotide Sequence Database Collaboration)  Trình tự đăng ký vào GenBank điển hình bao gồm sợi DNA Đăng ký trình tự cách riêng rẽ nhiều trình tự lúc Kiểu đăng nhiều trình tự lúc gọi “batch submissions Một vài công cụ: BankIt, Webin Thế ngân hàng CSDL genome đặc thù? Hãy kể tên vài ngân hàng CSDL genome nêu nghĩa ngân hàng gene này? - Các CSDL genome kèm với thơng tin mơ tả có ý nghĩa lớn việc khai thác thông tin genome, so sánh genome nghiên cứu chức gene, protein thông qua việc so sánh không mức độ phân tử mà toàn genome - VD: CSDL Arabidopsis thaliana, CSDL lúa Hãy cho biết vai trò ý nghĩa CSDL Pubmed - PubMed nguồn tài nguyên miễn phí hỗ trợ việc tìm kiếm truy xuất tài liệu y sinh khoa học đời sống với mục đích cải thiện sức khỏe - toàn cầu cá nhân Cơ sở liệu PubMed chứa 33 triệu trích dẫn tóm tắt tài liệu y sinh - Cung cấp nguồn tài liệu nghiên cứu cho nhà khoa học Hãy liệt kê CSDL NCBI nêu tóm tắt ý nghĩa CSDL - CSDL trình tự axit nucleic GenBank: biết sử dụng nhiều thuộc NCBI CSDL cho phép truy cập miễn phí chứa 189.000.000 trình tự với tổng số 299.000.000.000 base 380.000 sinh vật trình tự gửi vào NCBI phải có chiều dài từ 50 base trở lên mô tả chi tiết bao gồm số truy cập chứa 250 gen vi khuẩn hoàn chỉnh; 90 genome nhân chuẩn; genome người CSDL PubMed trích dẫn tóm tắt cho tạp chí khoa học đời sống xuất chứa 22,7 triệu bà báo chí có từ năm 1809 - Hàng năm có khoảng 500.000 báo bổ sung - có khoảng 13,1 triệu đăng viết dạng tóm tắt 14,2 tiệu đăng - dạng đường liên kết với báo toàn văn số có 3,8 triệu báo cho phéo người dùng tải miễn phí Tìm hiểu Enselbl Cho biết vai trò Wellcome Trust Sanger Institute (WTSI) - Ensembl dự án kết hợp EMBL-EBI Sanger Institute để phát triển hệ thống phần mềm để tạo trì mơ tả genome eukaryote định - cung cấp CSDL genome động vật có xương sống lồi eukaryotic đưa thông tin chúng online cho phép truy cập miễn phí Hiện Ensemble, genome người chứa khoảng 3,2 tỉ cặp base, mã hóa cho khoảng 20.000 đến 25.000 gene Genome browser khơng cung cấp trình tự genome mà quan trọng cung cấp thông tin vị trí mối quan hệ gene mô tả xác định cụ thể NST - Hiện liệu genome Ensembl chia thành nhiều nhóm Nhóm thường dùng bao gồm genome người, chuột zebrafish Nhóm linh trưởng bao gồm 10 giống Ngồi cịn nhóm lớp chim, bò sát, lưỡng cư, nấm sinh vật khác - WTSI nhà tài trợ ban đầu Ensembl Thế CSDL cấu trúc đại phân tử? Ý nghĩa CSDL này? - CSDL cấu trúc đại phân tử: liệu cấu trúc ba chiều đại phân tử sinh học, chẳng hạn protein axit nucleic - Ý nghĩa: nguồn cung cấp CSDL cấu trúc sinh học phục vụ nghiên cứu phân tử động học đại phân tử sinh học, đặc biệt prôtêin axit nuclêic, với ảnh hưởng đến chức chúng biến đổi gây CHƯƠNG Mô tả nguyên lý phương pháp xác định trình tự Maxam-Gilbert Nguyên lý: Thực phản ứng PCR với khn trình tự cần biết, q trình tổng hợp diễn làm ngừng ngẫu nhiên Các đoạn DNA khác biệt 01 Nucleotide Quy trình: Bước 1: biến tính DNA, từ sợi kép thành sợi đơn nhờ nhiệt độ cao Bước 2: Gắn mồi vào mạch khuôn đơn Mồi đánh dấu phóng xạ huỳnh quang Bước 3: Chia dung dịch vào ống: Ống “A”: ddATP DNA polymerase Ống “T”: ddTTP DNA polymerase Ống “G”: ddGTP DNA polymerase Ống “C”: ddCTP DNA polymerase Nông độ ddNTP thấp 100 lần nồng độ dNTP nên kéo dài mạch, dNTP gắn vào ddNTP ngẫu nhiên có khả gắn vào Khi ddNTP gắn vào làm dừng chuỗi tổng hợp Bước 4: Các đoạn DNA phân tách thành vạch bang gel chạy điện di Bước 5: Dựa vào màu sắc huỳnh quang ddNTP đánh dấu, qua kết đọc, thu trình tự Nucleotide Mô tả nguyên lý phương pháp xác định trình tự tự động Sanger Hãy cho biết trình tự genome người xác định theo nguyên lý phương pháp nào? Nguyên lý: Phương pháp thực dựa kỹ thuật phổ biến “chain termination- kết thúc chuỗi” việc sử dụng deoxy nucleotide bị chỉnh sửa làm nhóm hydroxyl đầu 3’ phân tử đường Nhóm 3’-OH đóng vai trò cho phép gắn thêm nucleotide vào chuỗi Khi ddNTP thêm vào chuỗi, khơng có nhóm 3’-OH nên nucleotide khơng thêm vào, phản ứng tổng hợp dừng lại Enzyme polymerase xúc tác phản ứng gắn dNTP vào mạch đơn DNA để kéo dài mạch vị trí 3’- OH dừng lại gắn ddNTP vào chuỗi Trong phản ứng chứa dNTP ddNTP nên sau phản ứng tổng hợp, hình thành đoạn DNA có độ dài khác ddNTP gắn ngẫu nhiên làm dừng phản ứng Dựa vào sai khác độ dài đoạn DNA hiển thị gel sau điện di để xác định trình tự gene Hãy cho biết trình tự genome người xác định theo nguyên lý phương pháp nào? Mô tả nguyên lý phương pháp xác định trình tự: Pyrosequencing, Alumina (Solexa) sequencing Solid sequencing Pyrosequencing phương pháp giải trình tự DNA (xác định thứ tự nucleotide DNA) dựa nguyên tắc "giải trình tự cách tổng hợp", việc giải trình tự thực cách phát nucleotide kết hợp DNA polymerase - Bằng cơng cụ tìm kiếm học tìm hiểu nêu nguyên lý phương pháp xác định trình tự khác Gҫn thӇ theo thӡi gian Mһc dùn đây, kỹ thuật xác định trình tự hệ dựa nguyên lý cắt nhỏ genome sinh vật thành đoạn nhỏ, sau lựa chọn các đoạn có kích thước từ 50-500bp (tùy thuộc vào KT dòng máy xác đӏnh phân tích mӕi nh trình tự) Các đoạn nhỏ xác định trình tự sau nối lại với để tái tạo toàn genome ban đầu Tuy nhiên để đảm bảo độ xác hiệu cần thiết có genome lồi xác định trình tự để làm liệu tham chiếu (reference) Trong trường hợp chưa có trình tự genome thuộc lồi sử dụng genome khác có mức độ gần gũi mặt tiến hóa Giải thích ngun lý việc lắp ráp trình tự Cho ví dụ cơng cụ hỗ trợ lắp ráp trình tự Nguyên lý việc lắp ráp trình tự đơn giản dựa vào sở chồng lấp lên đoạn DNA có phần trình tự giống Về ngun tắc cắt genome cách ngẫu nhiên tạo số lượng mảnh cắt vị trí ngẫu nhiên Sau xác định trình tự đoạn ngắn, đoạn phải đc nối lại với cách xếp chồng lên để tìm vùng trình tự giống Ví dụ: cơng cụ CAP3 – hỗ trợ lắp ráp dùng phổ biến quy mô genome nhỏ Hãy nêu công cụ hỗ trợ việc đăng ký trình tự vào ngân hàng gene Giao diện web BankIt -NCBI Webin – EMBL Nuclotide Sequence Submission – DDBJ Đăng ký dạng offline Sequin - NCBI Ý nghĩa việc đăng ký trình tự Đăng ký trình tự vào CSDL cách cơng bố kết nghiên cứu Xây dựng CSDL chung, đóng góp vào dự án xác định trình tự genome sinh vật mô tả genome (một phần việc giải mã genome Sử dụng công cụ Sequin đăng ký trình tự (bất kỳ) vào ngân hàng gene Ví dụ: đăng kí giao diện Webin yêu cầu Thông tin cá nhân: Những thông tin cá nhân bao gồm tên, địa email, địa quan chỉ, số điện thoại Chất lượng trình tự: Trình tự có nguồn gốc từ genomic mRNA Độ xác nhân vật: cao độ xác, DNA nhân vật cần đọc chiều Nguồn sinh vật: DNA trình tự phải xác định rõ ràng nguồn gốc từ sinh vật Bổ sung thông tin liên quan mô tả đến trình tự động: báo Trình tự mã hóa (CDS trình tự mã hóa) Webin củaa EMBL cung cấp tùy chӑc ӭng dөng viӋc phân tích mӕi n chӑc ӭng dөng viӋc phân tích mӕi n cho ngườii đăng ký : (i) đăng ký liệu trình tự đơn lẻ, tức trình tự đoạn DNA gene đoạn đọc riêng rẽ (read data) (ii) đăng ký dạng đoạn trình tự lắp rắp mô tả (assembled sequence and/or annotation) (iii) đăng ký trình tự genome lắp ráp (genome asseblies) Quá trình đăng ký trình tự đơn giản, bước cần đăng ký vớii EMBL để mở tài khoảnViệc mở tài khoản thực thông qua liên hệ với EMBL theo địa datasubs@ebi.ac.uk Sau có tài khoản bước đăng ký thực theo hưỡng dẫn CHƯƠNG 6 Hãy kể tên cơng cụ Ensembl? Cho ví dụ minh họa - Dự đoán hiệu ứng biến thể - Bộ lưu trữ biến thể - BLAST/ BLAT - File Chameleon: - Công cụ chuyển đổi lắp ráp - Công cụ chuyển đổi lịch sử ID - Linkage Disequilibrium Calculator - VCF to PED converter - Data Slicer - Post-GWAS Ví dụ: sử dụng Blast tìm trình tự gene người chau Á web Ensembl Tìm hiểu genome browser cho biết cách download trình tự thơng tin mơ tả trình tự Ensembl - Truy cập vào địa trang web https://asia.ensembl.org/index.html - Lựa chọn lồi tìm kiếm mã số truy cập (AN) - Chọn loại thông tin cần download tìm kiếm trình tự có độ tương đồng cao - Chọn lựa trình tự tương đồng chọn “Download sequence” Thông số Name Transcrip ID Bp: độ dài đoạn gene Protein: aa Biotype: NCBI - Truy cập: https://blast.ncbi.nlm.nih.gov/Blast.cgi - Tùy mục đích chọn cơng cụ Blast thích hợp - Tìm kiếm tên mã truy cập  Blast - Chọn đoạn gen cần tìm chọn Download  chọn định dạng cần tải Thơng số cần ý Thơng tin lồi Tên khoa học loài % độ tương đồng Độ dài Mã truy cập Cho biết ứng dụng công cụ In silico PCR UCSC? Cho ví dụ minh họa Ứng dụng UCSC - Kiểm tra trình tự mồi - Lựa chọn gen đích - Xác định thơng số PCR VD: Thực phản ứng PCR ảo để định danh lồi thực vật cơng cụ In-silico PCR để phân tích tính tốn để dự đốn kết phản ứng PCR thực tế  nắm bắt phản ứng PCR thực tế  tiết kiệm thời gian, hóa chất Tìm hiểu genome browser cho biết cách xác định gene có nguồn gốc tiến hóa với gene cho trước? Lấy ví dụ minh họa 10 Sử dụng cơng cụ genome browser so sánh vị trí locus gene tương ứng hai genome người chuột 11 Hãy nêu khác biệt genome browser dự án xác định trình tự 1000 genome ensembl - CSDL genome động vật có xương sống lồi eukaryotic: online, miễn phí - Cung cấp thơng tin vị trí mối quan hệ gene mô tả xác định cụ thể NST - Giai đoạn đầu, thơng tin trình tự cịn hạn chế, nhà khoa học phải mô tả thủ công dựa vào định vị gene cách sử dụng liệu thu từ thí nghiệm, tạp chí khoa học CSDL  thông tin kiểm sốt chặt chẽ  độ xác cao - Dữ liệu nhiều, sử dụng thuật toán, phần mềm pipline UCSC - Trình tự genome hiển thị theo chiều ngang - Ký hiệu đồ họa vị trí mRNA, gene, EST - Một khối màu khác dọc theo trục hoành thể vị trí đoạn trình tự nhiều liệu từ nguồn khác - Có thể phóng to thu nhỏ để thuận tiện quan sát hình - Mức độ chi tiết mơ tả (annotation) cao độ phân giải trình tự hiển thị genome browser lớn 3.NCBI Map Viewer - Khoảng cách vật lý hai gene - Xác định vị trí vật lý gene biết vị trí đồ di truyền - Vị trí trật tự xếp gene NST? - Xác định vị trí gene quan tâm genome sinh vật rõ markers chặn hai đầu gene - Hiển thị gene tồn vùng định NST hiển thị liệu trình tự tương ứng cho vùng - Hiển thị vùng NST hai điểm Hiển thị đồ di truyền đồ trình tự vùng đồng thời trình tự với dựa vào marker có mặt hai đồ

Ngày đăng: 29/09/2023, 17:27

Xem thêm:

w