IntroBioinf01 pptx 1 TIN SINH HỌC ĐẠI CƯƠNG (Introduction to Bioinformatics) http //fair conf vn/lang/bioinf PGS TS Trần Văn Lăng Email langtv@vast vn Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF[.]
MỤC TIÊU MƠN HỌC • Về kiến thức: trang bị kiến thức tin học ứng dụng công nghệ sinh học như: TIN SINH HỌC ĐẠI CƯƠNG (Introduction to Bioinformatics) http://fair.conf.vn/lang/bioinf – sở liệu (CSDL) sinh học phân tử, – phương pháp phân tích trình tự sinh học thuật toán tin học – số hướng nghiên cứu giới liên quan đến tin sinh học PGS.TS Trần Văn Lăng Email: langtv@vast.vn Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY • Về kỹ (thơng qua thực hành): Sử dụng số phần mềm thông dụng việc: – – – – • Định hướng nghề nghiệp: Giải vấn đề sở sinh học phân tử đặt cho: so sánh trình tự, phân tích trình tự, phát sinh lồi, truy cập đến CSDL sinh học lớn để tìm kiếm tương đồng trình tự sinh học Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY – công nghệ sinh học, – y học, – dược liệu học Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY NỘI DUNG • Phương pháp gióng hàng (bắt cặp) hai nhiều trình tự sinh học, • Phương pháp BLAST việc tìm kiếm tương đồng trình tự sinh học từ ngân hàng trình tự • Những khái niệm tin sinh học • Cách thức khai thác số ngân hàng liệu lớn trình tự sinh học NCBI, EMBL, DDJB, PDB Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY TÀI LIỆU HỌC TẬP • Cách thức sử dụng số phần mềm thông dụng đề thiết kế mồi, lập đồ enzyme, phát sinh lồi • Trần Linh Thước, et al, Thực tập Bioinformatics, tài liệu lưu hành nội Khoa Sinh học, Trường ĐHKHTH, 2012 • Một số hướng nghiên cứu lĩnh vực tin sinh học giới quan tâm Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY TÀI LIỆU ĐỌC THÊM TÀI LIỆU ĐỌC THÊM • Trần Văn Lăng, Ứng dụng Tin học việc giải số toán Sinh học phân tử Nxb Giáo dục, 2008, 230tr Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY • Nguyễn Văn Cách, Tin – Sinh học, Nxb Khoa học Kỹ thuật, 2008, 144tr (eBook) TÀI LIỆU HỌC TẬP 10 TÀI LIỆU THAM KHẢO • Robert John, Introduction to Bioinformatics http://macdevcenter.com/pub/a/mac/2004/06 /11/bioinformatics.html, 2004 • Trần Nhân Dũng, Nguyễn Vũ Linh, Giáo trình Tin sinh học, Nxb Đại học Cần Thơ, 2011, 168tr Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY • Arthur M Lesk, Introduction to Bioinformatics, Oxford University Express, 2002 (eBook) 11 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 12 PHẦN MỀM HỖ TRỢ • Blast: http://blast.ncbi.nlm.nih.gov/Blast.cgi • A.D Baxevanis, B.F F Ouellette, Bioinformatics: A practical guide to the analysis of genes and proteins, Third Edition, 2005, http://books.google.com.vn • Cynthia Gibas, Per Jabeck, Developing Bioinformatics Computer Skills O’Reilly & Associates, Inc., USA, 2001,http://books.google.com.vn Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 13 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 14 Tương tự Clsutal • http://www.ebi.ac.uk/Tools/msa/ • Protein alignments: Clustal Omega • DNA alignments: MUSCLE or MAFFT Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 15 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 16 Bắt cặp đa trình tự TreeView • http://www.ebi.ac.uk/Tools/psa/ Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY • http://taxonomy.zoology.gla.ac.uk/rod/treeview.html 17 AnnHyb 18 BioEdit • http://www.mbio.ncsu.edu/BioEdit/bioedit.html • http://www.bioinformatics.org/annhyb Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 19 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 20 http://www.bioinformatics.org/sms2 Chương 1: GIỚI THIỆU VỀ TIN SINH HỌC Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 21 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY Who am I ? 22 NỘI DUNG • Assoc Prof Tran Van Lang, PhD • Born: 18 Dec 1959, Quang Tri, Vietnam • Residence: Saigon, Vietnam • Nationality: Vietnam • Lịch sử • Fields: Computer Science • Định nghĩa • Sự cần thiết • Một số khái niệm – High Performance Parallel and Distributed Computing – Bioinformatics – Scientific Computation Methods • Institutions: Vietnam Academy of Science and Technology • Alma mater: – HCM University of Natural Science (1977) – Dorodnitsyn Computing Center (1991) • And: I have two daughters Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 23 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 24 1.1 Lịch sử • Một tảng sinh học tế bào (cell) • DNA chứa gene mã hóa RNA mà sinh protein, để từ điều chỉnh tất trình phát triển sinh vật • Tất vật thể sống (living thing), bao gồm người, tạo thành từ tế bào • Chẳng hạn, với người có khoảng 100 ngàn tỷ = 1014 tế bào (100 trilion cells) Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 25 • Bên tế bào có nhân (nucleus) để lưu trữ tất thị di truyền (genetic instruction) hay thông tin di truyền (genetic information) - ngoại trừ hồng huyết cầu trưởng thành (mature red blood cell) • Những thị chức tế bào, để phân biệt cá thể với cá thể khác Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 26 • Chẳng hạn, tế bào người có 46 nhiễm sắc thể, tổ chức thành 23 cặp • Mỗi nhiễm sắc thể cấu thành phân tử DNA dài (gọi trình tự DNA) 27 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 28 • Những trình tự DNA cấu tạo base A, C, G, T • Những base bắt cặp xếp chồng với tạo thành dạng thang xoắn gấp (twisted ladder) hay dạng xoắn kép (double helix) Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 29 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 30 • Số lượng gene lớn, hiểu biết người trình tự gene mã hóa thành protein cụ thể lại • Như vậy, – Mỗi tế báo có nhiều nhiễm sắc thể, nhiễm sắc thể trình tự DNA – Những mã di truyền nằm trình tự DNA Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY • Có khoảng tỷ cặp base cho phân tử DNA • Một gene đoạn DNA với trình tự base đặc trưng – cụ thể, gọi mã di truyền (genetic code) để xác định chức tế bào (hay physical trait – nét vật chất) • Mỗi nhiễm sắc thể có khoảng 30.000 gene 31 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 32 Ngồi ra, • Chẳng hạn, thiếu thông tin cần thiết để hiểu cách đầy đủ – vai trò DNA nhiều bệnh – chức protein sản sinh • Sự đột biến (mutation) thay đổi hay nhiều base phân tử DNA • Điều dẫn đến biến đổi đặc trưng (trait) dẫn đến bệnh di truyền – Chẳng hạn, màu mắt Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 33 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 34 • Sự đột biến chuyển xuống hệ sau từ cha mẹ • Chẳng hạn, có đột biến nhiễm sắc thể số tế bào tinh trùng • Nó mang nhiễm sắc thể có đột biến ghép với nhiễm sắc thể số bình thường tế bào trứng Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 35 • Từ tạo tế bào mới, gọi hợp tử (zygote), phát triển thành phơi (embryo), mà có đột biến nhiễm sắc thể số 36 Kết luận Bioinformatics • Một ngành đời để tìm mối tương quan lượng khổng lồ thơng tin phức tạp nhóm lại ngành gọi BIOINFORMATICS (Tin sinh học hay Sinh tin học) • Sự sống tồn vô phong phú đa dạng • Mà hiểu biết người ỏi • Từ cần: phương pháp để tập hợp, lưu trữ, khơi phục, phân tích Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 37 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 38 Chức tin sinh học • Xây dựng ngân hàng liệu để lưu trữ quản lý liệu sinh học phân tử • Tìm phương pháp để xác định mối quan hệ mặt sinh học liệu • Mục đích cung cấp cho nhà khoa học cách thức lý giải: – tiến triển sinh học bình thường – trục trặc trình phát triển dẫn đến bệnh tật – cách thức tiếp cận để cải thiện, điều trị Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY • Xây dựng cơng cụ để phân tích từ có hiểu biết rõ nguồn liệu sinh học 39 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 40 10 • Đại phân tử Nucleic acid gồm loại đa phân tử giống nhau: • Do Nucleotide khác thành phần Base hữu cơ, • Nên người ta thường dùng thuật ngữ Base thay cho Nucleotide Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 157 – DNA: Deoxyribonucleic Acid – RNA: Rebonucleic Acid Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 158 Deoxyribonucleic Acid • Đại phân tử DNA chuỗi xoắn kép gồm mạch đơn, mạch đơn chuỗi nucleotide DEOXYRIBONUCLEIC ACID Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 159 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 160 40 Deoxyribonucleic Acid • Các nucleotide mạch đơn liên kết với liên kết cộng hóa trị – liên kết hình thành đường nucleotide với phosphate nucleotide • Chuỗi nucleotide DNA bao gồm – Phosphate, – Đường Desoxyribose – Và base hữu Adenine (A), Cytosine (C), Guanine (G) Thymine (T) Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY • Hai mạch đơn liên kết với liên kết hydro hình thành base – tương tác tĩnh điện yếu phần tử Hydro mang điện tích dương với phần tử mang điện tích âm 161 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 162 • Trong hai mạch đơn liên kết với thì: – G mạch liên kết với C mạch – A mạch liên kết với T mạch • Lưu ý rằng, DNA chuỗi xoắn kép liên kết chuỗi thông qua liên kết A-T C-G • Nên trình tự DNA người ta thường gọi AT CG cặp base (base pair) • Từ đó, chiều dài trình tự DNA thường đo base pase (bp) Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 163 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 164 41 Cấu trúc DNA • Do Nucleotide khác thành phần base hữu cơ, • Nên đại phân tử DNA trình tự sinh học (Biology sequence) gồm base là: – – – – Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY C 5H 6N 2O 165 A (Adenine), C (Cytosine), G (Guanine), T (Thymine) Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 166 • Điều thuận lợi biểu diễn đại phân tử DNA máy tính chuỗi ký tự chứa bốn ký tự chữ A, C, G, T C 5H 5N • Như vậy, với chuỗi nucleotid người nghiên cứu tin học coi chuỗi gồm ký tự chữ C 4H 5N 3O C 5H 5N 5O Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 167 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 168 42 • Khi đó, số lượng chuỗi nuleotide lớn – Ví dụ, chuỗi có 10 nucleotide, số loại DNA khác 410 = 220 = 1.048.576 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY REBONUCLEIC ACID 169 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 170 Ribonucleic Acid • Trong tế bào có loại RNA chính, tham gia vào q trình dịch mã sang protein: • Đại phân tử RNA tương tự DNA có điểm khác nhau: – Là chuỗi xoắn đơn – Đường Pentose Ribose – Thymine thay Uracil (U) – mRNA (messenger RNA) – tRNA (transfer RNA) – rRNA (ribosomal RNA C 4H 4N 2O Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 171 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 172 43 • mRNA: RNA thơng tin • tRNA: RNA vận chuyển, đóng vai trò vận chuyển amino acid đến máy dịch mã để tổng hợp protein từ mRNA tương ứng – Đây trình tự DNA, nhằm chuyển thơng tin mã hóa DNA đến máy giải mã protein tương ứng Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 173 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 174 • rRNA: RNA risbosome, rRNA chiếm phần lớn tổng số RNA tế bào • Ribosome thành phần máy dịch mã tế bào, tạo thành cách kết hợp rRNA với protein PROTEIN Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 175 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 176 44 Amino acid • Cấu trúc bao gồm • Amino acid cấu thành từ base trình tự DNA, • Có tất 20 Amino acid Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 177 • Các gốc amino acid khác tạo amino acid với tính chất hóa học khác • Chẳng hạn, với amino acid: Alanine, Serine Alanine – nguyên tử carbon trung tâm, nguyên tử carbon gắn với nguyên tử Hydro gọi nguyên tử C-α (α-carbon) – Nguyên tử C-α liên kết với thành phần khác nhóm amino (NH2), nhóm carboxylic (COOH) gốc amino acid ký hiệu R Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 178 • Trình tự base DNA định trình tự amino acid protein tương ứng • Mỗi amino acid có base, nên với base A, C, G, T có số lượng amino acid lý thuyết 43 = 64 (gọi 64 codon) Serine Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 179 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 180 45 • Tuy nhiên, phát 20 amino acid với mã di truyền hình Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY • Margaret Oakley Dayhoff (American Physical Chemist, pioneer in Bioinformatics) đề xuất dùng one-letter code để mã hóa 20 amino acid 181 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 182 Bảng mã ký tự 20 amino acid • Nên có codon mã hóa amino acid • Bảng mã di truyền chuẩn Marshall Warren Nirenberg (Giải Nobel Y học 1968) Matthaei đưa năm 1961 hình Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 183 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 184 46 Mã di truyền Bảng 20 amino acid • Theo bảng mã này: – có 61 codon chứa thơng tin (mã hóa amino acid cụ thể) – codon: UAA, UAG, UGA dấu hiệu kết thúc – Codon AUG vừa amino acid có tên Methionine (Met) vừa dấu hiệu bắt đầu Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 185 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 186 Cơng thức hóa học 20 amino acid • Trong 20 amino acid có amino acid gọi thiết yếu • Bởi khơng thể tạo trực tiếp từ thể người, • Mà cung cấp thông qua nguồn thực phẩm dinh dưỡng từ bên Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 187 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 188 47 • amino acid thiết yếu là: histidine, isoliucine, leucine, lysine, methionine, phenylalanine, threonine, tryptophan, valine Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY CHUỖI PEPTIDE 189 Liên kết peptide (Peptide bond) Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 190 Chuỗi peptide • Là liên kết đầu Carboxylic (COOH) amino acid với đầu amin (NH2) amino acid khác loại bỏ phân tử nước (H2O) • Là chuỗi khơng nhiều 50 amino acid amino acid liên kết với theo liên kết peptide • Một đầu chuỗi nhóm amino (H 3N+) đầu nhóm carboxylic (COO-) Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 191 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 192 48 • Khi có nhiều 50 amino acid người ta hay gọi chuỗi polypeptide • Nên thực chất: chuỗi polypeptide chuỗi gồm nhiều chuỗi peptid; dài không phân nhánh Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 193 • Liên kết peptide cấu trúc bậc protein liên kết đặc biệt, – mạnh liên kết đơn lại yếu liên kết đơi • Chính điều tạo cho liên kết chuỗi peptide vừa có tính ổn định liên kết đơi, vừa có tính linh động liên kết đơn Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 195 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 194 • Nhờ tính linh động này, phân tử protein tự xoay quanh trục góc nhỏ • Điều có ý nghĩa đặc biệt quan trọng việc hình thành cấu trúc bậc cao protein Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 196 49 Cấu trúc bậc I • Do amino acid đơn phân tử cấu thành nên protein, nên chuỗi peptid hay polypeptide protein • Trong trường hợp quan tâm đến liên kết peptide chuỗi này, ta có cấu trúc bậc protein (protein primary structure) CẤU TRÚC PROTEIN Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 197 Cấu trúc bậc II 198 Cấu trúc bậc III • Khi amino acid gần liên kết với thông qua liên kết hydro nhóm amin (NH) amino acid với nguyên tử Oxy amino acid khác tạo nên vịng xoắn chuỗi polypeptide • Khi có cấu trúc bậc II protein (secondary structure) Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY • Ngồi liên kết hydro để tạo cấu trúc bậc II, nhóm amino acid chuỗi polypeptide cịn liên kết lại • Chẳng hạn, Cystein liên kết với nhau, Proline liên kết với để hình thành nên nhóm riêng 199 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 200 50 Cấu trúc bậc IV • Khi có nhiều chuỗi polypeptite với cấu trúc bậc III liên kết với nhau, tạo nên cấu trúc protein bậc IV (Quaternary structure) • Khi tạo nên cấu trúc khơng gian (3 chiều) tất nguyên tử phân tử protein Gọi cấu trúc bậc III (Protein tertiary structure) Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 201 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 202 Tổng kết • Protein chiếm phần lớn cấu trúc tế bào hành động enzyme xúc tác vào phản ứng tế bào • Có 20 amino acid, số cần thiết cho chế độ ăn uống người • Tổng hợp: amino acid, peptid bond, protein structure Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY GIẢI TRÌNH TỰ (SEQUENCING) 203 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 204 51 CODON – Có tất 64 codon, có • Như có codon mở đầu AUG (gọi start codon), gọi Methionine đóng vai trị mở đầu q trình dịch mã codon (UAA, UAG, UGA) gọi codon kết thúc (stop codon) – Bộ ba mã hóa (codon) đóng vai trị dịch mã tế bào – Mỗi codon mã hóa cho amino acid để cấu tạo nên đại phân tử protein Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY cịn lại 61 codon mã hóa cho 20 amino acid 205 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 206 ORF • Open Reading Frame – ORF • Trong q trình dịch mã, phân tử mRNA mang thông tin di truyền từ nhân ngồi tế bào chất với trình tự codon tương ứng với trình tự amino acid tổng hợp – Là đoạn trình tự DNA có khả dịch mã thành chuỗi polypeptide – Một ORF bắt đầu start codon kết thúc stop codon • Gene: ORF mã hóa cho protein Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 207 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 208 52 Minh họa Chẳng hạn • Có thể truy cập trang web Sequence Manipulation Siute (Ver 2.0) http://www.bioinformatics.org/sms2 để thực thao tác liên quan đến trình tự sinh học Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 209 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 210 Sau có trình tự, tìm ORF Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 211 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 212 53 Sequencing • Mục đích tìm nucleotide gene • Frederick Sanger đưa phương pháp giải trình tự vào năm 1977, gọi Sanger Sequencing • Kĩ thuật phổ biến gọi “chain termination“, sử dụng Defective DNA nucleotide (tức nucleotide bị chỉnh sửa làm khả kết hợp thêm nucleotide khác đầu 3′của nó) Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 213 Assoc Prof Tran Van Lang, PhD, VIETNAM ACADEMY OF SCIENCE AND TECHNOLOGY 214 54