Trang 1 BỘ GIÁO DỤC VÀ ĐÀO TẠOTRƯỜNG ĐẠI HỌC NƠNG LÂM THÀNH PHỐ HỒ CHÍ MINHKHOA KHOA HỌC SINH HỌCBÀI TẬP LÝ THUYẾTTP.Thủ Đức, 06/2024Ngành học: CÔNG NGHỆ SINH HỌCHọc phần: SINH TIN HỌCCa
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NÔNG LÂM THÀNH PHỐ HỒ CHÍ MINH
KHOA KHOA HỌC SINH HỌC
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC NÔNG LÂM THÀNH PHỐ HỒ CHÍ MINH
KHOA KHOA HỌC SINH HỌC
BÀI TẬP LÝ THUYẾT
SINH TIN HỌC
Giảng viên hướng dẫn Sinh viên thực hiện
PGS.TS NGUYỄN BẢO QUỐC 19126283 HỒ THẠCH HẠCH TUYẾT
21126563 PHAN THỊ CẨM TÚ
21126900 TRẦN CHÂU ANH
TP.Thủ Đức, 06/2024
Trang 3MỤC LỤC
DANH SÁCH CÁC HÌNH
Phần 1 ACCESSION NUMBER TRÌNH TỰ GEN 16S RNA CÁC LOÀI CẦN TÌM
1.1 Các bước thao tác
1.2 Kết quả
1.2.1 Vibrio parahaemolyticus
1.2.2 Vibrio azureus
1.2.3 Vibrio natriegens
1.2.4 Vibrio alginolyticus
1.2.5 Vibrio rotiferianus
1.2.6.Vibrio harveyi
1.2.7 Vibrio campbellii
1.2.8 Vibrio neocaledonicus
1.2.9 Photobacterium phosphoreum
1.2.10 Vibrio xuii
1.2.11 Vibrio gallicus
Phần 2 BLAST VÀ XÁC DỊNH TÊN LOÀI CỦA MẪU 11.5
2.1 Các bước thao tác
2.2 Kết quả và thảo luận
Phần 3 XÂY DỰNG CÂY DI TRUYỀN TỪ ACCESSION NUMBER VỚI MẪU 11.5
3.1 Các bước thao tác
3.2 Kết quả
Trang 4DANH SÁCH CÁC HÌNH
Hình 2.1 Kết quả BLAST của mẫu 11.5
Hình 3.1 Cây di truyền dạng Maximum Likelihood
Hình 3.2 Cây di truyền dạng Neighbor-joining
Hình 3.3 Cây di truyền dạng Minimum Evolution method
Hình 3.4 Cây di truyền dạng UPGMA
Hình 3.5 Cây di truyền Maximum Parsimony
Trang 5Phần 1 ACCESSION NUMBER TRÌNH TỰ GEN 16S
RNA CÁC LOÀI CẦN TÌM1.1 Các bước thao tác
NCBI → Database → Từ khóa: tên loài Vibrio parahaemolyticus partical sequence
of 16s RNA → Search → FASTA → Lấ+y trình tự
Trang 61.2.2 Vibrio azureus
>NR_041683.1 Vibrio azureus strain LC2-005 16S ribosomal RNA, partial sequenceGCGTCGAGCGGCGGACGGGTGAGTAATGCCTAGGAAATTGCCCTGATGTGGGGGATAACCATTGGAAACGATGGCTAATACCGCATAACGCCTACGGGCCAAAGAGGGGGACCTTCGGGCCTCTCGCGTCAGGATATGCCTAGGTGGGATTAGCTAGTTGGTGAGGTAAGGGCTCACCAAGGCGACGATCCCTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTGTGAAGAAGGCCTTCGGGTTGTAAAGCACTTTCAGTCG
Trang 71.2.3 Vibrio natriegens
>NR_026124.1 Vibrio natriegens
GAGTTTGATCATGGCTCAGATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGGAAACGAGTTAACTGAACCTTCGGGGGACGTTAACGGCGTCGAGCGGCGGACGGGTGAGTAATGCCTAGGAAATTGCCCTGATGTGGGGGATAACCATTGGAAACGATGGCTAATACCGCATGATGCCTACGGGCCAAAGAGGGGGACCTTCGGGCCTCTCGCGTCAGGATATGCCTAGGTGGGATTAGCTAGTTGGTGAGGTAAGGGCTCACCAAGGCGACGATCCCTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTGTGAAGAAGGCCTTCGGGTTGTAAAGCACTTTCAGTCGTGAGGAAGGTAGTGTAGTTAATAGCTGCATTATTTGACGTTAGCGACAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCGAGCG
Trang 81.2.4 Vibrio alginolyticus
>NR_044825.2 Vibrio alginolyticus strain ATCC 17749 16S ribosomal RNA, partial sequence
AAATTGAAGAGTTTGATCATGGCTCAGATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGGAAACGAGTTAACTGGAACTTGGGAACGATAACGGCGTTGAGCGGCGGACGGGTGAGTAATGCCTAGGAAATTGCCCTGATGTGGGGGATAACCATTGGAAACGATGGCTAATACCGCATAAGCTACGGGCCAAAGAGGGGGACCTTCGGGCCTCTCGCGTCAGGATATGCCTAGGTGGGATTAGCTAGTTGGTGAGGTAAGGGCTCACCAAGGCGACGATCCCTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTGTGAAGAAGGCCTTCGGGTTGTAAAGCACTTTCAGTCGTGAGGAAGGTAGTGTAGTTAATAGCTGCATTATTTGACGTTAGCGACAGAA
Trang 91.2.5 Vibrio rotiferianus
>NR_042081.1 Vibrio rotiferianus CAIM 577 = LMG 21460 16S ribosomal RNA, partial sequence
ATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGGAAACGAGTTATCTGAACCTTCGGGGAACGATAACGGCGTCGAGCGGCGGACGGGTGAGTAATGCCTAGGAAATTGCCCTGATGTGGGGGATAACCATTGGAAACGATGGCTAATACCGCATAATGCCTACGGGCCAAAGAGGGGGACCTTCGGGCCTCTCGCGTCAGGATATGCCTAGGTGGGATTAGCTAGTTGGTGAGGTAATGGCTCACCAAGGCGACGATCCCTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTGTGAAGAAGGCCTTCGGGTTGTAAAGCACTTTCAGTCGTGAGGAAGGTAGTGTAGTTAATAG
Trang 101.2.6.Vibrio harveyi
>NR_043165.1 Vibrio harveyi strain NCIMB1280 16S ribosomal RNA, partial
sequence
GCCTAACACATGCAAGTCGAGCGGAAACGAGTTATCTGAACCTTCGGGGAACGATAACGGCGTCGAGCGGCGGACGGGTGAGTAATGCCTAGGAAATTGCCCTGATGTGGGGGATAACCATTGGAAACGATGGCTAATACCGCATAATACCTWCGGGTCAAAGAGGGGGACCTTCGGGCCTCTCGCGTCAGGATATGCCTAGGTGGGATTAGCTAGTTGGTGAGGTAATGGCTCACCAAGGCGACGATCCCTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTGTGAAGAAGGCCTTCGGGTTGTAAAGCA
Trang 111.2.7 Vibrio campbellii
>NR_029222.1 Vibrio campbellii strain 40 16S ribosomal RNA, partial sequenceAAATTGAAGAGTTTGATCATGGCGCAGATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGGAAACGAGTTAACTGGAACTTGGGAACGATAACGGCGTCGAGCGGCGGACGGGTGAGTAATGCCTAGGAAATTGCCCTGATGTGGGGGATAACCACTTGGAAACGATGGCTAATACCGCATAATGCTACGGGCCAAAGAGGGGGACCTTCGGGCCTCTCGCGTCAGGATATGCCTAGGTGGGATTAGCTAGTTGGTGAGGTAAGGGCTCACCAAGGCGACGATCCCTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTAGAGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTGTGAAGAAGGCCTTCGGGTTGTAAAGCACTTTCAGT
Trang 121.2.8 Vibrio neocaledonicus
>NR_118432.1 Vibrio neocaledonicus strain NC470 16S ribosomal RNA, partial sequence
ATGCAAGTCGAGCGGAAACGAGTTATCTGAACCTTCGGGGAACGATAACGGCGTCGAGCGGCGGACGGGTGAGTAATGCCTAGGAAATTGCCCTGATGTGGGGGATAACCATTGGAAACGATGGCTAATACCGCATGATGCCTACGGGCCAAAGAGGGGGACCTTCGGGCCTCCGCGTCAGGATATGCCTAGGTGGGATTAGCTAGTTGGTGAGGTAAGGGCTCACCAAGGCGACGATCCCTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTGTGAAGAAGGCCCTTCGGGTTGTAAAGCACTTTCAGTCG
Trang 131.2.9 Photobacterium phosphoreum
>NR_036823.1 Photobacterium phosphoreum strain Kluyver 16S ribosomal RNA, partial sequence
ATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAACGGTAACAGATGANAGCTTGCTNTCATGCTGACGAACGGCGGACGGGTGAGTAATGCCTGGGAATATACCCTGATGTGGGGGATAACTATTGGAAACGATAGCTAATACCGCATAATCTCTTCGGAGCAAAGAGGGGGACCTTCGGGCCTCTCGCGTCAGGATTAGCCCAGGTGGGATTAGCTAGTTGGTGGGGTAATGGCTCACCAAGGCGACGATCCCTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGGGAAACCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTT
Trang 141.2.10 Vibrio xuii
>NR_025478.1 Vibrio xuii strain R-15052 16S ribosomal RNA, partial sequenceATTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAGCGGAAACGAGTTCWCTGAACCTTCGGGGAACGTGAACGGCGTCGAGCGGCGGACGGGTGAGTAATGCCTGGGAAATTGCCCTGATGTGGGGGATAACCATTGGAAACGATGGCTAATACCGCATAATAGCTTCGGCTCAAAGAGGGGGACCTTCGGGCCTCTCGCGTCAGGATATGCCCAGGTGGGATTAGCTAGTTGGTGAGGTAAGGGCTCACCAAGGCAACGATCCCTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAG
Trang 151.2.11 Vibrio gallicus
>NR_025740.1 Vibrio gallicus strain HT 2-1 16S ribosomal RNA, partial sequenceGGCGGCAGGCCTAACACATGCAAGTCGAGCGGAAACGACAACATTGACCCTTCGGGTGATTTGTTGGGCGTCGAGCGGCGGACGGGTGAGTAATGCCTGGGTATATGCCTTGATGTGGGGGATAACTATTGGAAACGATAGCTAATACCGCATAATGCCTACGGGCCAAAGAGGGGGATCTTCGGACCTCTCGCGTCAAGATTAGCCCAGGTGGGATTAGCTAGTTGGTGAGGTAATGGCTCACCAAGGCGACGATCCCTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTTGTAAAGTACTTTCAGTCGTGAGGAAGGCGTTGTAGTTAATAGCTGCATCGTT
Trang 16TGACGTTAGCGACAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCGAGCGTTAATCGGAATTACTGGGCGTAAAGCGCATGCAGGTGGTTTGTTAAGTCAGATGTGAAAGCCCGGGGCTCAACCTCGGAACCGCATTTGAAACTGGCAGGCTAGAGTACTGTAGAGGGGGGTAGAATTTCAGGTGTAGCGGTGAAATGCGTAGAGATCTGAAGGAATACCAGTGGCGAAGGCGGCCCCCTGGACAGATACTGACACTCAGATGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGTCTACTTGGAGGTTGTGGCCTTGAGCCGTGGCTTTCGGAGCTAACGCGTTAAGTAGACCGCCTGGGGAGTACGGTCGCAAGATTAAAACTCAAATGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTACTCTTGACATCCAGAGAATTCGCTAGAGATAGCTTAGTGCCTTCGGGAACTCTGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTTGTGAAATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCCTATCCTTGTTTGCCAGCACGTAATGGTGGGAACTCCAGGGAGACTGCCGGTGATAAACCGGAGGAAGGTGGGGACGACGTCAAGTCATCATGGCCCTTACGAGTAGGGCTACACACGTGCTACAATGGCGCATACAGAGGGCGGCGAGCCAGCGATGGTGAGCGAATCCCAAAAAGTGCGTCGTAGTCCGGATTGGAGTCTGCAACTCGACTCCATGAAGTCGGAATCGCTAGTAATCGTAGATCAGAATGCTACGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTGGGCTGCAAAAGAAGTAGGTAGTTTAACCTTCGGGAGAACGCTTACCACTTTGTGGTTCATGACTGGGGTGAAGTCGTAACAAGGTAGCCCTAGGGGAACCTGCGGCTGGATCACCTCCTTA
Trang 17Phần 2 BLAST VÀ XÁC DỊNH TÊN LOÀI
CỦA MẪU 11.52.1 Các bước thao tác
Tải về phần mềm MEGA X (64 bit) for Windows
Bước 1: Đưa dữ liệu vào: lần lượt thao tác như sau
a) Tạo Alignment: Mở phần mềm -> chọn Align -> Edit/Built Alignment -> Create a new alignment → OK → DNA
b) Đưa dữ liệu và bỏ trình tự nhiễu: View/Edit trace data from DNA sequencers → Chọn file dự liệu trong máy (tên file: mẫu 11.5) → Open → Edit → Copy → FASTA
→ bỏ trình tự nhiễu ở 2 đầu và cuối, lấy phần còn lại → Lưu lại phần trình tự còn lại
để đi kiểm tra
Trang 18Bước 2: Kiểm tra trình tự:
Search google : DNA blast → Nucleotide blast → Dán trình tự đã lưu ở bước 1.b vào
ô Enter accession number(s), gi(s), or FASTA sequence(s) → Program Selection → Optimize for → Highly similar sequences (megablast) → BLAST → Xem kết quả
2.2 Kết quả và thảo luận
- Trình tự Mẫu 11.5 sau khi bỏ phần nhiễu
GCGTCGAGCGGCGGACGGGTGAGTAATGCCTGGGAAATTGCCCTGATGTGGGGGATAACCATTGGAAACGATGGCTAATACCGCATAATAGCTTCGGCTCAAAGAGGGGGACCTTCGGGCCTCTCGCGTCAGGATATGCCCAGGTGGGATTAGCTAGTTGGTGAGGTAAGGGCTCACCAAGGCAACGATCCCTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGCACAATGGGCGCAAGCCTGATGCAGCCATGCCGCGTGTATGAAGAAGGCCTTCGGGTTGTAAAGTACTTTCAGCAGTGAGGAAGGTTCATGCGTTAATAGCGTATGGATTTGACGTTAGCTGCAGAAGAAGCACCGGCTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCGAGCGTTAATCGGAATTACTGGGCGTAAAGCGCATGCAGGTGGTTTGTTAAGTCAGATGTGAAAGCCCGGGGCTCAACCTCGGAATTGCATTTGAAACTGGCAGACTAGAGTACTGTAGAGGGGGGTAGAATTTCAGGTGTAGCGGTGAAATGCGTAGAGATCTGAAGGAATACCGGTGGCGAAGGCGGCCCCCTGGACAGATACTGACACTCAGATGCGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCGTAAACGATGTCTACTTGGAGGTTGTGGCCTTGAGCCGTGGCTTTCGGAGCTAACGCGTTAAGTAGACCGCCTGGGGAGTACGGTCGCAAGATTAAAACTCAAATGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTACTCTTGACATCCAGAGAACTTTCCAGAGATGGATTGGTGCCTTCGGGAACTCTGAGACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTTGTGAAATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTATCCTTGTTTGCCAGCAATTCAGGTGGGAACTCCAGGGAAACTGCCGGTGAAAAACCGGAAGAAAGGTGGGGAACAACTTC
- Kết quả BLAST
Trang 19Hình 2.1 Kết quả BLAST của mẫu 11.5
Kết quả BLAST cho thấy xuất hiện nhiều loài đều thuộc chi Vibrio sp Từ kết
quả BLAST có thể kết luận mẫu 11.5 thuộc chi Vibrio (Vibrio sp.).
Trang 20Phần 3 XÂY DỰNG CÂY DI TRUYỀN TỪ ACCESSION
NUMBER VỚI MẪU 11.53.1 Các bước thao tác
Bước 1: Đưa dữ liệu vào: lần lượt thao tác như sau
a) Tạo Alignment: Mở phần mềm -> chọn Align -> Edit/Built Alignment ->Create a new alignment → OK → DNA
b) Đưa dữ liệu: Edit -> Insert sequence from file -> Chọn file dự liệu trong máy ->Open -> Ignore Sau đó xóa sepqence (vì trong này không có dữ liệu và nếu không xóa
sẽ không vẽ cây di truyền được): chọn sequence 1 -> chuột phải -> Delete
Trang 21Bước 2: Cài đặt cho Alignment: lần lượt thao tác như sau
a) Cài đặt Alignment: biểu tượng “W” → Align DNA → Alignment → Align byClustalW → OK → Bảng ClustalW options → Matrix (chọn ClustalW 1.6) → OK
b) Xuất Alignment: Data → Export Alignment → MEGA Format → Đặt tên file →Input title of the data: đặt tên → OK → Protein-coding nucleotide sequence data →Yes → Thoát phần mềm
Bước 3: Xây dựng 5 cây di truyền: lần lượt thao tác như sau:
Trang 22a) Xây cây di truyền: Phylogeny → chọn 1 trong 5 cây di duyền → Chọn file
dữ1 liệu (tạo ở bữở5c 2) → Open → Test of Phylogeny : Bootstrap method → No.
of Bootstrap Replications : 1000 → OK
b) Lữu cây di truyền: Image → Dạng file lữu
Trang 233.2 Kết quả
Hình 3.1 Cây di truyền dạng Maximum Likelihood.
Trang 24Hình 3.2 Cây di truyền dạng Neighbor-joining.
Trang 25Hình 3.3 Cây di truyền dạng Minimum Evolution method.
Trang 26Hình 3.4 Cây di truyền dạng UPGMA.
Trang 27Hình 3.5 Cây di truyền Maximum Parsimony.