____________________________ BẢN CHUẨN Đại học Nha Trang ____________________________ THỰC TẬP ỨNG DỤNG TIN HỌC TRONG SINH HỌC (Dành cho sinh viên ngành công nghệ sinh học) Bài 1: Khai thác cơ sở dữ liệu trên mạng Internet 1. Yêu cầu: Nắm được những công cụ chính trong cơ sở dữ liệu NCBI như tìm kiếm phần mềm tin sinh, tìm kiếm sách báo, tìm kiếm trình tự, tìm kiếm cấu trúc protein…Từ đó, liên hệ đến những công cụ tương tự trên các cơ sở dữ liệu khác như EMBL, DDBJ… 2. Nội dung thực hành: a. Tìm kiếm các bài báo, các công trình đã công bố trên cơ sở dữ liệu (NCBI, EMBL, DDBJ, Nature.com, Sciencedirect.com…) liên quan “bioactive compound”, “bioactive compound in marine” Có bao nhiêu kết quả? Bước 1: Tìm kiếm trên NCBI .................
Trang 1VIỆN CÔNG NGHỆ SINH HỌC & MÔI TRƯỜNG
BÁO CÁO THỰC TẬP
ỨNG DỤNG TIN HỌC TRONG SINH HỌC
(Dành cho sinh viên ngành công nghệ sinh học)
GVHD: Th.S LÊ PHƯƠNG CHUNG SVTH: Nguyễn Mạnh Tường
Lớp: 54CNSH MSSV: 54131251
Nha Trang, tháng 2 năm 2015 (Lưu hành nội bộ)
Trang 2GVHD: Th.S LÊ PHƯƠNG CHUNG
Báo cáo thực tập TIN SINH 2
MỤC LỤC
Bài 1: Khai thác cơ sở dữ liệu trên mạng Internet 3
Bài 2: Đệ trình trình tự lên cơ sở dữ liệu 11
Bài 3: Thiết kế primer cho PCR 15
và thiết lập bản đồ enzyme cắt giới hạn 15
Bài 4: Thao tác với trình tự DNA thô 18
Bài 5: Xây dựng cây phân loại 20
Bài 6: Hiển thị cấu trúc protein 23
Bài 7: Bài tập bổ sung 24
LỜI KẾT 31
Trang 3Báo cáo thực tập TIN SINH 3
THỰC TẬP ỨNG DỤNG TIN HỌC TRONG SINH HỌC
(Dành cho sinh viên ngành công nghệ sinh học)
Bài 1: Khai thác cơ sở dữ liệu trên mạng Internet
1 Yêu cầu:
Nắm được những công cụ chính trong cơ sở dữ liệu NCBI như tìm kiếm phần mềm tin sinh, tìm kiếm sách báo, tìm kiếm trình tự, tìm kiếm cấu trúc protein…Từ đó, liên hệ đến những công cụ tương tự trên các cơ sở dữ liệu khác như EMBL, DDBJ…
2 Nội dung thực hành:
a Tìm kiếm các bài báo, các công trình đã công bố trên cơ sở dữ liệu (NCBI,
EMBL, DDBJ, Nature.com, Sciencedirect.com…) liên quan “bioactive compound”,
“bioactive compound in marine”
- Có bao nhiêu kết quả?
Bước 1: Tìm kiếm trên NCBI
Bước 2: Tìm kiếm trên EMBL
Trang 4GVHD: Th.S LÊ PHƯƠNG CHUNG
Báo cáo thực tập TIN SINH 4
Bước 3: Tìm kiếm trên DDBJ
Trang 5Báo cáo thực tập TIN SINH 5
Bước 4: Tìm kiếm trên Nature.com
Bước 5: Tìm kiếm trên Sciencedirect.com
Trang 6GVHD: Th.S LÊ PHƯƠNG CHUNG
Báo cáo thực tập TIN SINH 6
- Chọn 1 kết quả, tải về và phân tích nội dung?
+ NCBI: Tiêu đề Research Article Data Deposition Abstract
Key Words Introduction Materials and Methods Results Discussion Acknowledgment References Tables Figure Legends Supplementary Material
+ EMBL: Tiêu đề Abstract Resumo Introduction Materials and
methods Results and discussion Conclusions Acknowledgments References
+ DDBJ: Chi tiết dự án (Mã số Loại hình dự án Kiểu dự liệu của
dự án) Thông tin chung (Tên dự án Mô tả dự án Ngày phát hành) Loại hình
dự án (Phạm vi lấy mẫu Vật chất Phương pháp học) Mục tiêu (Tên sinh vật
Phân loại tư duy ID)
Trang 7Báo cáo thực tập TIN SINH 7
+ Nature.com: Tiêu đề Introduction Results Solfware available
Methods References Acknowledgements Author information Supplementary information
+ Sciencedirect.com: Yêu cầu thu phí để tải về
- So sánh kết quả khi tìm kiếm trên các CSDL?
NCBI EMBL DDBJ Nature.com Sciendirect.com Chọn thông số
rồi mới tìm
Nhiều tài liệu
dễ tải về
Tìm xong rồi mới chọn thông
số
Tương đối nhiều tài liệu,
Yêu cầu thu phí khi tải về
b Tìm kiếm trình tự gene virus “H5N1” (Có thể bổ sung thêm từ khóa “HA”
để tìm kiếm chính xác hơn)
- Có bao nhiêu kết quả?
Trang 8GVHD: Th.S LÊ PHƯƠNG CHUNG
Báo cáo thực tập TIN SINH 8
- Chọn một kết quả và phân tích nội dung?
Xem dưới dạng GenBank có các nội dung sau:
LOCUS: Vị trí của gen, độ dài gen
DEFINITION: Định nghĩa tên của trình tự
ACCESSION:
VERSION: Phiên bản của trình tự này
SOURCE: Nguồn tham khảo
REFERENCE: Tham khảo
AUTHORS: Tên tác giả
TITLE: Tiêu đề
JOURNAL:
ORIGIN: Trình tự của gen cần tìm
Xem dưới dạng FASTA:
Trang 9Báo cáo thực tập TIN SINH 9
>gi …
Trình tự
c Tìm kiếm trình tự 16S của “Streptomyces”
- Có bao nhiêu kết quả tìm được?
- Chọn 10 kết quả có trình tự lớn hơn 800bp để sử dụng cho các phân tích tiếp theo (Lưu file txt)
Trang 10GVHD: Th.S LÊ PHƯƠNG CHUNG
Báo cáo thực tập TIN SINH 10
d Tìm kiếm và download một sách tham khảo chuyên ngành trên CSDL mà
anh chị yêu thích?
Bước 1: Chọn trường tìm kiếm là Books với Browse Titles và nhập từ khóa
Bước 2: Download sách về
Trang 11Báo cáo thực tập TIN SINH 11
3 Thực hành và báo cáo kết quả?
Trang 12GVHD: Th.S LÊ PHƯƠNG CHUNG
Báo cáo thực tập TIN SINH 12
- Thực hiện các bước thao tác trên phần mềm Sequin nhằm chuẩn bị đệ trình trình tự lên Genbank
Bước 1: Điền các thông tin vể trình tự
Bước 2: Tiến hành chèn trình tự vào
Trang 13Báo cáo thực tập TIN SINH 13
Bước 3: Done để lưu file sequin
- Đệ trình trình tự vừa thao tác theo 2 phương pháp
Bước 1: Đệ trình trực tiếp bằng submit trên NCBI
Trang 14GVHD: Th.S LÊ PHƯƠNG CHUNG
Báo cáo thực tập TIN SINH 14
Bước 2: Đệ trình lên gmail thông qua địa chỉ gb-admin@cnbi.nlm.nih.gov
Trang 15Báo cáo thực tập TIN SINH 15
3 Thực tập và báo cáo kết quả?
………
Bài 3: Thiết kế primer cho PCR
và thiết lập bản đồ enzyme cắt giới hạn
Trang 16GVHD: Th.S LÊ PHƯƠNG CHUNG
Báo cáo thực tập TIN SINH 16
Bước 1: Đưa trình từ DNA vào và tiến hành thiết kế mồi với đoạn trình tự đã
chọn
Bước 2: Tiến hành vẽ bản đồ cắt giới hạn
Trang 17Báo cáo thực tập TIN SINH 17
b Sử dụng các phần mềm online khác đã được học
c So sánh các kết quả thu được từ các cách trên?
DNA club Primer3
Giống nhau Đều tạo ra các cặp mồi xuôi và mồi ngược
Đều có các thông số độ dài, vị trí, nhiệt độ nóng chảy
Khác nhau
Mồi xuôi + Mồi ngược Khác nhau Khác nhau
Thông tin đính kèm
Không có nhà sản xuất Chỉ có các thông số về độ dài,vị trí, nhiệt độ nóng chảy
Trang 18GVHD: Th.S LÊ PHƯƠNG CHUNG
Báo cáo thực tập TIN SINH 18
3 Thực tập và báo cáo kết quả
a Phân tích, chỉnh sửa và lựa chọn kết quả sequencing
b Nối 2 trình tự được giải trình tự bằng 2 mồi (overlap)
Trang 19Báo cáo thực tập TIN SINH 19
c BLAST các trình tự thu được?
Trang 20GVHD: Th.S LÊ PHƯƠNG CHUNG
Báo cáo thực tập TIN SINH 20
4 Thực tập và báo cáo kết quả đối với các file C2, C3, C4, C5 trong các trình
Trang 21Báo cáo thực tập TIN SINH 21
Bước 2: Xem kết quả
b Sử dụng phần mềm ClustalX để dựng cây phân loại
Trang 22GVHD: Th.S LÊ PHƯƠNG CHUNG
Báo cáo thực tập TIN SINH 22
c Hiển thị kết quả bằng phần mềm Njplot hoặc TreeView
Bước 1: Quan sát bằng Njplot
Bước 2: Quan sát bằng TreeView
Trang 23Báo cáo thực tập TIN SINH 23
4 Thực tập và báo cáo kết quả theo các file đính kèm và file 10 chủng đã làm
ở Bài 1?
………
Bài 6: Hiển thị cấu trúc protein
1 Yêu cầu:
- Nắm được các phần mềm hiển thị cấu trúc không gian của phân tử protein
- Phân tích được kết quả thu được các mô hình cấu trúc
2 Nội dung thực hành:
a Sử dụng phần mềm Cn3D?
b Sử dụng phần mềm RASMOL?
Trang 24GVHD: Th.S LÊ PHƯƠNG CHUNG
Báo cáo thực tập TIN SINH 24
3 Thực tập và báo cáo kết quả?
………
Bài 7: Bài tập bổ sung
1 Yêu cầu:
- Nắm được nội dung và ý nghĩa của từng bài thực hành
- Biết ứng dụng các bài thực hành vào giải quyết các vấn đề thực tế trong các
kỹ thuật công nghệ sinh học
2 Phần mềm sử dụng:
NCBI, DNA club, Bioedit, Sequin, Submit, Clustal X, Tree View, PDB,
Rasmol
Trang 25Báo cáo thực tập TIN SINH 25
3 Nội dung thực hành:
Tách dòng gen mã hóa enzyme amylase
Bước 1: Sau khi thu mẫu, tiến hành tách DNA mã hóa amylase Đồng thời, tìm
kiếm đoạn gen mã hóa amylase trên NCBI để tiến hành thiết kế mồi chạy Sanger giải
trình tự DNA mã hóa amylase thu được và plasmid để làm vector biến nạp
Bước 2: Chạy DNA club với đoạn gen mã hóa amylase tìm được trên NCBI để
thiết kế mồi chạy Sanger giải trình tự DNA mã hóa amylase thu được
Trang 26GVHD: Th.S LÊ PHƯƠNG CHUNG
Báo cáo thực tập TIN SINH 26
Bước 3: Sau khi đánh giá mồi và chọn được cặp mồi tốt nhất, tiến hành giải
trình tự bằng Sanger Giả sử đã thu được 2 trình tự mồi xuôi và ngược kéo dài bắt cặp bổ
sung cho nhau, tiến hành tìm mạch khuôn bằng Bioedit – đó là DNA mã hóa amylase thu được
Bước 4: Tiến hành đệ trình trình tự DNA mã hóa Amylase đã giải được
Trang 27Báo cáo thực tập TIN SINH 27
Trang 28GVHD: Th.S LÊ PHƯƠNG CHUNG
Báo cáo thực tập TIN SINH 28
Trang 29Báo cáo thực tập TIN SINH 29
Bước 5: Tiến hành Blast và vẽ cây phân loại với 9 trình tự DNA mã hóa
Amylase khác (không cần thiết)
Bước 6: Xem cấu trúc không gian của Amylase (không cần thiết)
Trang 30GVHD: Th.S LÊ PHƯƠNG CHUNG
Báo cáo thực tập TIN SINH 30
Bước 7: Chuyển DNA mã hóa amylase thu được vào plasmid Tiến hành vẽ
bản đồ cắt giới hạn của DNA mã hóa amylase thu được và plasmid bằng DNA clu b
Bước 8: Tiến hành biến nạp vector vào trong Bacillus subtilis Và kiểm tra
hoạt tính bằng test iod trên môi trường cơ chất tinh bột
4 Thực tập và báo cáo kết quả
Trang 31Báo cáo thực tập TIN SINH 31
LỜI KẾT
Sau bài thực tập tin sinh, các thao tác với phần mềm tin sinh đã dần trở nên quen thuộc Những phần mềm này sẽ hỗ trợ đắc lực cho các kỹ thuật công nghệ sinh học như: Sinh học phân tử, Công nghệ gen, Kỹ thuật di truyền, … Song song với việc ứng dụng các phần mềm này vào giải quyết các vấn đề thực tế, thì việc tự học và nghiên cứu thêm về các công cụ hỗ trợ tin sinh khác là rất cần thiết ví dụ lập trình ngôn ngữ R của
GS Nguyễn Văn Tuấn, Viện nghiên cứu y khoa Garvan, Khoa Y, Đại học New South
Wales Autralia
Em xin chân thành cảm ơn thầy Chung đã quan tâm và giúp đỡ tận tình trong quá trình thực tập tin sinh Em xin chúc Thầy SỨC KHỎE và THÀNH CÔNG trong
CUỘC SỐNG!