Các thao tác cơ bản của Tin Sinh Học với các cơ sở dữ liệu như NCBI, EMBL, DDBJ. Sử dụng phần mềm Sequin để đệ trình trình tự sinh học lên cơ sở dữ liệu. Sử dụng các phần mềm thông dụng trực tuyến hoặc không trực tuyến trong thiết kế mồi cho phản ứng PCR và thiết kế bản đồ enzyme cắt giới hạn
khai thác cơ sở dữ liệu trên mạng Internet
Để khai thác hiệu quả cơ sở dữ liệu NCBI, người dùng cần nắm vững các công cụ quan trọng như tìm kiếm phần mềm tin sinh, tìm kiếm sách báo, tìm kiếm trình tự và tìm kiếm cấu trúc protein Ngoài ra, có thể liên hệ và so sánh với các công cụ tương tự trên các cơ sở dữ liệu khác như EMBL và DDBJ để mở rộng khả năng nghiên cứu và phân tích dữ liệu sinh học.
To conduct practical research, search for published articles and studies in databases such as NCBI, EMBL, DDBJ, Nature.com, and Sciencedirect.com that focus on "bioactive compounds" and "bioactive compounds in marine environments."
Có bao nhiêu kết quả?
Tên CSDL NCBI EMBL DDBJ
Chọn 1 kết quả, tải về và phân tích nội dung?
+) NCBI: - Tên bài báo, phiên bản thứ bao nhiêu
-Tên tác giả gửi lên, email, số điện thoại và faxt của người gửi
-Cộng sự và tên của sở, bộ, công ty nơi nghiên cứu về chủ đề của bài báo
- Ngày gửi lên, ngày được chấp nhận và ngày xuất bản của bài báo
- Từ khóa tìm kiếm bài báo
- Nội dung bài báo theo các mục: giới thiệu, kết quả và thảo luận, nghiệm mục, kết luận
- Lời cảm ơn của tác giả, thông tin bổ sung, tác giả đóng góp, xung đột lợi ích
+) EMBL: - Tên bài báo, phiên bản thứ bao nhiêu
-Tên tác giả gửi lên, cộng sự
- Ngày gửi lên, ngày được chấp nhận và ngày xuất bản của bài báo
- Từ khóa tìm kiếm bài báo
- Nội dung bài báo theo các mục: giới thiệu, kết quả và thảo luận, kết luận
- Lời cảm ơn của tác giả
+) DDBJ: bài báo không tải được, do liên kết với google chứ không có trong cơ sở dữ liệu
So sánh kết quả khi tìm kiếm trên các CSDL?
+) NCBI: kết quả ít hơn nhưng kết quả đã được chọn lọc thành các bài báo có thể tải miễn phí
EMBL cung cấp nhiều kết quả nghiên cứu, tuy nhiên, các kết quả này chỉ được chọn lọc và công bố dưới dạng bài báo Trong số đó, có những bài báo có thể tải về miễn phí, những bài báo yêu cầu phí tải, và cả những bài báo chỉ cho phép đọc trực tuyến mà không thể tải xuống.
DDBJ cung cấp kết quả tối thiểu khi liên kết với Google, dẫn đến việc người dùng thường không thể đọc được bài báo, thậm chí không thấy kết quả hiển thị cho bài báo liên quan Việc tìm kiếm trình tự gene của virus "H5N1" gặp nhiều khó khăn do những vấn đề này.
Có bao nhiêu kết quả?
Chọn một kết quả và phân tích nội dung?
+) NCBI: Tên locus, độ dài trình tự, trình tự, tác giả, sinh vật, trình tự, đoạn trình tự có nghĩa
+) EMBL: Tên locus, độ dài trình tự, trình tự, tác giả, sinh vật, trình tự, đoạn trình tự có nghĩa
+) DDBJ: tên locus, độ dài trình tự, tên tác giả, trình tự, tên sinh vật c Tìm kiếm trình tự 16S của “Streptomyces”
Có bao nhiêu kết quả tìm được?
220029 kết quả tìm được ( trên NCBI )
Chọn 10 kết quả có trình tự lớn hơn 800bp để sử dụng cho các phân tích tiếp theo
(Lưu file txt) d Tìm kiếm và download một sách tham khảo chuyên ngành trên CSDL mà anh chị yêu thích?
Ví dụ: tìm sách có tựa đề là biochemistry
- Bước 1: mở trang cơ sở dữ liệu NCBI, chọn trường tìm kiếm Books, sau đó gõ tên sách cần download vào ô tìm kiếm như hình dưới
Click vào Search, kết quả là có 1037 bộ sách được tìm thấy
- Bước 2: click chuột vào 1 bộ sách muốn tải, ta sẽ thấy danh mục các sách được tìm thấy trong bộ sách mà mình chọn trường tìm kiếm
- Bước 3: click vào 1 sách cần tải, sau đó click chuột vào biểu tượng tùy chọn như hình, rồi click chuột vào PDF để download
3 Thực hành và báo cáo kết quả? a Cách tìm kiếm bài báo “bioactive compound” và download 1 bài báo
- Bước 1: mở trang cở sở dữ liệu NCBI
Để tìm kiếm bài báo về hợp chất sinh học trên PubMed, bạn cần chọn trường tìm kiếm, nhập tên bài báo trong dấu “ ” và nhấn vào nút tìm kiếm Kết quả tìm kiếm sẽ hiển thị 743 bài báo liên quan.
- Bước 3: click chuột chọn bộ lọc tìm kiếm là Free full text kết quả là 223 bài báo được tìm thấy
- Bước 4: Click chuột vào 1 bài báo cần tải, sau đó click chuột vào links dẫn đến bài báo
- Bước 5: click chuột vào PDF sau đó tải bình thường
- Bước 1: mở trang cơ sở dữ liệu EMBL và gõ tên bài báo cần tìm kiếm “bioactive compound” ( chú ý tên bài báo phải để trong dấu “ ” )
- Bước 2: chọn bộ lọc tìm kiếm là literature sau đó chọn tiếp bộ lọc tiếp là MEDLINE
- Kết quả là được 744 bài báo được tìm thấy
- Bước 3: click vào 1 bài báo muốn tải sau đó click chuột vào Full text
- Và cuối cùng là click chuột vào biểu tượng download PDF để tải
- Mở trang cơ sở dữ liệu DDBJ sau đó gõ tên bài báo cần tìm kiếm “bioactive compound” vào ô search (chú ý tên bài báo phải để trong dấu “ ” )
- Kết quả là 2 b Cách tìm kiếm trình tự gene virus “H5N1” và tải trình tự
- Mở trang cơ sở dữ liệu NCBI, Chọn trường tìm kiếm là nucleotide và gõ tên trình tự gene virus H5N1 vào ô tìm kiếm, sau đó click chuột vào search
- Kết quả là 28244 trình tự được tìm thấy
- Click chuột vào 1 kết quả để xem
- Click chuột vào FASTA để xem trình tự của đoạn gen
- Để download trình tự ta click chuột vào send, trong menu này ta chọn completebrecord và file sau đó click chuột vào create file để tải trình tự xuống
- Mở trang EMBL, gõ trình tự cần tìm kiếm là H5N1 vào ô tìm kiếm
- Chọn bộ lọc tìm kiếm là nucleotide sequences
- Kết quả là 62213 trình tự được tìm thấy
Chọn một kết quả để xem thông tin: bạn có thể chọn TEXT trong phần xem để xem trực tiếp hoặc tải toàn bộ thông tin về trình tự; hoặc chọn FASTA trong phần xem để xem hoặc tải trình tự mà bạn đang tìm kiếm.
- Mở trang cơ sở dữ liệu DDBJ lên và click chuột vào search/analysis
- Gõ tên trình tự cần tìm kiếm H5N1 vào ô search
- Kết quả được liên kết với Googleclick chuột mở kết quả
- Click chuột vào search condition, sau đó nhập tên trình tự cần tìm là H5N1 vào ô quick search, rồi click chuột vào search
- Kết quả là 30 trình tự được tìm thấy, click chuột vào download để tải trình tự c Tìm kiếm trình tự 16S của “Streptomyces”
- Mở trang cơ sở dữ liệu NCBI, chọn trường tìm kiếm nucleotide, sau đó gõ tên trình tự cần tìm kiếm là 16S Streptomyces vào ô tìm kiếmsearch
- Kết quả là có 220029 trình tự được tìm thấy
Để lấy 10 trình tự có độ dài trên 800 bp, bạn cần nhấp chuột vào mục "sequence length" và trong ô "custom range", nhập độ dài trình tự từ 800 đến 9999.
- Ví dụ 1 kết quả 16S Streptomyces
đệ trình trình tự lên cơ sở dữ liệu
1 Yêu cầu: Sử dụng phần mềm Sequin để đệ trình trình tự sinh học lên cơ sở dữ liệu
Chọn một trình tự trong 10 trình tự đã có trong Bài 1, chỉnh sửa tùy ý
Thực hiện các bước thao tác trên phần mềm Sequin nhằm chuẩn bị đệ trình trình tự lên Genbank
Đệ trình trình tự vừa thao tác theo 2 phương pháp
3 Thực tập và báo cáo kết quả? a Chọn một trình tự trong 10 trình tự đã có trong bài 1, chỉnh sửa tùy ý
- Mở 1 trình tự sau đó xóa 1 số nucleotide tùy ý
- Lưu thành 1 tệp khác b Thực hiện các bước thao tác trên phần mềm Sequin nhằm chuẩn bị đệ trình trình tự lên
- Mở phần mềm Sequin, click chuột vào start new submission để bắt đầu chương trình
- Nhập tên trình tự vào ô trống, sau đó click chuột vào next page
- Nhập họ tên, số điện thoại, fax, và email như hình dưới, sau đó click chuột vào next page
- Click chuột vào next page
- Điền đầy đủ các thông tin, sau đó click chuột vào Next Fom
- Làm các bước theo hình dưới
- Click chuột vào import Nucleotide FASTA để chèn tệp chứa trình tự mà ta đã chỉnh sửa, sau đó click chuột vào Next Page
- Click chuột vào Add organisms, Locations,and Genetic Codes, sau đó đặt tên như hình dưới và click chuột vào accept
Tiếp tục nhấn chuột vào "next page" cho đến khi đến bước tiếp theo, sau đó chọn "note", nhấn "next page" và cuối cùng chọn "done" để lưu tệp, hoàn tất quá trình đóng gói (tệp có đuôi sqn).
) c Đệ trình trình tự vừa thao tác theo 2 phương pháp
-Mở trang cơ sở dữ liệu NCBI, click chuột vào submit
-Click chuột vào GenBanhkSequin
-Click chuột vào update instructionsUpdateMacroSend
-Điền đầy đủ thông tin và chèn tệp đã đóng gói, sau đó click chuột vào Submit
- Gửi file đã đóng gói tới địa chỉ gb-admin@ncbi.lmn.nih.gov
- Gửi thành công sẽ có 1 tin nhắn thông báo
thiết kế primer cho PCR và thiết lập bản đồ enzyme cắt giới hạn
và thiết lập bản đồ enzyme cắt giới hạn
Để thiết kế mồi cho phản ứng PCR và bản đồ enzyme cắt giới hạn, người dùng có thể sử dụng các phần mềm phổ biến như Primer3, OligoCalc và SnapGene Những công cụ này hỗ trợ tối ưu hóa thiết kế mồi, đảm bảo tính chính xác và hiệu quả trong các thí nghiệm sinh học phân tử Việc lựa chọn phần mềm phù hợp giúp nâng cao chất lượng kết quả nghiên cứu và tiết kiệm thời gian trong quá trình thực hiện.
Trong phần thực hành, người dùng sẽ áp dụng phần mềm DNA Club để thiết kế mồi và tạo bản đồ enzyme cắt giới hạn Bên cạnh đó, các phần mềm trực tuyến khác đã được học cũng sẽ được sử dụng để hỗ trợ quá trình này Cuối cùng, sẽ tiến hành so sánh các kết quả thu được từ các phương pháp khác nhau để đánh giá hiệu quả của từng công cụ.
3 Thực tập và báo cáo kết quả a Sử dụng phần mềm DNA club trong thiết kế mồi và bản đồ enzyme cắt giới hạn?
• Thiết kế mồi bằng phần mềm DNA club
-Mở phần DNA club sau đó copy 1 trình tự vào, xóa các khoảng trống của trình tự
To begin the primer selection process, click on PCRPrimers and enter the appropriate parameters Once you've input the necessary information, click on "start selection" to obtain both forward and reverse primers.
-Click chuột vào examine all pairs để chọn đoạn mồi tốt nhất
• Sử dụng phần mềm DNA club lập bản đồ enzyme cắt giới hạn
- Copy trình tự cần lập bản đồ enyme cắt giới hạn, xóa khoảng trống
- Click chuột vào DrawMapMap All Siteskết quả của bản đồ RE b Sử dụng các phần mềm online khác đã được học( phần mềm primer3)
- Mở phần mềm primer3( http://bioinfo.ut.ee/primer3-0.4.0/primer3/input.htm), sau đó dán trình tự vàopick primers
Kết quả thu được bao gồm một cặp mồi chính hiển thị trong khung màu đỏ ở đầu cửa sổ và bốn cặp mồi bổ sung nằm ở cuối cửa sổ Việc so sánh các kết quả từ các phương pháp khác nhau cho thấy sự khác biệt rõ rệt trong hiệu quả và tính ứng dụng của từng cách tiếp cận.
- Chỉ ra được cặp mồi tốt nhất cho trình tự dựa vào các thông số mà mình chọn
- Ngoài cặp mồi chính còn có thêm 4 cặp mồi phụ nữa
Thao tác với trình tự DNA thô
Để thực hiện phương pháp giải trình tự Sanger, cần nắm vững nguyên lý hoạt động của nó và cách xử lý dữ liệu DNA thu được từ máy giải trình tự Việc hiểu rõ quy trình này giúp đảm bảo độ chính xác trong việc phân tích và giải mã các trình tự DNA.
2 Phần mền sử dụng: Bioedit; NCBI; BLAST
Trong nội dung thực hành, chúng ta sẽ tiến hành phân tích, chỉnh sửa và lựa chọn kết quả từ quá trình giải trình tự Tiếp theo, cần nối hai trình tự đã được giải trình tự bằng cách sử dụng hai mồi có sự chồng chéo Cuối cùng, thực hiện tìm kiếm BLAST để xác định các trình tự thu được.
4 Thực tập và báo cáo kết quả đối với các file C2, C3, C4, C5 trong các trình tự mẫu? a File C2
• Phân tích, chỉnh sửa và lựa chọn kết quả sequencing
Mở file C2 chứa mồi xuôi và mồi ngược, xóa các đoạn trình tự chứa nhiều “N”, đoạn nào chứa ít “N” thì thay “N” bằng “-“
-Mồi xuôi( chỉnh sửa tương tự như mồi ngược)
• Nối 2 trình tự được giải trình tự bằng 2 mồi (overlap)
- Bôi đen toàn bộ trình tự mồi ngược, click chuột vào editcopy
- Mở tệp mồi ngượcsequencenew sequencepaste, sau đó đặt lại tên và chọn tupe là DNA Nhấp chuột vào apply and close
- Bôi đen trình tự vừa đặt tênSequencenew squencenucleic acidreverse complement
- Bôi đen toàn bộ trình tựaccessory applicationCAP contig assembly program
- Kết quả là contig-0, save tệp
• BLAST các trình tự thu được?
- Mở trang cơ sở dữ liệu NCBI, click chuột vào BLAST
- Click chuột vào nucleotide blast
- Chèn tệp chứa trình tự cần blast BLAST
- Kết quả d File C3( tương tự như tệp C2)
- Chỉnh sửa mồi R và mồi F
Xây dựng cây phân loại
1 Yêu cầu: Nắm được các bước xây dựng cây phát sinh loài trong phân tích đa dạng sinh học
2 Phần mềm sử dụng: BLAST, ClustalX và Njplot, TreeView
Trong nội dung thực hành, người dùng sẽ tìm kiếm trình tự tương đồng bằng công cụ BLAST, sau đó sử dụng phần mềm ClustalX để xây dựng cây phân loại Cuối cùng, kết quả sẽ được hiển thị thông qua phần mềm Njplot hoặc TreeView.
4 Thực tập và báo cáo kết quả theo các file đính kèm và file 10 chủng đã làm ở Bài 1? a Tìm kiếm trình tự tương đồng bằng BLAST
Tìm kiếm trình tự tương đồng đối với file C2
- Mở trang cơ sở dữ liệu NCBI, click chuột vào BLAST
- Click chuột vào nucleotide blast
- Chèn tệp chứa trình tự cần blast BLAST
- Kết quả các trình tự tương đồng với trình tự file C2 là: E.coli
Trình tự tương đồng file C3
- Kết quả các trình tự tương đồng: E.coli
Trình tự tương đồng với file C4: Stenotrophomonas maltophilia
Trình tự tương đồng với file C5: E.coli b Sử dụng phần mềm ClustalX để dựng cây phân loại
• Xây dựng cây phân loại cho file 10 chủng đã làm ở bài 1
- Mở phần mềm Clustal: Fileappend dequenceschọn 1 trình tự cần xây dựng cây phân loại Thực hiện như vậy cho đến khi hết 10 trình tự
-Click chuột vào Treesdraw treeok
- Click chuột vào Alignmentdo complete alignment
- Kết quả cây phân loại
• Xây dựng cây phân loại cho các loài tương đồng của file C2 ( E.coli) c Hiển thị kết quả bằng phần mềm Njplot hoặc TreeView
• Hiển thị cây phân loại cho file 10 chủng đã làm ở “bài 1” bằng phần mềm TreeView
• Hiển thị cây phân loại cho các loài tương đồng của file C2 ( E.coli)
Hiển thị cấu trúc protein
1 Yêu cầu: - Nắm được các phần mềm hiển thị cấu trúc không gian của phân tử protein
Phân tích được kết quả thu được các mô hình cấu trúc
2 Nội dung thực hành: a Sử dụng phần mềm Cn3D? b Sử dụng phần mềm RASMOL?
3 Thực tập và báo cáo kết quả?
10 trình tự và 10 cấu trúc protein được tải từ PDB a Sử dụng phần mềm Cn3D hiển thị cấu trúc protein
Mở phần mềm Cn3D sau đó click chuột vào menu Fileopenchọn tệp để mở b Sử dụng phần mềm RASMOL?
Mở phần mềm RASMOL sau đó click chuột vào menu Fileopenchọn tệp để mở
Tách dòng gen mã hóa cho amylase
Đề bài: anh chị hãy tách dòng gen mã hóa cho amylase
- Tìm gen quy định cho amylase và 1 plasmid bất kỳ trên NCBI
- Thiết kế bản đồ enzyme cắt giới hạn cho gen và plasmid đó
Sử dụng một enzyme cắt giới hạn để tách đoạn gen và mở vòng plasmid, sau đó nối đoạn gen vào trình tự của plasmid Tiến hành biến nạp gen quy định cho amylase và một plasmid bất kỳ từ NCBI.
• Tìm gen quy định cho amylase trên NCBI
- Mở trang cơ sở dữ liệu NCBI, chọn trường tìm kiếm nucleotide và gõ amylase vào ô tìm kiếmclick vào search
- Chọn 1 kết quả amylase bất kỳ rồi tải trình tự dưới dạng FASTA
• Tìm 1 plasmid bất kỳ trên NCBI
- Mở trang cơ sở dữ liệu NCBI, chọn trường tìm kiếm nucleotide và gõ plasmid vào ô tìm kiếmclick vào search
- Chọn 1 plasmid bất kỳ sau đó tải dưới dạng FASTA b Thiết kế bản đồ enzyme cắt giới hạn cho gen và plasmid đó ( phần mềm DNAClub)
• Thiết kế bản đồ enzyme cắt giới hạn cho gen
- Mở phần mềm DNAClub sau đó copy trình tự gen vào, xóa khoảng trống
- Click chuột vào RestrictionMapDrawMapMap All Siteskết quả của bản đồ RE
• Thiết kế bản đồ enzyme cắt giới hạn cho plasmid
Tương tự như lập bản đồ enzyme cắt giới hạn cho gen