Bạch cầu vốn đảm nhiệm nhiệm vụ bảo vệ cơ thể nên khi tăng số lượng một cách đột biến như vậy, nó sẽ bị thiếu thức ăn cũng như nguồn cấp dinh dưỡng, vì thế bạch cầu sau đó thường ăn chín
Trang 1BÁO CÁO THÍ NGHIỆM TIN SINH: THIẾT KẾ MỒI MỘT ĐOẠN GEN
CHƯA BIẾT
Nhóm sinh viên thực hiện: MSSV Cao Hoàng Minh Hiếu 20174683
Trang 2I TỔNG QUAN ĐỀ TÀI
- Tính trạng quan tâm : ung thư máu
- Lý do chọn tính trạng : Nhóm em cảm thấy hứng thú khi tìm hiểu về căn bệnh này bởi đây là căn bệnh ung thư duy nhất mà không tạo ra khối u Ung thư máu hay còn gọi là bệnh máu trắng, đây là loại ung thư ác tính, xuất hiện khi cơ thể bắt đầu có hiện tượng bạch cầu gia tăng đột biến Bạch cầu vốn đảm nhiệm nhiệm
vụ bảo vệ cơ thể nên khi tăng số lượng một cách đột biến như vậy, nó sẽ bị thiếu thức ăn cũng như nguồn cấp dinh dưỡng, vì thế bạch cầu sau đó thường ăn chính hồng cầu - thành phần quan trọng của máu
- Gene quyết định tính trạng : FLT3
- Quá trình tìm hiểu về gene quy định tính trạng: vào www.google.com.vn, tra tính trạng ung thư máu ở người thì tìm ra gene quy định là FLT3
II QUÁ TRÌNH TÌM VÙNG BẢO THỦ CỦA GENE
- Vào trang https://www.ncbi.nlm.nih.gov/, gõ tìm gene “FLT3” ở trong mục Nucleotide, tìm được ở người chứa vùng gene
- Trình tự nucleotide ở FASTA của 3 dữ liệu lần lượt là:
>MT001898.1 Homo sapiens isolate AML_33F/40F/47F FLT3 (FLT3) gene, partial cds
CAATTTAGGTATGAAAGCCAGCTACAGATGGTACAGGTGACCGGCTCCTCAGAATAATGAGTACTTCTAC GTTGATTTCAGAGAATATGAATATGATCTCAAATGGGAGTTTCCAAGAGAAAATTTAGAGTTTG
>MT001897.1 Homo sapiens isolate AML_34F FLT3 (FLT3) gene, partial cds CAATTTAGGTATGAAAGCCAGCTACAGATGGACAGGTGACCGGCTCCTCAGATAATGAGTACTTCTACGT TGATTTCAGAGAATATGAATATGATCTCAAATGGGAGTTTCCAAGAGAAAATTTAGAGTTTGGTAAGAAT GGAATGTGCCAAATGTTTCTGCAGCATTTCTTTTCCATTGGAAAATCTTTAAAATGCACGTACTCACCAT TTGTCTTTGCAGGGAAGGTACTAGGATCAGGTGCTTTTGGAAAAGTGATGAACGCAACAGCTTATGGAAT TAGCAAAACAGGAGTCTCAATCCAGGTTGCCGTCAAAATGCTGAAAG
>MT001896.1 Homo sapiens isolate AML_21F FLT3 (FLT3) gene, partial cds CAATTTAGGTATGAAAGCCAGCTACAGATGGTACAGGTGGACCGGCTCCTCAGATAATGAGTACTTCTAC GTTGATTTCAGAGAATATGAATATGATCTCAAATGGGAGTTTCCAAGAGAAAATTTAGAGTTTGGTAAGA ATGGAATGTGCCAAATGTTTCTGCAGCATTTCTTTTCCATTGGAAAATCTTTAAAATGCACGTACTCACC ATTTGTCTTTGCAGGGAAGGTACTAGGATCAGGTGCTTTTGGAAAAGTGATGAACGCAACAGCTTATGGA ATTAGCAAAACAGGAGTCTCAATCCAGGTTGCCGTCAAAATGCTGAAAG
- Vào trang http://multalin.toulouse.inra.fr/multalin/cgi-bin/multalin.pl, copy 3 vùng gene mà mình đã chọn vào và để chương trình chạy, tìm ra được các Nu tương đồng giữa 3 vùng gene, sau đó chọn vùng bảo thủ là vùng có khoảng 18 – 24 bp hoặc dài hơn:
“TAATG AGTACTTCTA CGTTGATTTC AGAGAATATG AATATGATCT
CAAATGGGAG TTTCCAAGAG AAAATTTAGA”
Trang 3III YÊU CẦU ĐỐI VỚI CẶP MỒI DÙNG TRONG PHẢN ỨNG PCR
- Vào trang: http://multalin.toulouse.inra.fr/multalin/cgi-bin/multalin.pl copy 3 gen và để chương trình chạy , copy tất cả phần consensus cho vào link
https://www.ncbi.nlm.nih.gov/tools/primer-blast/ điền vào
Forward primer from 56 to 135
Reverse primer from 192 to 327
PCR produce size min 70 max 1000
Primer melting temperatures ( TM ) min 57,0 opt 60,0 max 63,0 max Tm difference 3
Cho chạy chương trình và tìm được đoạn mồi đáp ứng đủ yêu cầu sau:
Độ dài từ 18 – 24 bp
Nhiệt độ bắt mồi của 2 mồi là 4oC (thỏa mãn không chênh lệch quá 5oC)
Tỉ lệ GC 40 -60 %
5 nu cuối đầu 3’ có 2 GC Primer pair 1
Sequence (5'->3') Template
strand Length Start Stop Tm GC%
Self complementarity
Self 3' complementarity Forward
primer TCTCAAATGGGAGTTTCCAAGAGA Plus 24 95 118 59.65 41.67 4.00 2.00
Reverse
primer CCCTGCAAAGACAAATGGTGA Minus 19 224 204 59.04 47.62 4.00 1.00
Product
length 130
Primer pair 2
Sequence (5'->3') Template
strand Length Start Stop Tm GC%
Self complementarity
Self 3' complementarity Forward
primer TCTCAAATGGGAGTTTCCAAGAGA Plus 24 95 118 59.65 41.67 4.00 2.00
Reverse
primer TCCCTGCAAAGACAAATGGTG Minus 21 225 205 59.04 47.62 4.00 1.00
Product
length 131
Trang 4Primer pair 3
Sequence (5'->3') Template
strand Length Start Stop Tm GC%
Self complementarity
Self 3' complementarity Forward
primer TCTCAAATGGGAGTTTCCAAGAGA Plus 24 95 118 59.65 41.67 4.00 2.00
Reverse
primer CCTTCCCTGCAAAGACAAATGG Minus 22 228 207 60.03 50 4.00 1.00
Product
length 134
Primer pair 4
Sequence (5'->3') Template
strand Length Start Stop Tm GC%
Self complementarity
Self 3' complementarity Forward
primer TCTCAAATGGGAGTTTCCAAGAGA Plus 24 95 118 59.65 41.67 4.00 2.00
Reverse
primer CCCTGCAAAGACAAATGGTGAG Minus 22 224 203 60.03 50.00 4.00 0.00
Product
length 130
Primer pair 5
Sequence (5'->3') Template
strand Length Start Stop Tm GC%
Self complementarity
Self 3' complementarity Forward
primer CTCAAATGGGAGTTTCCAAGAGA Plus 23 96 118 58.34 43.48 4.00 2.00
Reverse
primer CCCTGCAAAGACAAATGGTGA Minus 21 224 204 59.04 47.62 4.00 1.00
Product
length 129
Trang 5Primer pair 6
Sequence (5'->3') Template
strand Length Start Stop Tm GC%
Self complementarity
Self 3' complementarity Forward
primer CTCAAATGGGAGTTTCCAAGAGA Plus 23 96 118 58.34 43.48 4.00 2.00
Reverse
primer TCCCTGCAAAGACAAATGGTG Minus 21 225 205 59.04 47.62 4.00 1.00
Product
length 130
Primer pair 7
Sequence (5'->3') Template
strand Length Start Stop Tm GC%
Self complementarity
Self 3' complementarity Forward
primer TCTCAAATGGGAGTTTCCAAGAG Plus 23 95 117 58.34 43.48 4.00 0.00
Reverse
primer CCCTGCAAAGACAAATGGTGA Minus 21 224 204 59.04 47.62 4.00 1.00
Product
length 130
Primer pair 8
Sequence (5'->3') Template
strand Length Start Stop Tm GC%
Self complementarity
Self 3' complementarity Forward
primer TCTCAAATGGGAGTTTCCAAGAG Plus 23 95 117 58.34 43.48 4.00 0.00
Reverse
primer TCCCTGCAAAGACAAATGGTG Minus 21 225 205 59.04 47.62 4.00 1.00
Product
length 131
Trang 6Primer pair 9
Sequence (5'->3') Template
strand Length Start Stop Tm GC%
Self complementarity
Self 3' complementarity Forward
primer CTCAAATGGGAGTTTCCAAGAGA Plus 23 96 118 58.34 43.48 4.00 2.00
Reverse
primer CCTTCCCTGCAAAGACAAATGG Minus 22 228 207 60.03 50.00 4.00 1.00
Product
length 133
Primer pair 10
Sequence (5'->3') Template
strand Length Start Stop Tm GC%
Self complementarity
Self 3' complementarity Forward
primer TCTCAAATGGGAGTTTCCAAGAG Plus 23 95 117 58.34 43.48 4.00 0.00
Reverse
primer CCTTCCCTGCAAAGACAAATGG Minus 22 228 207 60.03 50.00 4.00 1.00
Product
length 134
Trang 7Chọn đoạn mồi số 1, vào trang
https://www.bioinformatics.org/sms2/pcr_products.html để tiến hành chạy PCR:
Kết quả chạy PCR:
>130 bp product from linear template MT001897.1 Homo sapiens isolate
AML_34F FLT3 (FLT3) gene, partial cds, base 95 to base 224 (T7 - T3)
TCTCAAATGGGAGTTTCCAAGAGAAAATTTAGAGTTTGGTAAGAATGGAATGTGCCAAAT
GTTTCTGCAGCATTTCTTTTCCATTGGAAAATCTTTAAAATGCACGTACTCACCATTTGT
CTTTGCAGGG
Trang 8IV THÔNG TIN VỀ PROTEIN
1 Trình tự protein mà gene được tách dòng mã hóa
Vào trang expasy.org, tìm https://web.expasy.org/translate/, copy phần chạy PCR test
và cho chạy chương trình, ta được:
5'3' Frame 1
SQMGVSKRKFRVW-EWNVPNVSAAFLFHWKIFKMHVLTICLCR
5'3' Frame 2
LKWEFPRENLEFGKNGMCQMFLQHFFSIGKSLKCTYSPFVFAG
5'3' Frame 3
SNGSFQEKI-SLVRMECAKCFCSISFPLENL-NARTHHLSLQ
3'5' Frame 1
PCKDKW-VRAF-RFSNGKEMLQKHLAHSILTKL-IFSWKLPFE
3'5' Frame 2
PAKTNGEYVHFKDFPMEKKCCRNIWHIPFLPNSKFSLGNSHLR
3'5' Frame 3
LQRQMVSTCILKIFQWKRNAAETFGTFHSYQTLNFLLETPI-
2 Khối lượng phân tử, điểm đẳng điện
Mở https://web.expasy.org/, vào phần proteomics, rồi vào phần Compute pI/MW ,
copy phần
5'3' Frame 1
SQMGVSKRKFRVW-EWNVPNVSAAFLFHWKIFKMHVLTICLCR
Trang 9Vào và cho chạy chương trình, ta ra kết quả:
- Điểm đẳng điện: 10.45
- Khối lượng phân tử: 5729.90
3 Vị trí của protein trong tế bào
- Vào trang https://blast.ncbi.nlm.nih.gov/Blast.cgi Chọn “ Nucleotide BLAST”
Copy kết quả PCR test cho chạy chương trình:
Trang 10Ra được kết quả:
Ta thấy có 3 loài có mức độ tương đồng 100% với FLT3, ta chọn MT001896.1, click vào, chọn FASTA, ta có trình tự protein:
Homo sapiens isolate AML_21F FLT3 (FLT3) gene, partial cds
GenBank: MT001896.1
GenPeptIdentical ProteinsGraphics
>MT001896.1 Homo sapiens isolate AML_21F FLT3 (FLT3) gene, partial cds CAATTTAGGTATGAAAGCCAGCTACAGATGGTACAGGTGGACCGGCTCCTCAGATAATGAGTACTTCTAC GTTGATTTCAGAGAATATGAATATGATCTCAAATGGGAGTTTCCAAGAGAAAATTTAGAGTTTGGTAAGA ATGGAATGTGCCAAATGTTTCTGCAGCATTTCTTTTCCATTGGAAAATCTTTAAAATGCACGTACTCACC ATTTGTCTTTGCAGGGAAGGTACTAGGATCAGGTGCTTTTGGAAAAGTGATGAACGCAACAGCTTATGGA ATTAGCAAAACAGGAGTCTCAATCCAGGTTGCCGTCAAAATGCTGAAAG
Trang 11- Vào http://phobius.sbc.su.se/, copy trình protein ở trên vào và chạy chương trình, ta được kết quả:
Nhận xét:
- Từ ảnh, ta thấy đường màu xanh dương biểu diễn nằm ngoài tế bào chất, đường xanh
lá câu biểu diễn nằm trong tế bào chất, đường màu xám biểu diễn xuyên màng
- Ta thấy, tỉ lệ aa nằm ngoài tế bào chất chiếm khoảng 87%, trong khi tỉ lệ aa nằm trong tế bào chất khoảng 17%, còn tỉ lệ aa xuyên màng hầu như k có
=> Có thể kết luận protein đang xét nằm ngoài Tế bào chất
4 Dự đoán chức năng protein
- Vào https://www.expasy.org/, chọn proteomics, chọn protein modifications, chọn UniProtKB/Swiss-Prot, vào BLAST, copy trình tự protein
>MT001896.1 Homo sapiens isolate AML_21F FLT3 (FLT3) gene, partial cds CAATTTAGGTATGAAAGCCAGCTACAGATGGTACAGGTGGACCGGCTCCTCAGATAATGAGTACTTCTAC GTTGATTTCAGAGAATATGAATATGATCTCAAATGGGAGTTTCCAAGAGAAAATTTAGAGTTTGGTAAGA ATGGAATGTGCCAAATGTTTCTGCAGCATTTCTTTTCCATTGGAAAATCTTTAAAATGCACGTACTCACC ATTTGTCTTTGCAGGGAAGGTACTAGGATCAGGTGCTTTTGGAAAAGTGATGAACGCAACAGCTTATGGA ATTAGCAAAACAGGAGTCTCAATCCAGGTTGCCGTCAAAATGCTGAAAG
Trang 12- Vào và chạy chương trình, cho ra kết quả:
- Ta chọn protein có tỉ lệ cao nhất là 95.8% và thu được phần dự đoán chức năng:
- Vào trang
https://blast.ncbi.nlm.nih.gov/Blast.cgi?PROGRAM=blastx&PAST_TYPE=Ba
stSearch&BLAST_SPEC=&LINK_LOC=blasttad&LAST_PAGE=tblastn copy
đoạn protein vào mục: “ Enter accession number(s), gi(s), or FASTA
sequence(s)”
Trang 13- Chọn dạng Database là Protein Data Bank protein(pdb) => ấn BLAST
- Kết quả:
Chọn kết quả có sự tương đồng cao nhất => Ấn vào đường link ở mục Accession
Trang 14 Vào mục Protein 3D Structure Hoặc vào trang:
https://www.ncbi.nlm.nih.gov/ => chọn hộp thư Structure => Copy mã
1RJB vào và chạy
- Kết quả:
Ấn Dowload về máy => Sử dụng phần mềm Cn3D 4.3.1 => mở file vừa tải về để xem cấu trúc 3D của nó
Trang 15 Vào mục Style => Coloring Shortcuts: Chọn màu để thể hiện các cấu trúc 3D
Ngoài ra, các vùng khác sẽ được xác định ở trang cấu trúc 3D khi
download cấu trúc về
Trang 16 Hoặc ấn vào full-featured 3D viewer
Sử dụng các công cụ như trong phần mềm Cn3D:
Trang 17- Xác định các tính trạng, cấu trúc
Chuỗi α và β: Style => Coloring Shortcuts => Secondary Structure
Vùng: Style => Coloring Shortcuts => Domain
Trang 18 Vùng kỵ nước: Style => Coloring Shortcuts => Hydrophobicity
Các phân tử: Style => Coloring Shortcuts => Molecule
Trang 19 Vùng bảo thủ: Style => Coloring Shortcuts => Sequence Conservation
Nhiệt độ: Style => Coloring Shortcuts => Temperature
Trang 20VI NHẬN XÉT
- Sản phẩm sau khi thu được có khả năng sẽ biểu hiện được tính trang do ta thấy
có khá nhiều gene có độ tương đồng từ 90 – 100%
- Kết quả ta thu được cũng chỉ mang tính chất tham khảo nên nếu muốn có được kết quả chính xác nhất ta cần nghiên cứu kết hợp với thực tế để thu được mẫu rồi thử xem có thể biểu hiện được tính trạng mà chúng ta cần hay không