Xử lý vector pGEX6p1 và pET21a(+) bằng enzyme hạn chế

Một phần của tài liệu Lựa chọn thuộc tính trong khai phá dữ liệu (Trang 35)

Sau khi nghiên cứu tài liệu và điều kiện vật chất phòng thí nghiệm, chúng tôi đã tiến hành biểu hiện protein h-tPA trên vi khuẩn E. coli chủng BL21 với hai vector biểu hiện là pET21a(+) và pGEX6p1 mang cDNA mã hóa h-tPA. Vector pET21a(+) là vector mạnh để tạo dòng và biểu hiện protein tái tổ hợp trong E. coli. Gen đích được tạo dòng trong plasmid pET21a(+) được điều khiển bởi tín hiệu dịch mã tốt của phage T7, biểu hiện dưới sự tổng hợp của T7 RNA polymerase trong tế bào chủ. Vector pET21a(+) là vector mang trình tự T7 ở đầu N và trình tự đuôi His ở đầu C. Vector này mang chỉ thị chọn lọc là gen kháng kháng sinh (kháng Amp và Kanamycin). Vùng tạo dòng/ biểu hiện được điều khiển bởi T7 polymerase. Trình tự này được xác định, giải trình tự khi sử dụng mồi đầu T7. Hệ thống biểu hiện này được cảm ứng bởi IPTG hoặc lactose trong quá trình nuôi cấy.

Vector pGEX6p1 điều khiển tổng hợp protein ngoại lại bởi promoter tac, promoter này được cảm ứng bởi isopropyl b-D thiogalactoside (IPTG). Vector pGEX6p1 được thiết kết gồm có một gen lacIq, sản phẩm gen lacIq là protein ức chế kết hợp với vùng operator trên promoter tac, làm ngăn cản quá trình biểu hiện cho tới khi cảm ứng bởi IPTG, qua đó điều khiển quá trình biểu hiện của gen được thêm vào. Đầu 3’ vùng đa nối có chứa đoạn gen mã hoá Glutathione S- Transferase - GST, đây là một protein giúp quá trình tinh sạch protein tái tổ hợp dễ hơn. Ngoài ra, vector pGEX6p1 có một số ưu điểm như: mức độ biểu hiện cao, điều kiện tinh sạch protein đơn giản, ảnh hưởng của kháng nguyên và chức năng của protein là nhỏ nhất.

Quá trình cắt mở vòng hai vector cũng sử dụng hai cặp enzyme là NdeI/XhoI và

BamHI/XhoI tương tự như đối với sản phẩm PCR. Thành phần và quá trình xử lý đối với

vector pET21a(+) và pGEX6p1 được trình bày ở phần 2.2.4. Sau khi cắt với enzyme, vector được xử lý với phosphatase để loại nhóm phosphate ra khỏi đầu 5’, làm giảm quá trình tự nối của vector. Phản ứng được kiểm tra bằng điện di trên gel agarose 0,8%.

Hình 3.2. Kết quả xử lý cDNA mã hóa h-tPA và các vector biểu hiện bằng enzyme hạn chế

Kết quả điện di trên hình 3.2 cho thấy sản phẩm cắt tương đối sạch và đủ điều kiện tiến hành phản ứng ghép nối.

3.1.2.3. Ghép nối cDNA mã hoá h-tPA vào vector pGEX6p1 và pET21a(+)

Chúng tôi đã tiến hành ghép nối cDNA mã hóa h-tPA với các vector pET21a(+) và pGEX6p1 tạo các vector tái tổ hợp mang gen mã hoá h-tPA. Do cả sản phẩm PCR và vector đều đã được xử lý bằng hai enzyme tương ứng nên dưới tác dụng của enzyme T4 ligase, sản phẩm PCR và vector có thể nối lại với nhau tạo vector tái tổ hợp. Thành phần và phản ứng ghép nối giữa vector và sản phẩm PCR đã trình bày ở phần 2.2.5. Phản ứng ghép nối được tiến hành ở 16oC, qua đêm.

3.1.3. Chọn dòng pGEX6p1 và pET21a(+) chứa cDNA mã hoá h-tPA 3.1.3.1. Biến nạp sản phẩm lai vào tế bào E. coli bằng phƣơng pháp

sốc nhiệt

Sản phẩm lai giữa vector và sản phẩm PCR được biến nạp vào tế bào E. coli chủng DH5α bằng phương pháp sốc nhiệt trong 70 giây ở 42oC. Các tế bào này sau đó được nuôi cấy trên môi trường LB đặc có bổ sung Amp (50g/ ml) ở 37°C qua

M: Marker 1kb

1: Vector pGEX6p1/BamHI+XhoI 2: Vector pET21a(+)/NdeI+XhoI 3: cDNA h-tPA/NdeI+XhoI 4: cDNA h-tPA/BamHI+XhoI

Formatted: Font: 13 pt, Do not check spelling

đêm. Kết quả, chúng tôi đã thu được rất nhiều khuẩn lạc, là các dòng tế bào vi khuẩn khác nhau. Do trong môi trường có chất kháng sinh nên chỉ có những khuẩn lạc nào mang vector mới mọc được, các dòng tế bào vi khuẩn này gồm 2 loại tế bào khác nhau: tế bào mang vector nhưng không mang đoạn chèn và tế bào mang vector và đoạn chèn. Vì vậy để xác định dòng tế bào nào mang vector tái tổ hợp, chúng tôi đã tiến hành sàng lọc thông qua tách chiết plasmid, xử lý bằng enzyme hạn chế, PCR và xác định trình tự.

3.1.3.2. Chọn dòng pGEX6p1 và pET21a(+) chứa cDNA mã hoá h-tPA

Tách chiết DNA plasmid

Plasmid được tách chiết nhằm xác định vector nào mang đoạn chèn và vector nào không mang đoạn chèn. Phương pháp tách plasmid được trình bày ở mục 2.2.7.

Để tách chiết DNA plasmid, một số khuẩn lạc được nuôi cấy trong môi trường LB lỏng có bổ sung Amp ở 37oC từ 12- 14h. Phương pháp tách chiết plasmid gồm 3 bước chính: thu nhận và phân giải tế bào, làm sạch plasmid và kết tủa DNA. Dung dịch I (sol I) có tác dụng rửa sạch tế bào, dung dịch II (sol II) có chứa SDS và NaOH có tác dụng phá màng tế bào và ức chế hoạt động của nuclease, không cho chúng phân giải DNA do Mg2+ (một nhân tố cần thiết cho hoạt động của các nuclease) bị liên kết với EDTA, khi cho tiếp dung dịch III (sol III) có chứa axetate và axetic acid thì pH môi trường chuyển thành acid yếu gần với điểm đẳng điện của DNA, vì vậy, DNA plasmid dễ bị kết tủa bằng cồn và dễ dàng tách được nhờ ly tâm. Do trong tế bào vi khuẩn có chứa hai dạng DNA là DNA nhiễm sắc thể và DNA plasmid nên việc tách và tinh sạch DNA plasmid là rất quan trọng, DNA plasmid được tách riêng dựa trên sự khống chế thời gian xử lý các dụng dịch I, II, III. Do DNA nhiễm sắc thể có kích thước phân tử lớn và liên kết chặt chẽ với protein nên khoảng thời gian ngắn giữa các lần thêm dung dịch không kịp thoát ra ngoài.

DNA plasmid thu được sau khi tách chiết từ tế bào vi khuẩn thường tồn tại ở 3 dạng: dạng siêu xoắn được tạo ra do liên kết hydro giữa một số phần của phân tử DNA plasmid hay do lực hút tĩnh điện giữa các phần của phân tử với nhau, dạng vòng mở do bị đứt gãy một mạch đơn của chuỗi DNA mạch kép và dạng mạch

thẳng khi cả hai mạch DNA dều bị đứt gãy. Dạng siêu xoắn có cấu trúc không gian gọn nên khi điện di chúng thường chạy nhanh nhất, tiếp đến là mạch thẳng và cuối cùng là mạch vòng. DNA sau đó được hoà tan trong dung dịch RNase 0,01mg/ml nhằm loại bỏ RNA và được điện di kiểm tra trên gel agarose 0,8%.

Theo lý thuyết khi một DNA plasmid mang gen ngoại lai, chúng sẽ có kích thước bằng tổng kích thước của plasmid và kích thước của gen ngoại lai. Do vậy trong điện di đồ, chúng sẽ chạy chậm hơn (thấp hơn) so với đối chứng âm (các plasmid chưa mở vòng), dựa vào đó chúng ta có thể kết luận sơ bộ được những plasmid này có kích thước lớn hơn và có thể chúng mang gen ngoại lai.

Hình 3.3. Chọn dòng pGEX6p1 mang cDNA mã hóa h-tPA (pGEX6p1/h-tPA)

Formatted: Font: 13 pt, Do not check spelling

ĐC: Đối chứng âm

1- 7: DNA plasmid của các dòng pGEX6p1

Kết quả điện di cho thấy ở tất cả các đường chạy đều xuất hiện 2 băng chạy trước rõ nét hơn, điều đó chứng tỏ lượng DNA plasmid của chúng tôi thu được tồn tại ở dạng siêu xoắn nhiều hơn dạng thẳng. Hình 3.3 cho thấy, đối với các dòng mang vector pGEX6p1, dòng 1 và 3 (ký hiệu pGEX/htPA p1 và pGEX/htPA p3) là hai dòng có kích thước lớn hơn các dòng khác và lớn hơn so với đối chứng âm; do vậy rất có thể các dòng này mang cDNA mã hóa h-tPA.

Đối với các dòng mang vector pET21a(+), các dòng 1,2,3 có thể mang cDNA mã hóa h-tPA (ký hiệu: pET/htPA p1, pET/htPA p2, pET/htPA p3).

Hình 3.4. Chọn dòng pET21a(+) mang cDNA mã hóa h-tPA (pET21a(+)/h-tPA)

ĐC: Đối chứng âm (vector pET21a(+) không mang h-tPA) 1- 5: DNA plasmid của các dòng pET21a(+)

Tương tự, đối với các dòng mang vector pET21a(+), các dòng 1,2,3 có kích thước lớn hơn các dòng khác và đối chứng âm; do vậy rất có thể các dòng này mang cDNA mã hóa h-tPA (ký hiệu: pET/htPA p1, pET/htPA p2, pET/htPA p3).

Formatted: Font: 13 pt, Do not check spelling

or grammar

Để chứng minh chính xác xem đoạn xen vào plasmid có phải là đoạn gen mã hoá h- tPA hay không, chúng tôi đã tiếp tục kiểm tra bằng enzyme hạn chế, tiến hành PCR và giải trình tự.

Kiểm tra vector tái tổ hợp mang cDNA mã hóa h-tPA bằng xử lý enzyme hạn chế

Hai cặp enzyme NdeI/XhoI và BamHI/XhoI đã được sử dụng để tạo đầu bổ

sung cho vector và đoạn chèn nên để kiểm tra, chúng tôi cũng sử dụng hai cặp enzyme này nhằm kiểm tra các dòng được chọn có mang đoạn chèn hay không. Theo tính toán lý thuyết, sản phẩm xử lý enzyme của plasmid tái tổ hợp bao gồm hai đoạn gen, một đoạn có kích thước tương ứng với vector gốc (vector mở vòng) và một đoạn có kích thước tương ứng với đoạn chèn (cDNA mã hóa h-tPA). Thành phần và quy trình phản ứng được tiến hành như trình bày ở mục 2.2.4. Các sản phẩm xử lý enzyme được điện di trên gel agarose 0,8%.

Hình 3.5. Kiểm tra các vector tái tổ hợp mang cDNA mã hóa h-tPA bằng enzyme hạn chế

Kết quả trên hình 3.5 cho thấy, sau khi xử lý các vector tái tổ hợp bằng hai cặp enzyme tương ứng, chúng tôi thu được hai băng có kích thước khác nhau; đối

M: Marker 1kb 1: pGEX/htPA p1 2: pGEX/htPA p3

Formatted: Space Before: 0 pt, After: 0 pt

Formatted: Font: 13 pt, Do not check spelling

or grammar

với vector pGEX6p1, chúng tôi thu được một băng có kích thước khoảng 5kb (tương ứng với kích thước của vector pGEX6p1 khi xử lý bằng hai enzyme BamHI/

XhoI) và một băng có kích thước 1,7kb (tương ứng với kích thước cDNA mã hoá h-

tPA). Đối với vector pET21a(+), chúng tôi cũng thu được một băng có kích thước khoảng 5,5kb (tương ứng với kích thước vector pET21a(+)) và một băng có kích thước khoảng 1,7kb (tương ứng với kích thước cDNA mã hoá h-tPA). Như vậy, chúng tôi sơ bộ kết luận là đã chọn được một số dòng plasmid tái tổ hợp mang đoạn gen phù hợp với kích thước của sản phẩm PCR h-tPA.

Kiểm tra vector tái tổ hợp mang cDNA mã hóa h-tPA bằng kỹ thuật PCR

Để khẳng định lại các dòng plasmid tái tổ hợp đã được chọn có mang đúng đoạn gen mã hóa h-tPA, chúng tôi đã tiến hành PCR với việc sử dụng các plasmid được chọn làm khuôn để nhân đoạn h-tPA với các cặp mồi đặc hiệu. DNA mẫu để chạy PCR là pGEX/htPA p3 và pET/htPA p1. Kết quả kiểm tra các vector tái tổ hợp bằng kỹ thuật PCR được trình bày trên hình 3.6.

Hình 3.6. Kiểm tra các vector tái tổ hợp mang cDNA mã hóa h-tPA bằng kỹ thuật PCR

M: Marker 1kb

1: PCR sử dụng khuôn là pET/htPA p1 2: PCR sử dụng khuôn là pGEX/htPA p3

Formatted: Font: 13 pt, Do not check spelling

Kết quả điện di cho thấy, sản phẩm PCR của các dòng mang kiểm tra này đều xuất hiện băng với kích thước khoảng 1,7 kb, đúng với kích thước cDNA mã hóa cho h-tPA. Như vậy, các dòng được chọn làm khuôn trong thí nghiệm PCR đều có mang cDNA mã hóa h-tPA. Các dòng này đã được chúng tôi tinh sạch phục vụ cho xác định trình tự.

3.1.4. Xác định và phân tích trình tự cDNA mã hoá h-tPA

Mặc dù đã được xác định trình tự trong vector tạo dòng pUC18, tuy nhiên, khi nhân lại cDNA này bằng enzyme Taq DNA polymerase có khả năng phát sinh các điểm đột biến. Vì vậy, sau khi chọn được các dòng mang cDNA mã hoá h-tPA, trước khi tiến hành biểu hiện, chúng tôi đã tinh sạch và một lần nữa xác định trình tự cả hai chiều đoạn cDNA bằng hai cặp mồi: cặp mồi T7 đối với vector pET21a(+) và cặp mồi PEXF/PEXR đối với vector pGEX6p1 trên máy xác định trình tự tự động. Trình tự DNA sau đó được xử lý trên các phần mềm: BioEdit, Sequencing analysis 7.0. Sau khi sử lý số liệu, chúng tôi đã thu được đoạn gen có kích thước khoảng 1700bp. Phổ trình tự của các dòng plasmid đều rõ ràng, không có tín hiệu nhiễu. Kết quả phân tích và so sánh với các trình tự đã công bố trên Ngân hàng Gen Quốc tế như sau:

10 20 30 40 50 60

....|....|....|....|....|....|....|....|....|....|....|....| NM_000930 atggatgcaatgaagagagggctctgctgtgtgctgctgctgtgtggagcagtcttcgtt MetAspAlaMetLysArgGlyLeuCysCysValLeuLeuLeuCysGlyAlaValPheVal

pET21a(+) ................................................ MetAspAlaMetLysArgGlyLeuCysCysValLeuLeuLeuCysGlyAlaValPheVal

pGEX6p1 ................................................ MetAspAlaMetLysArgGlyLeuCysCysValLeuLeuLeuCysGlyAlaValPheVal

70 80 90 100 110 120

....|....|....|....|....|....|....|....|....|....|....|....| NM_000930 tcgcccagccaggaaatccatgcccgattcagaagaggagccagatcttaccaagtgatc SerProSerGlnGluIleHisAlaArgPheArgArgGlyAlaArgSerTyrGlnValIle

pET21a(+) ............................. SerProSerGlnGluIleHisAlaArgPheArgArgGlyAlaArgSerTyrGlnValIle

pGEX6p1 ............................. SerProSerGlnGluIleHisAlaArgPheArgArgGlyAlaArgSerTyrGlnValIle

130 140 150 160 170 180

....|....|....|....|....|....|....|....|....|....|....|....| NM_000930 tgcagagatgaaaaaacgcagatgatataccagcaacatcagtcatggctgcgccctgtg CysArgAspGluLysThrGlnMetIleTyrGlnGlnHisGlnSerTrpLeuArgProVal

pET21a(+) .................................... CysArgAspGluLysThrGlnMetIleTyrGlnGlnHisGlnSerTrpLeuArgProVal

pGEX6p1 .................................... CysArgAspGluLysThrGlnMetIleTyrGlnGlnHisGlnSerTrpLeuArgProVal

190 200 210 220 230 240

....|....|....|....|....|....|....|....|....|....|....|....| NM_000930 ctcagaagcaaccgggtggaatattgctggtgcaacagtggcagggcacagtgccactca LeuArgSerAsnArgValGluTyrCysTrpCysAsnSerGlyArgAlaGlnCysHisSer

pET21a(+) .................................. LeuArgSerAsnArgValGluTyrCysTrpCysAsnSerGlyArgAlaGlnCysHisSer

pGEX6p1 .................................. LeuArgSerAsnArgValGluTyrCysTrpCysAsnSerGlyArgAlaGlnCysHisSer

250 260 270 280 290 300

....|....|....|....|....|....|....|....|....|....|....|....| NM_000930 gtgcctgtcaaaagttgcagcgagccaaggtgtttcaacgggggcacctgccagcaggcc ValProValLysSerCysSerGluProArgCysPheAsnGlyGlyThrCysGlnGlnAla

pET21a(+) ............................ ValProValLysSerCysSerGluProArgCysPheAsnGlyGlyThrCysGlnGlnAla

pGEX6p1 ............................ ValProValLysSerCysSerGluProArgCysPheAsnGlyGlyThrCysGlnGlnAla

310 320 330 340 350 360

....|....|....|....|....|....|....|....|....|....|....|....| NM_000930 ctgtacttctcagatttcgtgtgccagtgccccgaaggatttgctgggaagtgctgtgaa LeuTyrPheSerAspPheValCysGlnCysProGluGlyPheAlaGlyLysCysCysGlu

pET21a(+) ............................................... LeuTyrPheSerAspPheValCysGlnCysProGluGlyPheAlaGlyLysCysCysGlu

pGEX6p1 ............................................... LeuTyrPheSerAspPheValCysGlnCysProGluGlyPheAlaGlyLysCysCysGlu

370 380 390 400 410 420

....|....|....|....|....|....|....|....|....|....|....|....| NM_000930 atagataccagggccacgtgctacgaggaccagggcatcagctacaggggcacgtggagc IleAspThrArgAlaThrCysTyrGluAspGlnGlyIleSerTyrArgGlyThrTrpSer

pET21a(+) ............................. IleAspThrArgAlaThrCysTyrGluAspGlnGlyIleSerTyrArgGlyThrTrpSer

pGEX6p1 ............................. IleAspThrArgAlaThrCysTyrGluAspGlnGlyIleSerTyrArgGlyThrTrpSer

430 440 450 460 470 480

....|....|....|....|....|....|....|....|....|....|....|....| NM_000930 acagcggagagtggcgccgagtgcaccaactggaacagcagcgcgttggcccagaagccc ThrAlaGluSerGlyAlaGluCysThrAsnTrpAsnSerSerAlaLeuAlaGlnLysPro

pET21a(+) .................... ThrAlaGluSerGlyAlaGluCysThrAsnTrpAsnSerSerAlaLeuAlaGlnLysPro

pGEX6p1 .................... ThrAlaGluSerGlyAlaGluCysThrAsnTrpAsnSerSerAlaLeuAlaGlnLysPro

490 500 510 520 530 540

....|....|....|....|....|....|....|....|....|....|....|....| NM_000930 tacagcgggcggaggccagacgccatcaggctgggcctggggaaccacaactactgcaga TyrSerGlyArgArgProAspAlaIleArgLeuGlyLeuGlyAsnHisAsnTyrCysArg

pET21a(+) ....T....................... TyrSerGlyArgArgProAspAlaIleArgLeuGlyLeuGlyAsnHisAsnTyrCysArg

pGEX6p1 ....T....................... TyrSerGlyArgArgProAspAlaIleArgLeuGlyLeuGlyAsnHisAsnTyrCysArg

550 560 570 580 590 600 ....|....|....|....|....|....|....|....|....|....|....|....| NM_000930 aacccagatcgagactcaaagccctggtgctacgtctttaaggcggggaagtacagctca AsnProAspArgAspSerLysProTrpCysTyrValPheLysAlaGlyLysTyrSerSer

pET21a(+) .................................... AsnProAspArgAspSerLysProTrpCysTyrValPheLysAlaGlyLysTyrSerSer

pGEX6p1 .................................... AsnProAspArgAspSerLysProTrpCysTyrValPheLysAlaGlyLysTyrSerSer

610 620 630 640 650 660

....|....|....|....|....|....|....|....|....|....|....|....| NM_000930 gagttctgcagcacccctgcctgctctgagggaaacagtgactgctactttgggaatggg GluPheCysSerThrProAlaCysSerGluGlyAsnSerAspCysTyrPheGlyAsnGly

pET21a(+) ........................................... GluPheCysSerThrProAlaCysSerGluGlyAsnSerAspCysTyrPheGlyAsnGly

pGEX6p1 ........................................... GluPheCysSerThrProAlaCysSerGluGlyAsnSerAspCysTyrPheGlyAsnGly

670 680 690 700 710 720

....|....|....|....|....|....|....|....|....|....|....|....| NM_000930 tcagcctaccgtggcacgcacagcctcaccgagtcgggtgcctcctgcctcccgtggaat SerAlaTyrArgGlyThrHisSerLeuThrGluSerGlyAlaSerCysLeuProTrpAsn

pET21a(+) ............................................ SerAlaTyrArgGlyThrHisSerLeuThrGluSerGlyAlaSerCysLeuProTrpAsn

pGEX6p1 ............................................ SerAlaTyrArgGlyThrHisSerLeuThrGluSerGlyAlaSerCysLeuProTrpAsn

730 740 750 760 770 780

....|....|....|....|....|....|....|....|....|....|....|....| NM_000930 tccatgatcctgataggcaaggtttacacagcacagaaccccagtgcccaggcactgggc SerMetIleLeuIleGlyLysValTyrThrAlaGlnAsnProSerAlaGlnAlaLeuGly

pET21a(+) ................................ SerMetIleLeuIleGlyLysValTyrThrAlaGlnAsnProSerAlaGlnAlaLeuGly

pGEX6p1 ................................ SerMetIleLeuIleGlyLysValTyrThrAlaGlnAsnProSerAlaGlnAlaLeuGly

790 800 810 820 830 840

....|....|....|....|....|....|....|....|....|....|....|....| NM_000930 ctgggcaaacataattactgccggaatcctgatggggatgccaagccctggtgccacgtg LeuGlyLysHisAsnTyrCysArgAsnProAspGlyAspAlaLysProTrpCysHisVal

pET21a(+) ....................................... LeuGlyLysHisAsnTyrCysArgAsnProAspGlyAspAlaLysProTrpCysHisVal

pGEX6p1 ....................................... LeuGlyLysHisAsnTyrCysArgAsnProAspGlyAspAlaLysProTrpCysHisVal

850 860 870 880 890 900

....|....|....|....|....|....|....|....|....|....|....|....| NM_000930 ctgaagaaccgcaggctgacgtgggagtactgtgatgtgccctcctgctccacctgcggc LeuLysAsnArgArgLeuThrTrpGluTyrCysAspValProSerCysSerThrCysGly

pET21a(+) ........................................... LeuLysAsnArgArgLeuThrTrpGluTyrCysAspValProSerCysSerThrCysGly

pGEX6p1 ........................................... LeuLysAsnArgArgLeuThrTrpGluTyrCysAspValProSerCysSerThrCysGly

910 920 930 940 950 960 ....|....|....|....|....|....|....|....|....|....|....|....| NM_000930 ctgagacagtacagccagcctcagtttcgcatcaaaggagggctcttcgccgacatcgcc LeuArgGlnTyrSerGlnProGlnPheArgIleLysGlyGlyLeuPheAlaAspIleAla

pET21a(+) .................................... LeuArgGlnTyrSerGlnProGlnPheArgIleLysGlyGlyLeuPheAlaAspIleAla

pGEX6p1 .................................... LeuArgGlnTyrSerGlnProGlnPheArgIleLysGlyGlyLeuPheAlaAspIleAla

970 980 990 1000 1010 1020

....|....|....|....|....|....|....|....|....|....|....|....| NM_000930 tcccacccctggcaggctgccatctttgccaagcacaggaggtcgcccggagagcggttc SerHisProTrpGlnAlaAlaIlePheAlaLysHisArgArgSerProGlyGluArgPhe

pET21a(+) ............................ SerHisProTrpGlnAlaAlaIlePheAlaLysHisArgArgSerProGlyGluArgPhe

pGEX6p1 ............................ SerHisProTrpGlnAlaAlaIlePheAlaLysHisArgArgSerProGlyGluArgPhe

1030 1040 1050 1060 1070 1080

....|....|....|....|....|....|....|....|....|....|....|....| NM_000930 ctgtgcgggggcatactcatcagctcctgctggattctctctgccgcccactgcttccag LeuCysGlyGlyIleLeuIleSerSerCysTrpIleLeuSerAlaAlaHisCysPheGln

pET21a(+) ................................................ LeuCysGlyGlyIleLeuIleSerSerCysTrpIleLeuSerAlaAlaHisCysPheGln

pGEX6p1 ................................................ LeuCysGlyGlyIleLeuIleSerSerCysTrpIleLeuSerAlaAlaHisCysPheGln

1090 1100 1110 1120 1130 1140

....|....|....|....|....|....|....|....|....|....|....|....| NM_000930 gagaggtttccgccccaccacctgacggtgatcttgggcagaacataccgggtggtccct

GluArgPheProProHisHisLeuThrValIleLeuGlyArgThrTyrArgValValPro

pET21a(+) ...................................

GluArgPheProProHisHisLeuThrValIleLeuGlyArgThrTyrArgValValPro

pGEX6p1 ...................................

GluArgPheProProHisHisLeuThrValIleLeuGlyArgThrTyrArgValValPro

1150 1160 1170 1180 1190 1200

....|....|....|....|....|....|....|....|....|....|....|....| NM_000930 ggcgaggaggagcagaaatttgaagtcgaaaaatacattgtccataaggaattcgatgat GlyGluGluGluGlnLysPheGluValGluLysTyrIleValHisLysGluPheAspAsp

pET21a(+) ...................................... GlyGluGluGluGlnLysPheGluValGluLysTyrIleValHisLysGluPheAspAsp

pGEX6p1 ...................................... GlyGluGluGluGlnLysPheGluValGluLysTyrIleValHisLysGluPheAspAsp

1210 1220 1230 1240 1250 1260

....|....|....|....|....|....|....|....|....|....|....|....| NM_000930 gacacttacgacaatgacattgcgctgctgcagctgaaatcggattcgtcccgctgtgcc AspThrTyrAspAsnAspIleAlaLeuLeuGlnLeuLysSerAspSerSerArgCysAla

pET21a(+) .................................................. AspThrTyrAspAsnAspIleAlaLeuLeuGlnLeuLysSerAspSerSerArgCysAla

pGEX6p1 .................................................. AspThrTyrAspAsnAspIleAlaLeuLeuGlnLeuLysSerAspSerSerArgCysAla

1270 1280 1290 1300 1310 1320

....|....|....|....|....|....|....|....|....|....|....|....| NM_000930 caggagagcagcgtggtccgcactgtgtgccttcccccggcggacctgcagctgccggac GlnGluSerSerValValArgThrValCysLeuProProAlaAspLeuGlnLeuProAsp

pET21a(+) ............................... GlnGluSerSerValValArgThrValCysLeuProProAlaAspLeuGlnLeuProAsp

pGEX6p1 ............................... GlnGluSerSerValValArgThrValCysLeuProProAlaAspLeuGlnLeuProAsp

1330 1340 1350 1360 1370 1380

....|....|....|....|....|....|....|....|....|....|....|....| NM_000930 tggacggagtgtgagctctccggctacggcaagcatgaggccttgtctcctttctattcg TrpThrGluCysGluLeuSerGlyTyrGlyLysHisGluAlaLeuSerProPheTyrSer

pET21a(+) ........................................... TrpThrGluCysGluLeuSerGlyTyrGlyLysHisGluAlaLeuSerProPheTyrSer

pGEX6p1 ........................................... TrpThrGluCysGluLeuSerGlyTyrGlyLysHisGluAlaLeuSerProPheTyrSer

1390 1400 1410 1420 1430 1440

....|....|....|....|....|....|....|....|....|....|....|....| NM_000930 gagcggctgaaggaggctcatgtcagactgtacccatccagccgctgcacatcacaacat GluArgLeuLysGluAlaHisValArgLeuTyrProSerSerArgCysThrSerGlnHis

pET21a(+) ................................... GluArgLeuLysGluAlaHisValArgLeuTyrProSerSerArgCysThrSerGlnHis

pGEX6p1 ................................... GluArgLeuLysGluAlaHisValArgLeuTyrProSerSerArgCysThrSerGlnHis

1450 1460 1470 1480 1490 1500

....|....|....|....|....|....|....|....|....|....|....|....| NM_000930 ttacttaacagaacagtcaccgacaacatgctgtgtgctggagacactcggagcggcggg LeuLeuAsnArgThrValThrAspAsnMetLeuCysAlaGlyAspThrArgSerGlyGly

pET21a(+) ............................... LeuLeuAsnArgThrValThrAspAsnMetLeuCysAlaGlyAspThrArgSerGlyGly

pGEX6p1 ............................... LeuLeuAsnArgThrValThrAspAsnMetLeuCysAlaGlyAspThrArgSerGlyGly

1510 1520 1530 1540 1550 1560

Một phần của tài liệu Lựa chọn thuộc tính trong khai phá dữ liệu (Trang 35)

Tải bản đầy đủ (PDF)

(65 trang)