Các chƣơng trình phân tích trình tự

3.1.2.1 Chƣơng trình Perl ssrfinder_1_0

Đây là một chƣơng trình của tác giả Steven Schroeder thuộc trƣờng Đại học Missouri – Michigan. Chƣơng trình gồm 6 Perl scripts có chức năng xác định SSR và thiết kế primer thích hợp cho mỗi SSR tìm đƣợc

- 1_ssr_repeat_finder.pl: tìm SSR, lấy ra trình tự SSR và vùng flanking cho những phân tích sau.

- 2_ssr_primer_designer.pl: thiết kế primer mà mục tiêu là khuếch đại vùng trình tự chứa SSR.

- 3_ssr_primer_rep_check.pl: sàng lọc lại các primer đã thiết kế để loại bỏ những primer có chứa trình tự lặp lại

- 4_ssr_primer_blast.pl: so sánh các primer đã thiết kế với cơ sở dữ liệu primer

- 5_ssr_order_filter.pl: tạo 1 file chỉ chứa SSR mà có primer duy nhất - 6_ssr_primer_formatter.pl: tạo 1 file chỉ chứa SSR có primer duy nhất – file này đƣợc tạo đơn giản chỉ chứa những thông tin cần thiết cho việc chọn lựa primer.

Yêu cầu: vì chƣơng trình này đƣợc viết cho hệ điều hành Unix hay Linux nên cần phải thực hiện sửa đổi một số lệnh lập trình cơ bản để có thể chạy trên môi trƣờng Window.

Chƣơng trình cần sự kết hợp với 3 phần mềm khác là Primer3, blastall và formatdb để thực thi. Ba phần mềm này có thể tải hoàn toàn miễn phí (có

phiên bản dành cho Window) từ trang Primer3

http://frodo.wi.mit.edu/primer3/code và trang Blast của NCBI http://www.ncbi.nlm.nih.gov/BLAST/download.shtml

Các thông số của chƣơng trình thiết kế primer đều đƣợc mặc định nhƣ sau

TARGET= m, n với m là vị trí bắt đầu có microsatllite và n là chiều dài microsatellite (mục tiêu)

PRIMER_PRODUCT_SIZE_RANGE=80-160 80-240 80-300 (kích thƣớc sản phẩm)

PRIMER_OPT_SIZE=24 (kích thƣớc tối ƣu của primer) PRIMER_MIN_SIZE=20 (kích thƣớc tối thiểu của primer) PRIMER_MAX_SIZE=28 (kích thƣớc tối đa của primer) PRIMER_OPT_TM=63 (nhiệt độ nóng chảy tối ƣu của primer) PRIMER_MIN_TM=60 (nhiệt độ nóng chảy tối thiểu của primer) PRIMER_MAX_TM=65 (nhiệt độ nóng chảy tối đa của primer) PRIMER_MAX_DIFF_TM=1 (độ chênh lệch nhiệt độ nóng chảy tối đa)

Với các thông số mặc định trên chƣơng trình hoàn toàn có thể sử dụng cho mục tiêu của đề tài.

Hiện nay, có rất nhiều phần mềm để phân lập SSR từ ESTs, ví dụ nhƣ: 1.MIcroSAtellite (MISA) [http://pgrc.ipkgatersleben.de/misa/],

2.Sputnik [http://abajian.net /sputnik/index.html],

3.CUGIssr [http://www.genome.clemson.edu/projects/ssr/]

5.SSRFinder [http://www.maizemap.org/bioinformatics/

SSRFINDER/ssrfinder_1_0.tar.gz] Các công cụ này hầu nhƣ dựa trên cùng một thuật toán tìm SSR, tuy nhiên mỗi phần mềm đƣợc viết bằng các ngôn ngữ lập trình khác nhau. Một điểm nổi bật của công cụ SSRFinder (đƣợc viết bằng Perl, có tích hợp Primer3 và ncbi-BLAST) là có tích hợp thêm những Perlscript giúp hỗ trợ việc thiết kế primer cũng nhƣ kiểm tra lại primer, tuy nhiên các Perlscript này đƣợc lập trình dƣới hệ điều hành UNIX nên cần đƣợc chỉnh sữa để có thể sử dụng trên hệ điều hành Windows. Ngoài ra, còn có rất nhiều trang web hỗ trợ việc tìm SSR trên trình tự nhƣ:

1.SSR Server [http://www.bioinfo.wsu.edu/cgi-bin/gdr/gdr_ssr] 2. SSR Primer Discovery [http://hornbill.cspp.latrobe.edu.au/cgi-

binpub/ssrprimer/indexssr.pl]

3. SSRIT [http://www.gramene.org/db/searches/ssrtool]

3.1.2.2 Chƣơng trình tìm kiếm các trình tự tƣơng đồng – BLAST

BLAST là một chƣơng trình tìm kiếm và so sánh trình tự tƣơng đồng đƣợc nhiều ngƣời dùng nhất hiện nay. Thuật giải của BLAST xuất phát từ ý tƣởng “liệu trong ngân hàng dữ liệu (bao gồm cả CSDL cục bộ và những CSDL lớn trên thế giới nhƣ GenBank, EMBL,…) có trình tự nào giống hoặc gần giống với trình tự đang quan tâm”. BLAST thực hiện so sánh trình tự nhập vào (có thể DNA hay protein) với những trình tự trong CSDL. Kết quả của BLAST là những số liệu thống kê chính xác về tỉ lệ tƣơng đồng và nguồn gốc các trình tự.

Chiến lƣợc tìm kiếm trình tự tƣơng đồng trong BLAST đƣợc thực hiện qua ba bƣớc chính:

Đầu tiên BLAST tìm kiếm những đoạn tƣơng đồng HSPs (High Scoring Pair) giữa một trình tự đƣa vào và mỗi trình tự trong CSDL.

Công việc tiếp theo là thực hiện đánh giá ý nghĩa thống kê dựa trên bất cứ sự tƣơng đồng nào đƣợc tìm thấy.

Sau cùng BLAST đƣa ra một báo cáo kết quả giống nhau thỏa mãn ngƣỡng giá trị mà ngƣời dùng mong muốn.

Stand-alone BLAST sử dụng trong khóa luận này có thể tải về từ địa chỉ của trang CSDL NCBI: blast-2.2.14-ia32-win32.exe

(ftp://ftp.ncbi.nih.gov.blast/executables/).

3.1.2.3 Hệ quả trị CSDL quan hệ Microsoft ACEESS

Microsoft Access là một phần mềm ứng dụng thuộc bộ phần mềm Microsoft Office, đƣợc sử dụng để quản lý dữ liệu (quản lý nhân sự, khách hàng, vật tƣ, kế toán…).Phần mềm này đƣợc bảo vệ và phân phân phối bởi hãng Microsoft

Phiên bản Access tùy thuộc vào phiên bản của bộ phần mềm Microsoft Office

Để sử dụng phần mềm này chúng ta phải mua bản quyền của Microsoft Mỗi tập tin ACCESS gọi là một cơ sở dữ liệu.

Một cơ sở dữ liệu chứa đựng nhiều dữ liệu nằm trong một thành phần chính của một tập tin ACCESS gọi là bảng (TABLE).

Các bảng này có mối quan hệ với nhau theo một quy luật nào đó do ngƣời thiết kế tạo nên.

3.1.2.4 Egassembler

Là 1 công cụ trực tuyến cung cấp những công cụ sinh học tự động mà ngƣời dùng có thề sử dụng để phân tích làm sạch trình tự, dấu những vùng lập lại, dấu những vùng trình tự nhiễu của vector và adaptors, dấu những vùng trình tự nhiễu của các bào quan, sắp gióng cột và assembly các đọan ESTs và đọan genomic. Hệ thống máy chủ chấp nhận nhiều dạng trình tự DNA ở dạng FASTA nhƣ EST, , cDNA, gDNA, GSS

Hệ thống gồm 5 công cụ chính:  Làm sạch trình tự  Dấu những vùng lặp lại

 Dấu những vùng trình tự nhiễu của vector và adaptors  Dấu những vùng trình tự nhiễu của các bào quan

 Assembling: sắp gióng cột vá chồng các trình tự lại với nhau tạo thành các Contigs và Singletons

Egassembler web có 3 tùy chọn chính, mỗi tùy chọn dành cho những ngƣời dùng khác nhau

One-Click Assembly : cho ngƣời dùng mới bắt đầu với sinh tin học, các bƣớc sẽ đƣợc thực hiện lần lƣợt theo mặc định đã cài sẵn, ngƣời dùng có thể lựa chọn thƣ viện dữ liệu để dấu những vùng lặp lại, dấu những vùng trình tự nhiễu của vector và adaptors, dấu những vùng trình tự nhiễu của các bào quan.Các quá trình xử lý đƣợc thực hiện lần lƣợt.

Step-by-Step Assembly: Ngƣời dùng có thể sử dụng mọi công cụ trong web, và có thể chạy từng mục một với các tùy chọn nâng cao. Kết quả đầu ra ở bƣớc trƣớc sẽ đƣợc sử dụng làm dữ liệu đầu vào cho bƣớc tiếp theo một cách tự động. Ngƣời dùng có thể đi đến bất kỳ bƣớc nào vào bất cứ thời điểm nào với kết quả đã đƣợc lƣu lại từ trƣớc

Stand-Alone Processing : Tùy chọn này giống với Step-by-Step Assembly chỉ khác ở chỗ ngƣời dùng không thể sử dụng kết quả đầu ra ở bƣớc trƣớc để làm dữ liệu đầu vào cho các quá trình sử lý khác

3.1.3 Apache web Server

. Apache web Server là một trình chủ web đƣợc nhiều ngƣời dùng nhất hiện nay trên Internet. Apache có đƣợc một vị trí đáng nể nhƣ thế là nhờ vào việc nó là một chƣơng trình mã nguồn mở và hoàn toàn miễn phí. Hai ƣu điểm này đã giúp Apache đƣợc yêu thích đối với những công việc vừa và lớn của nhiều công ty trên thế giới.

Một trong những điểm mạnh của Apache là khả năng nâng cấp trình chủ web thông qua các module. Khi một yêu cầu từ trình tự khách đƣợc gởi đến Apache phải trải qua một loạt nhiều giai đoạn sử lý để cuối cùng trả về kết quả cho ngƣời dùng.

3.4 CÁC BƢỚC TIẾN HÀNH

1 Thu nhập trình tự

2 Lọai các dữ liệu nhiễu và dƣ

3. Aseembling

4 Tìm SSR 4.1Blastn 4 Tìm SSR

5 Thiết kế và kiểm tra Primer 6. tBLASTx trên cơ

sở dữ liệu UniGene

7. 7.Đƣa vào

Sơ đồ qui trình phân lập và xác định 8 Tích hợp

chức năng SSR của cây cam quýt

CSDL dbEST và CoreNucleotide của NCBI

ESTs - Citrus

ESTs Citrus không thừa, không nhiễu

Contigs Singletons

ESTs, SSR Citrus

CSDL EST-SSr Primer Citrus

Cơ sở dữ liệu quan hệ

WebSite

Cơ sở dữ liệu EST-SSR- Primer Citrus liên quan đến gene kháng bệnh

EST-SSR none primer citrus

Bƣớc 1. Thu thập trình tự ESTs Citrus từ CSDL dbEST

Quá trình thu nhận trình tự nucleotide đƣợc tóm tắt thành sơ đồ sau

Bảng 3.1 Sơ đồ tóm tắt quá trình thu nhận trình tự chính từ NCBI

Từ khóa sử dụng cho tung lòai là

Bảng 3.2 : Từ khóa sử dụng để thu nhận trình tự trên NCBI

Citrus aurantium "txid43166"[Organism] AND gbdiv_EST[PROP]

Citrus clementina "txid85681"[Organism]ANDgbdiv_EST[PROP]

Citrus jambhiri "txid64884"[Organism]ANDgbdiv_EST[PROP]

Citrus macrophylla (colo) "txid307630"[Organism]ANDgbdiv_EST[PROP]

Citrus reticulata x Citrus temple

“xid322160"[Organism]ANDgbdiv_EST[PROP]

Truy cập trang web NCBI

Nhập từ khóa

Chọn lọc theo giống Chọn cơ sở dữ liệu EST

Chọn dạng FASTA

Thu nhận tất cả trình tự nucleotide theo từng giống

Chọn dạng Summary

Thu nhận các thông tin liên quan

Citrus reticulata "txid85571"[Organism] AND gbdiv_EST[PROP]

Citrus sinensis “xid2711"[Organism] AND gbdiv_EST[PROP]

Citrus unshiu “xid55188"[Organism] AND gbdiv_EST[PROP]

Citrus x paradisi ( “xid37656"[Organism] AND gbdiv_EST[PROP]

Citrus sinensis x Poncirus trifoliata

“xid105581"[Organism]AND gbdiv_EST[PROP]

Citrus x paradisi x

Pondcirus trifoliata

“"txid309804"[Organism]ANDgbdiv_EST[PROP]

Hình 3.1 : Danh sách các trình tự EST Citrus trên NCBI (www.NCBI.nlm.nih.gov/genomes/plant/plantlist.html#est)

Định dạng FASTA: là định dạng theo quy định của NCBI, FASTA là một giải thuật bắt cặp trình tự đƣợc David J. Lipman và William R. Pearson miêu tả lần đầu tiên vào năm 1985 (Rapid and sensitive protein similarity searches), nó có một hàng chú thích bắt đầu bằng ký tự “>” ở cột đầu tiên.

Ví dụ một định dạng FASTA:

>gi|146351219|gb|EG026743.1|EG026743 KN0AAA2CF05ZM1 AbsAOv1 (Citrus) clementina cDNA 5', mRNA sequence

GGCTCAAGTACTTATTTTTTAATATAGTGCACTCGAAGCTAGCAAATATC TTTTCTGACTTGAAGAATATGAAAACTCTTCCTGGCGCAGGTATGAGCG ATCCGTCAGAAGGTTACTTACTCCCCCCTTCCAGTATTGCTGATGATGAT GTTGGGAATGACAATCTTGATCTTATCGTTATTCCTCAATATGGGAGAA ATCCTGATTATTATGGGTAAGTGTCTGCAATCTGGATGATGATATATATA Trong đó: gi là mã số do NCBI quy định.

gb là mã số của cơ sở dữ liệu gen (Genbank) của từng loài.

Chúng tôi thu nhận đƣợc tổng cộng 189385 trình tự ESTs, thuộc 11 lòai khác nhau.

Bƣớc 2.Loại các dữ liệu nhiễu và dƣ bằng công cụ EGassembler bao gồm các bƣớc sau:

2.1 Làm sạch trình tự: loại các đuôi PolyA/PolyT, những vùng trình tự

phức tạp thấp, những vùng trình tự kém chất lƣợng (N), những trình tự ESTs < 100N.

2.2 Dấu những vùng lặp lại: nhƣ LINEs (long interspersed elements),

SINEs (short interspersed elements), LTR (Long Tandem Repeat), DNA transposon, RNA pseudogenes dựa trên CSDL RepBase, TIGR và TREP.

2.3 Dấu những vùng trình tự nhiễu của vector và adaptors: dựa trên

CSDL NCBI-UniVec hay EMBL-emvec.

2.4 Dấu những vùng trình tự nhiễu của các bào quan: nhƣ Plastids,

Plasmids, ti thể và Nucleomorph dựa trên CSDL của NCBI-organelle.

Bƣớc 3. Assembling: bằng EGassembler với hai hoặc nhiều trình tự chồng lên nhau

có độ tƣơng đồng tối thiểu là 80% và chiều dài của đoạn chồng lên nhau tồi thiểu là 40N.

Các trình tự có độ tƣơng đồng cao đƣợc gom lại thành một gọi là Contigs.Các đọan trình tự không có đọan tƣơng đồng với các trình tự khác đƣợc gọi là Singleton.

Hình 3.3 phân biệt giữa Contig và Singleton Bƣớc 4.Tìm SSR: bằng SSRFinder v1.0 của Steven Schroeder Thu nhận trình tự SSR

Các bƣớc thực hiện:

Trình tự nucleotide thu nhận từ NCBI về đƣợc lƣu thành tập tin với tên là “sequence20030101.txt”.

Thực thi đoạn mã Perl “SSRRepeatFinder.pl”, khi đó chƣơng trình sẽ tạo ra 3 tập tin khác với tên lần lƣợt là “ssrout20030101.txt”, “labdbout20030101.txt”, “new_ids20030101.txt”.

Hình 3.4 nội dung tập tin “ssrout20030101.txt”

Trong tập tin này nó sẽ gồm các nội dung theo thứ tự là:

Mã của đoạn SSR (SSR Version) (EG026717.1a) dựa vào mã số genbank (EG026717.1) để tạo ra mã quy định cho mỗi đoạn SSR, khi một trình tự có 2 hay nhiều đoạn SSR thì nó sẽ quy định là “a”, “b”, “c”,… (EG026717.1a và EG026717.1b)

Trình tự đoạn SSR: TATATATATATA Đoạn SSR (Motif): TA

Đoạn SSR trong trình tự chính đƣợc rút gọn, nó đƣợc phân biệt trong dấu “[]” TTGTTACAGTAGCAATTTTGACTCACTCTTAAGTCTTTGCTGTTGTATTG ATATCAACTGTTATTGACGACTTTTAATAGTGCATTTCCATGATTTTGTC TATTAACTTGTCAATAAAAGTAAAGAATTCCTGTATTGCAAAATTACTTT [TATATATATATA]GAGGGGTTATGCGGTCTGGGATCCCAGACTGTAATT AAAGTCCAGGAT

Hình 3.5 nội dung tập tin “labdbout20030101.txt”

EG026717.1 EG026717.1a TATATATATATA TA 369,12

TTGTTACAGTAGCAATTTTGACTCACTCTTAAGTCTTTGCTGTTGTATTGATAT CAACTGTTATTGACGACTTTTAATAGTGCATTTCCATGATTTTGTCTATTAACTTGTCAA TAAAAGTAAAGAATTCCTGTATTGCAAAATTACTTT[TATATATATATA]GAGGGGTTA TGCGGTCTGGGATCCCAGACTGTAATTAAAGTCCAGGATTGGGACCATGTGTAGCAGA TTAATAAATAAATAAATAAATCCAACGGCCTCAGTCCGGATACTAGTTTGGAT

EG026717.1a TATATATATATA TA

TTGTTACAGTAGCAATTTTGACTCACTCTTAAGTCTTTGCTGTTGTATTGATATCAACTG TTATTGACGACTTTTAATAGTGCATTTCCATGATTTTGTCTATTAACTTGTCAATAAAAGTAAAGA ATTCCTGTATTGCAAAATTACTTT[TATATATATATA]GAGGGGTTATGCGGTCTGGGATCCCAGA CTGTAATTAAAGTCCAGGATTGGGACCATGTGTAGCAGATTAATAAATAAATAAATAAATCCAACG GCCTCAGTCCGGATACTAGTTTGGAT

Nội dung tập tin này gần giống với tập tin “ssrout20030101.txt”, nó chỉ bổ sung thêm phần mã genbank (EG026717.1) và vị trí bắt đầu (369) và chiều dài đoạn SSR (12).

Hình 3.6 Nội dung tập tin “new_ids20030101.txt”

Tập tin “new_ids06062007.txt” bổ sung thêm phần định nghĩa

Nguyên tắc thu nhận trình tự

Thu nhận các trình tự SSR bằng cách đếm các trình tự nu lập lại trong gene theo nguyên tắc: dimer 6 repeats, trimer 4 repeats, tetramer 4 repeats. Phải chắc rằng các SSR thu nhận phải có nhiều trình tự hơn giới hạn đã đặt ra ở trên và không thu nhận những trình tự có 1 trình tự lập lại nhiều lần nhƣ AAAAAAAAAAAAAAA, TTTTTTTTTTTTTTT

Bƣớc 4.1 BLASTn:

Dùng Perl script thực hiện việc tìm kiếm những trình tự EST-SSR không thể thiết kế primer do vùng flanking quá ngắn trên các contigs bảo tồn, với mục đích kéo dài các EST-SSR. Chúng tôi đã thiết kế Perl script “Blast on Contig” để thực hiện qui trình này vì trong phần mềm SSRFinder khong hỗ trợ chức năng này

Các trình tự EST-SSR không thể thiết kế primer do vùng flanking quá ngắn đƣớc lƣu vào tập tin none_primer20030101.txt. Chúng tôi thiết kế perl script “blast on contigs” để thực hiện quá trình tBlastx trên các contigs bảo tồn nhằm kéo dài các EST-SSR không thiết kế đƣợc primer. Thực thi đoạn mã Perl “Blast on contigs.pl”, khi đó chƣơng trình sẽ tạo ra 3 tập tin khác với tên lần lƣợt là “blastout120030101.txt”, “fullblastout120030101.txt” và “contigs20030101.txt”.

Các Ests mới thu nhận đƣợc sẽ đƣợc lƣu trong thƣ mục contigs20030101.txt

EG026743.1 EG026743 KN0AAA2CF05ZM1 AbsAOv1 Citrus clementina cDNA 5', mRNA sequence

EG026742.1 EG026742 KN0AAA2CD10ZM1 AbsAOv1 Citrus clementina cDNA 5', mRNA sequence

Bƣớc 5.Thiết kế và kiểm tra primer:

Thiết kế primer: trong vùng bảo tồn hai bên vùng SSR vừa tìm đƣợc ở trên bằng phần mềm Primer3 với nhiệt độ bắt cặp trong khoảng từ 63 đến 650C và sự chênh lệch giữa primer xuôi và primer ngƣợc không quá 10C, sản phẩm PCR có độ dài trong khoảng từ 80-300bp.

Kiểm tra primer: bằng SSRFinder. Trƣớc tiên, kiểm tra các base lặp lại trong primer, nếu có 1 loại base lặp lại lớn hơn 3 lần thì loại bỏ primer đó. Sau đó, tiếp tục kiểm tra tính bắt cặp đặc hiệu của các primer đó bằng công cụ BLAST, nếu có ít hay nhiều hơn một primer xuôi và một primer ngƣợc bắt cặp lên một trình tự EST thì loại cặp primer đó.

Bƣớc 6 tBLASTx: trên CSDL gen kháng virus tristeza của Poncitrus Trifoliata: nhằm mục đích xác định các EST-SSR có liên quan đến khả năng kháng bệnh dựa trên tìm kiếm tƣơng đồng ở các loài lân cận: chức năng của gene chứa các SSR và vai trò của các SSR trong chức năng của gene ở thực vật chƣa đƣợc biết rõ và ghi nhận nhiều. Một ví dụ khá hiếm và điển hình về loại chức năng này là ở gene waxy, khi đầu 5‟-UTR của gene này có số lần lặp lại của GA/CT thay đổi sẽ ảnh hƣởng đến hàm lƣợng amylose chứa trong gạo (Ayers et al., 1997). Ngoài ra, còn một số ví dụ khác về các gene có chứa SSR liên quan đến bệnh di truyền thần kinh ở ngƣời. Trong nghiên cứu này, chúng tôi đặc biệt quan tâm đến SSR trong các gene kháng ở thực vật, vì những thay đổi về số lần lặp lại của SSR có ảnh hƣởng rất lớn về khả năng kháng lại tác nhân gây bệnh ở thực vật

Cơ sở dữ liệu gene kháng virus tristeza đƣợc lấy từ cỏ sở dữ liệu NCBI với từ khóa là ”tristeza virus resistance gene”

Bƣớc 7. Đƣa tất cả các dữ liệu này vào CSDL quan hệ Microsoft ACCESS để dễ

dàng truy xuất thông tin.

Tạo bảng chứa dữ liệu

Theo các mô tả trong mô hình đối tƣợng, ta chuyển từ mô hình đối tƣợng sang mô hình quan hệ nhƣ sau:

Mỗi đối tƣợng trong mô hình đối tƣợng là một quan hệ trong mô hình quan hệ.

Mỗi thuộc tính trong mô hình đối tƣợng là thuộc tính trên quan hệ tƣơng ứng.

Khóa của đối tƣợng là khóa của quan hệ tƣơng ứng. Tạo các quan hệ 1:

Bảng tblStrain

Bảng 3.3 Nội dung tblStrain Tên trƣờng Kiểu dữ

liệu

Chú thích

StrainID Text Mã số quy định giống.

StrainName Text Tên của giống.

Bảng tblMotifLengthGroup:chứa nội dung quy định mã các đoạn SSR Bảng 3. 4 Nội dung tblMotifLengthGroup

Tên trƣờng Kiểu dữ liệu

Chú thích

MotifLengthGroupID Text Mã số quy định chiều dài đoạn SSR

MotifLengthGroup Text Chiều dài đoạn SSR.

MotifDescription Text Chú thích.

Bảng tblSSR: chứa thông tin về đoạn Microsatellite Bảng 3.5 Nội dung tblSSR Tên trƣờng Kiểu dữ

liệu

Chú thích

SSRID Text Mã số của đoạn SSR.

StrainID Text Mã số quy định giống.

SSRVersion Text Phiên bản của đoạn SSR dựa vào.

MotifLengthGroupID Text Mã số quy định chiều dài đoạn SSR

Motif Text Đoạn SSR.

SSRSequence Text Trình tự đoạn SSR

SSRStart Number Vị trí bắt đầu.

Cơ sở dữ liệu sinh học