Phântíchsosánhcác h gen ệ Vi c sosánh h gen gi a các loài đ ngệ ệ ữ ộ v t khác nhau là c s tr c ti p đ đánhậ ơ ở ự ế ể giá s bi n đ i v c u trúc gen và trìnhự ế ổ ề ấ t c a chúng xu t hi n trong quá trìnhự ủ ấ ệ ti n hóa. Vi c sosánhcác h gen nhế ệ ệ ư v y đ ng th i cùng giúp kh ng đ nhậ ồ ờ ẳ ị ch c ch n h n v các vùng gen mã hóaắ ắ ơ ề protein trong m t h gen c a loài nào đó.ộ ệ ủ Ví d nh các exon c a cácgen đ ngụ ư ủ ồ ti n hóa có m c đ b o th cao h nế ứ ộ ả ủ ơ nhi u so v i các intron. Vi c sosánhhề ớ ệ ệ gen ng i và chu t đã tìm th y nhi uườ ộ ấ ề exon có tính b o th cao. Vi c so sánhả ủ ệ gi a các h gen cũng đ ng th i giúp xácữ ệ ồ ờ đ nh các trình t exon ng n (hay tìm th yị ự ắ ấ ph n đ u 5’ c a gen và vùng promoterở ầ ầ ủ li) v n th ng b sót khi xác đ nh b ngố ườ ị ị ằ ph n m m máy tính. M t trong nh ngầ ề ộ ữ khám phá n i b t c a phép phântích soổ ậ ủ sánhcác h gen là vi c tìm ra s phệ ệ ự ổ bi n c a tính b o th liên k t gi a cácế ủ ả ủ ế ữ gen trên cùng NST. ng i và chu t,Ở ườ ộ s b o th c a tính liên k t gi a các genự ả ủ ủ ế ữ trên cùng NST là r t ph bi n. Trongấ ổ ế nhi u tr ng h p, tính b o th nàyề ườ ợ ả ủ đ c tìm th y c các loài r t xa nhauượ ấ ở ả ấ trong quá trình ti n hóa, ví d nh loàiế ụ ư ở cá b d t có t tiên chung v i các loàiể ẹ ổ ớ đ ng v t có vú t 400 tri u năm tr cộ ậ ừ ệ ướ đây. Hi n t ng ph bi n c a s b oệ ượ ổ ế ủ ự ả th trong tính liên k t c a nhi u gen choủ ế ủ ề th y có nhi u kh năng cácgen “lángấ ề ả gi ng” cùng dùng chung các trình t đi uề ự ề hòa gen. M t đi u tra dùng ph n m mộ ề ầ ề máy tính g n đây tìm th y trong m tầ ấ ộ đo n NST có kích th c 100 - 200 kb ạ ướ ở ru i d m Drosophila có 10 - 20 gen liênồ ấ k t có hình th c đi u hòa s bi u hi nế ứ ề ự ể ệ gi ng h t nhau. ru i d m có kho ngố ệ Ở ồ ấ ả 500 - 1000 đo n NST duy trì s liên k tạ ự ế b o th này có th là do cácgen liên k tả ủ ể ế cùng ph thu c vào các trình t đi u hòaụ ộ ự ề chung vùng NST đó.ở Các trình t mã hóa protein không ch làự ỉ các vùng c a h gen đ c gi i h n vủ ệ ượ ớ ạ ề ch c năng. Các trình t đi u hòa (v tríứ ự ề ị g n c a các y u t phiên mã và các y uắ ủ ế ố ế t đi u hòa ho t đ ng gen, nh các y uố ề ạ ộ ư ế t tăng c ng enhancer) th ng có tínhố ườ ườ b o th cao. Các trình t này th ngả ủ ự ườ đ c xác đ nh là các trình t không mãượ ị ự hóa protein ng n và b o th . Ví d m tắ ả ủ ụ ộ ch ng trình máy tính g i là VISTAươ ọ (không ph i h đi u hành m i đây c aả ệ ề ớ ủ Microsoft) khi phântích h gen nhi uệ ở ề loài khác nhau tìm th y s b o th tấ ự ả ủ ở ỉ l 70% trong m t đo n trình t phân tíchệ ộ ạ ự 50 - 75 bp đ i v i m t s trình t ADNố ớ ộ ố ự có vai trò đi u hòa. Hai loài cá b d t vàề ể ẹ chu t cùng có kho ng 10.000 các đo nộ ả ạ trình t không mã hóa ng n gi ng nhau,ự ắ ố r t có th chúng là các trình t tăngấ ể ự c ng đ c tr ng mô. Tuy v y, c haiườ ặ ư ậ ả loài này, đ c bi t chu t, d ng nh cóặ ệ ở ộ ườ ư nhi u trình t đi u hòa b b sót khi sề ự ề ị ỏ ử d ng ph n m m máy tính đ phân tíchụ ầ ề ể trình t gen. Ng i ta đã xác đ nh đ cự ườ ị ượ loài đ ng v t b c th p Cionaở ộ ậ ậ ấ intestialis có ch a kho ng 20.000 cácứ ả trình t enhancer, và vì v y không có gìự ậ là ng c nhiên n u ng i và chu t s cóạ ế ườ ộ ẽ kho ng 50.000 - 100.000 các trình tả ự enhancer trong h gen.ệ Các ph ng pháp đ c s d ng đ xácươ ượ ử ụ ể đ nh các trình t tăng c ng d a trênị ự ườ ự vi c xác đ nh các v trí liên k t c a cácệ ị ị ế ủ y u t ho t hóa ho c c ch phiên mã.ế ố ạ ặ ứ ế Vi c xác đ nh đ c các trình t đi u hòaệ ị ượ ự ề trong phân t ADN còn là thách th c l nử ứ ớ h n so v i vi c xác đ nh đ c các trìnhơ ớ ệ ị ượ t mã hóa protein b i các trình t đi uự ở ự ề hòa không b h n ch b i các nguyên lýị ạ ế ở c a mã di truy n. Vì v y, d ng nhủ ề ậ ườ ư vi c ph i ph i h p nhi u ph ng phápệ ả ố ợ ề ươ sinh tin h c và ch ng trình máy tính làọ ươ c n thi t đ có th xác đ nh đ c cácầ ế ể ể ị ượ trình t ADN đi u hòa trong toàn b hự ề ộ ệ gen. Công c ph n m m phântích h genụ ầ ề ệ đ c s d ng r ng rãi nh t hi n nay làượ ử ụ ộ ấ ệ BLAST (basic local alignment tool). Có m t s c i bi n khác nhau trong cácộ ố ả ế ch ng trình BLAST, tuy v y t t c cácươ ậ ấ ả ch ng trình này đ u có các đ c đi mươ ề ặ ể chung là tìm đ c nh ng vùng gi ngượ ữ ố nhau gi a cácgen mã hóa protein khácữ nhau. Có nhi u cách đ tìm d li u tề ể ữ ệ ừ BLAST. M t trong nh ng cách đó là sộ ữ ử d ng công c tìm ki m h gen ho c cácụ ụ ế ệ ặ h gen đ i v i t t c các trình t proteinệ ố ớ ấ ả ự đ c d đoán tr c g i là “querryượ ự ướ ọ sequence”. Ch ng h n nh ví d sau:ẳ ạ ư ụ gen eve mã hóa trong m t protein đi uộ ề hòa phiên mã thi t y u cho s phân hóaế ế ự t bào phôi Drosophila. Protein Eve cóế ở 376 axit amin. Vùng ch c năng c aứ ủ protein này n m gi a các axit amin 71 -ằ ữ 130. Khi s d ng trình t c a 60 axitử ụ ự ủ amin này đ tìm ki m, k t qu cho th yể ế ế ả ấ h gen Drosophila có 75 gen mã hóaệ ch a trình t này. Nh v y, ch ngứ ự ư ậ ươ trình BLAST đã nhanh chóng xác đ nhị đ c m t lo t cácgen có ch c năngượ ộ ạ ứ t ng t .ươ ự M t cách khác đ khai thác c s dộ ể ơ ở ữ li u c a BLAST là tra c u theo trình tệ ủ ứ ự nucleotit. Ch ng h n nh trong thí dẳ ạ ư ụ trên, ng i ta có th s d ng t ng ngườ ể ử ụ ươ ứ trình t 180 bp mã hóa cho h p đ nh lo iự ộ ị ạ gen (homeobox). Tóm l i, vi c trình t các h gen đ y đạ ệ ự ệ ầ ủ c a các loài khác nhau ngày càng tăng lênủ đã cung c p m t c s d li u ngàyấ ộ ơ ở ữ ệ càng phong phú và đ y đ cho cácầ ủ nghiên c u h gen h c so sánh. Ngàyứ ệ ọ càng có nhi u các ch ng trình máy tínhề ươ đ c phát tri n và hoàn thi n đ khaiượ ể ệ ể thác v n thông tin di truy n đang ngàyố ề càng đ c t o ra đ y đ h n qua cácượ ạ ầ ủ ơ ch ng trình gi i mã ADN t đ ng.ươ ả ự ộ . Phân tích so sánh các h gen ệ Vi c so sánh h gen gi a các loài đ ngệ ệ ữ ộ v t khác nhau là c s tr c ti p đ đánhậ ơ ở ự ế ể giá s bi n đ i v c u trúc gen. phá n i b t c a phép phân tích so ậ ủ sánh các h gen là vi c tìm ra s phệ ệ ự ổ bi n c a tính b o th liên k t gi a các ủ ả ủ ế ữ gen trên cùng NST. ng