SNP- các đa hình đơn nucleotit Single nucleotide polymorphisms - Khái niệm: SNP là đột biến đơn nucleotit được tìm thấy trong quần thể với tần số từ 1% trở lên - Mật độ: trong hệ gen ngư
Trang 2CHUYÊN ĐỀ DI TRUYỀN HỌC QUẦN THỂ VÀ DẤU CHUẨN DI
TRUYỀN TRONG ỨNG DỤNG DI TRUYỀN HỌC
A MỞ ĐẦU
1 Lí do chọn đề tài.
Trong các đề thi học sinh giỏi quốc gia và quốc tế môn Sinh học hiện nay,bài tập phần Di truyền học quần thể và phần Ứng dụng di truyền học thường xuyênđược đề cập tới Các bài tập đều yêu cầu học sinh nắm chắc kiến thức cơ bản đồngthời vận dụng linh hoạt ở cấp độ cao Hơn nữa, đề thi thường rất dài, các em họcsinh cần tư duy và làm bài nhanh Do đó chúng tôi chọn chuyên đề “Di truyền quầnthể và dấu chuẩn di truyền trong ứng dụng di truyền học”, trong đó chúng tôi tổnghợp các công thức trong di truyền học quần thể và các kiến thức cơ bản về dấuchuẩn di truyền học thường xuất hiện trong bài thi, từ đó giúp các em học sinh làmbài chính xác và tiết kiệm thời gian
Trang 32 Các loại dấu chuẩn di truyền phổ biến
2.1 SNP- các đa hình đơn nucleotit (Single nucleotide polymorphisms)
- Khái niệm: SNP là đột biến đơn nucleotit được tìm
thấy trong quần thể với tần số từ 1% trở lên
- Mật độ: trong hệ gen người, SNP xuất hiện với mật độ
trung bình khoảng 100-300 cặp base với mỗi SNP
- Vị trí: SNP được tìm thấy ở cả các vùng mã hóa và
các vùng không mã hóa của hệ gen Các nhà khoa học
đã xác định được vị trí của vài triệu SNP trong hệ gen
người và sẽ tiếp tục tìm thêm các vị trí mới
- RFLP- đa hình độ dài các đoạn giới hạn: là một dạng SNP đặc biệt khi đột biếnđơn nucleotit đã làm thay đổi trình tự nhận biết của enzim giới hạn
Ví dụ: trường hợp khác biệt đơn nucleotit giữa các alen quy định chuỗi β- globincủa tế bào hồng cầu bình thường và tế bào hồng cầu hình liềm Những biến dị nàylàm thay đổi kích thước các đoạn cắt giới hạn được tạo ra sau khi ADN được xử lívới enzim
- Hình thành: SNP được hình thành do đột biến thay thế một cặp nucleotit
bệnh di truyền: nếu như tìm thấy một
SNP liên kết chặt với một alen bất
thường thì alen đó và dấu chuẩn luôn
Trang 4di truyền cùng nhau Do đó, sự có mặt của alen bất thường được xác định qua sự
có mặt của SNP
Ví dụ 1: các alen gây bệnh múa giật Huntinton và một số bệnh di truyền khác banđầu được phát hiện một cách gián tiếp này thông qua các dấu chuẩn RFLP
Ví dụ 2: Phả hệ giả dựa trên
phân tích SNP của ADN từ một
vùng nhiễm sắc thể Trong gia
đình này, các cá thể có SNP
khác nhau ở nucleotit A, T
hoặc C Mỗi cá thể có 2 alen,
một số chứa A trên cả hai SNP, một số khác dị hợp ở vị trí này Phân tích cho thấytính trạng quan tâm phân li cùng với SNP chứa nucleotit C
+ Sử dụng SNP trong điều tra hình sự: cục điều tra liên bang Mỹ (FBI) bắt đầu ứngdụng công nghệ ADN trong pháp y kể từ năm 1988 bằng việc sử dụng phép phântích RFLP kết hợp với thẩm tách Southern để tìm sự giống nhau và khác nhau giữacác mẫu qua đó điều tra các đối tượng hình sự liên quan Lưỡng mẫu máu và môrất nhỏ khoảng 1000 tế bào có thể cho được kết quả nghiên cứu
Trong quá trình nghiên cứu, các nhà khoa học cũng tìm ra nhiều dạng biến
dị khác gồm đảo đoạn, mất đoạn, lặp đoạn nhung không có biểu hiện gây hại rõ rệtđối với cơ thể màng chúng Các biến dị trên cùng các SNP là những dấu chuẩn ditruyền hiệu quả trong nghiên cứu tiến hóa ở người, trong việc phát hiện các khácbiệt giữa các quần thể người, tìm ra con đường di cư của các quần thể người qualịch sử
2.2 STR- các trình tự ngắn lặp lại liên tiếp (Short tandem repeat)
- Khái niệm: STR là những đơn vị lặp lại kế tiếp nhau, mỗi đơn vị lặp lại gồm 2-6nucleotit, ở những vùng đặc thù trong hệ gen STR còn có các tên gọi khác là vi vệtinh, microsatellite hay SSR
Trang 5- Tính đa hình:
+ Mức độ lặp lại của các đơn vị nucleotit có mức biến động lớn (tính đa hình cao)giữa những người khác nhau VD: một cá thể có thể có trình tự ACAT lặp lại 30lần ở một locus trong hệ gen, trong khi một cá thể khác ở locus này chỉ có 18 lầnlặp lại trình tự ACAT
+ Tính biến động có thể thể hiện ở những vị trí khác nhau trong hệ gen Ví dụ đơn
vị lặp lại GTTAC có thể xuất hiện liên tiếp hàng trăm nghìn lần tại một vị trí trong
hệ gen nhưng ở vị trí khác, số lần lặp lại của đơn vị này chỉ bằng một nửa
Theo một thống kê gần đây, hệ gen người có khoảng 128000 locus lặp 2 bp,
8740 locus lặp 3 bp, 23680 locus lặp 4 bp, 4300 locus lặp 5 bp, 230 locus lặp 6 bpNgoài ra, VNTR (còn gọi là tiểu vệ tinh, minisatellites) có đặc điểm giống với STR
về sự lặp lại liên tiếp các trình tự đơn, nhưng đơn vị lặp lại thường lớn hơn, từ 7đến vài chục bp Trong hệ gen người, số locus VNTR ít hơn nhiều so với STR
- Sự hình thành: các STR được hình thành chủ yếu do hiện tượng “sao chép trượt”hay còn gọi là sao chép lệch mục tiêu trong sao chép ADN khi một đoạn ADNđược dùng làm khuôn hai hoặc nhiều lần
Ví dụ: hình bên dưới cho thấy mạch bổ sung (n+1) đã hình thành một vòng ADNgồm 3 nucleotit CAG dẫn tới đoạn GTC trên mạch gốc được sao chép 2 lần Kếtquả sau lần nhân đôi thứ hai đã tạo một phân tử ADN mới có 7 đoạn CAG thay vì
6 đoạn
Trang 6- Phát hiện: Bằng cách sử dụng các cặp mồi được đánh dấu với các gốc huỳnhquang có màu khác nhau, người ta có thể nhân dòng các STR nhất định, rồi sau đóphân tích chúng bằng điện di Quy trình phân tích này sẽ cho biết có bao nhiêu lầnđơn vị lặp lại xuất hiện tại mỗi locus STR của mẫu
Nhờ có bước PCR, phương pháp này có thể sử dụng ngay cả khi chất lượng ADNtinh sạch không cao hoặc khi lượng mẫu thu được rất nhỏ Mỗi mấu mô chỉ cầnchứa khoảng 20 tế bào là có thể đủ cho việc nhân dòng bằng PCR
- Ứng dụng:
+ so sánh các mẫu ADN ở các đối tượng khác nhau trong điều tra hình sự
Ví dụ: Năm 1984, Earl Washington bị kết án tử hình do phạm tội hiếp dâm và giết Rebecca Williams vào năm 1982 Án này sau đó giảm xuống thành án chung thân năm 1993 do những nghi ngờ mới về bằng chứng Đến năm 2000, kĩ thuật phân tích STR được thực hiện bởi các nhà khoa học pháp y phối hợp với Dự án Vô tội khẳng định là Earl Washington vô can Kết quả phân tích STR được thể hiện ở bảng dưới đây:
Nguồn mẫu Dấu chuẩn STR1 Dấu chuẩn STR2 Dấu chuẩn STR3Tinh dịch để lại
Trang 72006, 18 người vô tội được giải phóng khỏi nhà tù trên cơ sở các bằng chứng pháp
+ xác định huyết thống
+ xác định các nạn nhân trong các vụ tai nạn hoặc thiên tai gây tử vong hàng loạt + xác định xác suất mắc một loại bệnh nhất định Ví dụ, số đơn vị lặp lại của trình
tự CGG tăng lên tại vị trí FRAXA thuộc NST X liên quan đến Hội chứng NST X
dễ gãy, đây là bệnh thiểu năng trí tuệ di truyền phổ biến nhất ở người NST X bìnhthường có từ 6-50 bản sao liên tiếp của CGG nhưng NST đột biến chứa tới 1000bản sao liên tiếp của đơn vị này Các đoạn trình tự lặp lại của CAG, CTG liên quanđến một số bệnh thần kinh di truyền ở người, bao gồm bệnh múa giật Huntinton,bệnh loạn dưỡng cơ, bệnh Kenedy, bệnh teo cơ Delta vàng da, bệnh mất điều hòatiểu não đỉnh Ở tất cả các bệnh này, mức độ nghiêm trọng của bệnh liên quan trựctiếp đến số đột biến lặp lại của các trình tự Khi số bản sao của các trình tự 3nucleotit càng cao, mức độ nghiêm trọng của bệnh càng tăng
3 Độ tin cậy của các dấu chuẩn di truyền
Tính đến năm 1992, các nhà nghiên cứu đã tập hợp được một bản đồ genliên kết ở người gồm khoảng 5000 dấu chuẩn khác nhau Bản đồ này đã giúp họxác định được vị trí của các dấu chuẩn khác bằng việc kiểm tra sự liên kết ditruyền của chúng với các dấu chuẩn đã biết trước đó
Các dấu chuẩn di truyền có thể được phân tích ở một người nhất định để xácđịnh một tập hợp các dấu chuẩn di truyền đặc trưng duy nhất của người đó gọi làtàng thư di truyền Thuật ngữ này được các nhà pháp y gọi là “dấu vân tay ADN”
Trang 8Tàng thư di truyền đã được sử dụng cho rất nhiều mục đích khác nhau trong xácđịnh huyết thống, điều tra hình sự, nhận dạng nạn nhân trong các tai nhạn thiênnhiên VD: sau vụ tấn công khủng bố Trung tâm Thương mại thế giới ở Mỹ năm
2001, hơn 10 000 mẫu sinh phẩm của các nạn nhân được lưu giữ và so sánh vớicác mẫu ADN thu được từ đồ dùng cá nhân như bàn chải đánh răng do gia đìnhcung cấp, các nhà pháp y đã nhận dạng thành công 3000 cá thể.Khi số dấu chuẩn được kiểm tra trong một mẫu ADN càng nhiều thì độ tin cậy vềviệc khớp một tàng thư di truyền với một cá nhân nhất định càng cao Trong điềutra hình sự, với việc phân tích đồng thời 13 locus STR thì xác suất để hai người cótàng thư di truyền giống hệt nhau rơi vào khoảng 1/10 tỉ Mặc dù vẫn có những saisót (lỗi của con người) khi phân tích từ các dữ liệu không đầy đủ hoặc từ các bằngchứng thiếu xác thực nhưng tàng thư di truyền hiện nay nhìn chung được côngnhân là những bằng chứng có tính thuyết phục cao bởi các chuyên gia pháp lí cũngnhư các nhà khoa học
4 Một số bài tập liên quan đến dấu chuẩn di truyền
Bài 1 (Trích đề IBO 2016)
Mr.Long đã phân tích các mẫu ADN của 3 gia đình bằng cách sử dụng 6 locutđoạn lặp ngắn kế tiếp (short tandem repeat - STR) nằm trên 6 nhiễm sắc thể thườngkhác nhau Mỗi locut STR thường có nhiều alen khác nhau và được kí hiệu bằngcác chữ số Ví dụ ở bảng dưới đây, với mẫu ADN của Huong ở locut 1 thì kí hiệu3/5 cho biết kiểu gen là dị hợp tử gồm alen 3 và alen 5 Trong gia đình thứ nhất, bốtên là Hung, mẹ tên là Huong và con trai của họ là Dung
Trong gia đình thứ 2, bố là Nhan, hai con trai là Tin và Nghia Trong gia đình thứ
3, bố là Phu và người con trai là Quy Mr.Long cũng sử dụng mẫu ADN của ngườikhông có quan hệ họ hàng với bất kỳ gia đình nào nêu trên, tên là Dat Các mẫuADN chưa xác định danh tính được đánh số ngẫu nhiên, trừ mẫu của Huong
Trang 9Hãy cho biết câu nào sau đây là đúng hay sai và điền vào phiếu trả lời
A Mẫu 735 là ADN của Dat
B Mẫu 669 là ADN của Nhan
C Mẫu 938 là ADN của Hung
D Mẫu 297 có thể là ADN của Phu
- Mẫu 653 không có liên quan gì đến 297 và 860 => 653 là Dat Hai mẫu 297 và
860 là Phu, Quy hoặc Quy, Phu
Trang 10cá thể Mỗi SNP thường chỉ có 2 alen Bảy cá thể được xác định kiểu gen ở 2 SNPtrên nhiễm sắc thể thường và 2 SNP trên ADN ti thể (mtDNA); 2 STR trên nhiễm
sắc thể thường và 2 STR liên kết nhiễm sắc thể Y (NRY) (Bảng Q.91).
Hãy cho biết câu nào sau đây là đúng hay sai và viết vào Phiếu trả lời
A Nếu sử dụng số lượng các SNP tương đương với số lượng STR, thì phân biệt
các cá thể bằng SNP tốt hơn so với STR
B Khả năng Ind_6 là con của Ind_2 và Ind_5 là cao hơn so với Ind_3.
C lnd_4 có thể là anh trai của lnd_6.
D lnd_7 có thể là cháu gái của ông bà lnd_1 và lnd_6.
A sai do sự đa hình của SNP thấp hơn sự đa hình của STR
Trang 11B sai khả năng người số 3 là con cao hơn Do người số 3 nhận NST Y từ người số
2 và nhận mtADN từ người số 5 Người số 6 không nhận mtADN từ người số 5
C đúng
D đúng do người 7 không nhất thiết nhận mtADN từ người 6 Người 7 có thể nhận
từ con trai của người 1 và 6
Bài 3 (Trích đề IBO 2013)
Ở một loài thực vật, lượng sắc tố anthocyanin được kiểm soát bởi một genđơn G Gen này có 2 alen, một alen màu sẫm và một alen màu sáng Để xác định vịtrí gen G chính xác trên NST số 3, người ta tiến hành lai 2 dòng thuần chủng (P1
và P2) và các cá thể F2 (từ X1 đến X5) được xác định kiểu gen ở 5 locut biến dịđơn nucleotit (kí hiệu từ SNV1 đến SNV5) trên cùng NST
Từ bảng số liệu trên, cho biết phát biểu dưới đây là đúng hay sai.
A Một sự kiện tái tổ hợp giữa các locut đã xảy ra ở cả bố lẫn mẹ của cá thể X2
B Các cá thể F1 nhiều khả năng biểu hiện lượng anthocyanin ở mức trung gian
C Trong các locut nghiên cứu, SNV3 gần gen G hơn cả
D Tỉ lệ kiểu hình ở thế hệ con của phép lai giữa X4 và X5 là 2:1
Đáp án: A Sai B Sai C Đúng D Sai
Giải thích
Trang 12A Sai Sự kiện tái tổ hợp chỉ diễn ra ở một cơ thể bố mẹ giữa locut 3 và 4 Cá thể
bố mẹ còn lại không có tái tổ hợp
B Sai Do cá thể X1 có kiểu gen giống với F1 nhưng không biểu hiện kiểu hìnhtrung gian
C Đúng Vì đây là locut duy nhất mà kiểu gen phù hợp với kiểu hình theo quy luậtMenden
D Sai Với sự di truyền trội-lặn như trên, không có bất kì phép lai nào cho tỉ lệ 2:1
Bài 4 (Trích đề IBO 2014)
Ở chủng tộc người Tây Tạng sống ở độ cao trên 4000 m, người ta đã pháthiện được một gen mã hóa cho protein 1 (epas1) chứa miền PAS nội biểu mô.EPAS1 là một yếu tố phiên mã liên quan đến đáp ứng với sự thiếu ôxi Một đa hình
đơn nucleotit (SNP) tại EPAS1 có liên quan tới số lượng tế bào hồng cầu trong
máu Tần số alen A của SNP ở người Tây Tạng là 78% cao hơn với tần số gen ởngười Trung Quốc
Hãy cho biết câu nào dưới đây là đúng hay sai?
A SNP này ảnh hưởng tới khả năng hấp thụ ôxi khi ở phân áp ôxi thấp
B Kết quả này cho thấy sự đáp ứng kiểu hình như vậy là do đa gen
C Trình tự axit amin của EPAS1 có thể thay đổi ở những người mang allen A
D SNP ở những người Tây Tạng có nhiều khả năng chịu sự chọn lọc cân bằng.Đáp án:
- Phát biểu đúng A, B, C
II DI TRUYỀN HỌC QUẦN THỂ
I Một số khái niệm cơ bản
- Quần thể: là một tập hợp các cá thể cùng loài, cùng sống trong một khoảng khônggian xác định, vào cùng một thời điểm nhất định, có khả năng sinh sản tạo ra cácthế hệ sau
Trang 13- Vốn gen: là tập hợp toàn bộ các alen của tất cả các gen trong quần thể ở một thờiđiểm xác định Mỗi quần thể có vốn gen đặc trưng, đặc điểm của vốn gen thể hiện
ở tần số các alen, tần số các kiểu gen của quần thể
Tần số alen của một gen nào đó được tính bằng tỉ lệ giữa số lượng alen đó trêntổng số các loại alen khác nhau của gen đó tại thời điểm xác định
Tần số của một kiểu gen nào đó trong quần thể được tính bằng tỉ lệ giữa số cáthể có kiểu gen đó trên tổng số cá thể có trong quần thể
Ví dụ: Một quần thể đậu Hà Lan gồm 410 cá thể có kiểu gen AA, 580 cá thể cókiểu gen Aa và 10 cá thể có kiểu gen aa Hãy tính tần số của các alen và tần số cáckiểu gen trong quần thể
Giải: Tổng số alen trong quần thể = (410 + 580 + 10) 2 = 2000
Số lượng alen A trong quần thể = (410.2) + 580 = 1400
Số lượng alen a trong quần thể = (10.2) + 580 = 600
Tần số alen A trong quần thể là p = = 0,7
Tần số alen a trong quần thể là q = = 0,3
Tần số kiểu gen AA trong quần thể = = 0,41
Tần số kiểu gen Aa trong quần thể = = 0,58
Tần số kiểu gen aa trong quần thể = = 0,01
Công thức tổng quát: Với một gen có 2 alen A và a Quần thể có thành phầnkiểu gen d(AA) : r(Aa) : r(aa) Gọi p, q lần lượt là tần số alen A, a (p + q = 1)
Trang 14Ta có: p(A) = d + = 1 – q(a) ; q(a) = r + = 1 – p(A).
II Cấu trúc di truyền của quần thể tự phối
1 Đặc trưng di truyền của quần thể tự phối
- Là các quần thể thực vật tự thụ phấn, các quần thể động vật lưỡng tính tự thụ tinh
và các quần thể động vật giao phối cận huyết (giao phối gần) thuộc về quần thể tựphối
- Tự phối qua nhiều thế hệ làm cho quần thể có tỉ lệ kiểu gen dị hợp tử ngày cànggiảm dần, tỉ lệ kiểu gen đồng hợp tử ngày càng tăng dần Vì vậy, vốn gen của quầnthể tự phối thường phân hoá thành các dòng thuần có kiểu gen khác nhau, làmgiảm tính đa dạng di truyền của quần thể
2 Sự biến đổi cấu trúc di truyền của quần thể tự phối
Quần thể ban đầu P có tần số các kiểu gen là x(AA) + y(Aa) + z(aa) = 1Sau n thế hệ tự phối Fn: [x + y( AA : Aa : [z + y( aa
* Chú ý: Trường hợp quần thể tự phối xét 1 gen có 2 alen, trong đó cá thể có
kiểu gen đồng hợp tử lặn gây chết ở giai đoạn phôi thì tần số alen và tần số kiểu gen của quần thể sau n thế hệ tự phối sẽ là:
- Tần số alen: qn = ( q là tần số alen a ở thế hệ xuất phát); pn = 1 - qn
III Cấu trúc di truyền của quần thể ngẫu phối
1 Đặc trưng di truyền của quần thể ngẫu phối
Trang 15- Các cá thể trong quần thể kết đôi giao phối với nhau một cách hoàn toàn ngẫunhiên Do đó tạo ra một số lượng rất lớn các biến dị tổ hợp là nguồn nguyên liệuchủ yếu của tiến hóa và chọn giống Đồng thời quần thể ngẫu phối có thể duy trì ổnđịnh tần số các kiểu gen khác nhau trong quần thể, qua các thế hệ ở những điềukiện nhất định.
- Quan hệ nổi bật giữa các cá thể trong quần thể là quan hệ về mặt sinh sản Do đóquần thể ngẫu phối là đơn vị sinh sản, đơn vị tồn tại của loài trong tự nhiên
- Quần thể ngẫu phối có tính đa hình về kiểu gen và kiểu hình
2 Trạng thái cân bằng di truyền của quần thể ngẫu phối – Định luật Weinberg
Hardy-a Nội dung định luật Hardy-Weinberg: Trong một quần thể ngẫu phối có kíchthước lớn, nếu không có các yếu tố làm thay đổi tần số alen thì thành phần kiểugen của quần thể được duy trì không đổi từ thế hệ này sang thế hệ khác theo đẳngthức: p2 AA + 2pq Aa + q2 aa = 1
Trường hợp gen gồm 2 alen: Xét một gen trên NST thường gồm 2 alen A và atrong quần thể ngẫu phối, có p(A) + q(a) = 1 Khi xảy ra ngẫu phối, quần thể sẽ đạttrạng thái cân bằng di truyền: [p(A) + q(a)]2 = p2(AA) + 2pq(Aa) + q2(aa) = 1
Mở rộng cho trường hợp xét một gen trên NST thường gồm nhiều alen trong quầnthể ngẫu phối thì trạng thái cân bằng di truyền: [p1(a1) + p2(a2) + … + pn(an)]2 = 1
b Điều kiện nghiệm đúng của định luật Hardy-Weinberg:
Quần thể phải có kích thước lớn
Các cá thể trong quần thể phải giao phối với nhau một cách ngẫu nhiên
Các cá thể có kiểu gen khác nhau phải có sức sống và khả năng sinh sản như nhau
Không xảy ra đột biến, nếu có thì tần số đột biến thuận phải bằng tần số đột biến nghịch
Quần thể được cách ly với quần thể khác
* Nhận xét:
Trang 16 Trong thực tế, một quần thể khó có thể đáp ứng được tất cả các điều kiện trên.Nếu tần số alen và thành phần kiểu gen liên tục biến đổi, đó sẽ là trạng thái độngcủa quần thể.
Một quần thể có thể ở trạng thái cân bằng về thành phần kiểu gen này nhưng lạikhông cân bằng về thành phần kiểu gen khác
và chọn giống
III Các dạng bài tập di truyền quần thể
3.1 Bài tập về quần thể tự phối
a Dạng 1: Cho thành phần kiểu gen của thế hệ P, qua n thế hệ tự phối, tìm thành phần kiểu gen của thế hệ F n ? Hoặc cho F n và n, tìm thành phần kiểu gen của thế hệ P?
- Phương pháp giải: Áp dụng công thức: Thế hệ P ban đầu x(AA): y(Aa): z(aa)
Sau n thế hệ thì thành phần các kiểu gen là: AA = x + y( ; Aa = ; Aa = z + y(