Nghiên cứu đa hình một số gen liên quan đến tính trạng tăng trưởng ở cá tra nuôi (Pangasianodon hypophthalmus)Nghiên cứu đa hình một số gen liên quan đến tính trạng tăng trưởng ở cá tra nuôi (Pangasianodon hypophthalmus)Nghiên cứu đa hình một số gen liên quan đến tính trạng tăng trưởng ở cá tra nuôi (Pangasianodon hypophthalmus)Nghiên cứu đa hình một số gen liên quan đến tính trạng tăng trưởng ở cá tra nuôi (Pangasianodon hypophthalmus)Nghiên cứu đa hình một số gen liên quan đến tính trạng tăng trưởng ở cá tra nuôi (Pangasianodon hypophthalmus)Nghiên cứu đa hình một số gen liên quan đến tính trạng tăng trưởng ở cá tra nuôi (Pangasianodon hypophthalmus)Nghiên cứu đa hình một số gen liên quan đến tính trạng tăng trưởng ở cá tra nuôi (Pangasianodon hypophthalmus)Nghiên cứu đa hình một số gen liên quan đến tính trạng tăng trưởng ở cá tra nuôi (Pangasianodon hypophthalmus)Nghiên cứu đa hình một số gen liên quan đến tính trạng tăng trưởng ở cá tra nuôi (Pangasianodon hypophthalmus)Nghiên cứu đa hình một số gen liên quan đến tính trạng tăng trưởng ở cá tra nuôi (Pangasianodon hypophthalmus)Nghiên cứu đa hình một số gen liên quan đến tính trạng tăng trưởng ở cá tra nuôi (Pangasianodon hypophthalmus)Nghiên cứu đa hình một số gen liên quan đến tính trạng tăng trưởng ở cá tra nuôi (Pangasianodon hypophthalmus)Nghiên cứu đa hình một số gen liên quan đến tính trạng tăng trưởng ở cá tra nuôi (Pangasianodon hypophthalmus)Nghiên cứu đa hình một số gen liên quan đến tính trạng tăng trưởng ở cá tra nuôi (Pangasianodon hypophthalmus)Nghiên cứu đa hình một số gen liên quan đến tính trạng tăng trưởng ở cá tra nuôi (Pangasianodon hypophthalmus)Nghiên cứu đa hình một số gen liên quan đến tính trạng tăng trưởng ở cá tra nuôi (Pangasianodon hypophthalmus)Nghiên cứu đa hình một số gen liên quan đến tính trạng tăng trưởng ở cá tra nuôi (Pangasianodon hypophthalmus)Nghiên cứu đa hình một số gen liên quan đến tính trạng tăng trưởng ở cá tra nuôi (Pangasianodon hypophthalmus)Nghiên cứu đa hình một số gen liên quan đến tính trạng tăng trưởng ở cá tra nuôi (Pangasianodon hypophthalmus)1 BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ Trần Thị Huyền Trang NGHIÊN CỨU ĐA HÌNH MỘT SỐ GEN LIÊN QUAN ĐẾN TÍNH TRẠNG TĂNG TRƯỞNG Ở CÁ TRA NUÔ.
1 BỘ GIÁO DỤC VÀ ĐÀO TẠO VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM HỌC VIỆN KHOA HỌC VÀ CÔNG NGHỆ - Trần Thị Huyền Trang NGHIÊN CỨU ĐA HÌNH MỘT SỐ GEN LIÊN QUAN ĐẾN TÍNH TRẠNG TĂNG TRƯỞNG Ở CÁ TRA NI (Pangasianodon hypophthalmus) Chun ngành: Cơng nghệ sinh học Mã số: 42 02 01 TÓM TẮT LUẬN ÁN TIẾN SĨ SINH HỌC Hà Nội – Năm 2023 Công trình hồn thành tại: Học viện Khoa học Công nghệ Viện Hàn lâm Khoa học Công nghệ Việt Nam Người hướng dẫn khoa học: TS Kim Thị Phương Oanh Phản biện 1: … Phản biện 2: … Phản biện 3: … Luận án bảo vệ trước Hội đồng đánh giá luận án tiến sĩ cấp Học viện, họp Học viện Khoa học Công nghệ - Viện Hàn lâm Khoa học Công nghệ Việt Nam vào hồi … ’, ngày … tháng … năm 2023 Có thể tìm hiểu luận án tại: - Thư viện Học viện Khoa học Công nghệ - Thư viện Quốc gia Việt Nam MỞ ĐẦU Tính cấp thiết luận án Cá tra ni (Pangasianodon hypophthalmus) lồi cá vùng lưu vực sơng Mê Kông sông ChaoPhraya (Thái Lan), nuôi phổ biến có giá trị kinh tế lớn Việt Nam số nước khác Theo định 50/2018/QĐ-TTg Thủ tướng phủ, cá tra đối tượng nuôi chủ lực nước ta phục vụ xuất tiêu thụ nước Tuy nhiên nghề nuôi cá tra Việt Nam gặp nhiều thách thức lớn chất lượng giống ngày giảm sút, hàng năm dịch bệnh xảy làm thiệt hại lớn cho người nuôi Để phát triển bền vững ngành sản xuất cá tra, nhiệm vụ cấp thiết cần thực nâng cao chất lượng nguồn giống Trong đó, hướng tìm kiếm thị phân tử, đặc biệt SNP gen đích liên quan đến tính trạng tăng trưởng tiềm Hệ thống yếu tố tăng trưởng tương tự insulin (Insulinlike Growth Factor (IGF)) bao gồm phối tử IGF1, IGF2, thụ thể tương ứng IGF (IGF Receptor (IGFR)) protein bám vào IGF (IGF binding proteins (IGFBPs)) Sự tương tác IGF, IGFR IGFBP protein khác chuỗi dẫn truyền tín hiệu dẫn tới q trình sinh trưởng, biệt hóa tăng sinh tế bào động vật có xương sống nói chung cá xương nói riêng Do đó, nghiên cứu đa hình số gen thuộc hệ thống IGF liên quan đến tính trạng tăng trưởng cá tra ni (P hypophthalmus) cần thiết, góp phần tìm thị phân tử hỗ trợ chọn giống cá tra nuôi theo hướng tăng trưởng nhanh, phục vụ nhu cầu ngành nuôi trồng thủy sản nước ta Mục tiêu nghiên cứu luận án Nghiên cứu phát đa hình SNP số gen thuộc hệ thống IGF kiểm nghiệm liên quan SNP với tính trạng tăng trưởng cá tra nuôi (Pangasianodon hypophthalmus), đề xuất số thị phân tử tiềm hướng tới ứng dụng chương trình chọn giống cá tra theo hướng tăng trưởng Các nội dung nghiên cứu luận án - Phân tích cấu trúc gen IGF1, IGF2, IGF1R, IGFBP-1, -2, -3, -5, -6, -7 thuộc hệ thống IGF cá tra ni, tìm vùng quan trọng để xác định đa hình SNP giải trình tự vùng cá thể phương pháp Sanger để kiểm tra tính xác thực trình tự so với trình tự tham chiếu - Giải trình tự vùng quan trọng thuộc gen nêu trên mẫu khởi tạo gồm 10 cá thể tăng trưởng nhanh 10 cá thể tăng trưởng chậm phương pháp Sanger, so sánh trình tự tương ứng thu với trình tự tham chiếu để phát SNP gen sàng lọc SNP - Xác định kiểu gen (genotyping) SNP sàng lọc mẫu kiểm nghiệm gồm 70 cá thể tăng trưởng nhanh 70 cá thể tăng trưởng chậm phương pháp kéo dài nucleotide (SBE) - Phân tích liệu SNP thu từ mẫu khởi tạo mẫu kiểm nghiệm, gồm tổng cộng 80 cá thể tăng trưởng nhanh 80 cá thể tăng trưởng chậm, phân tích liên quan SNP sàng lọc, haplotype, tổ hợp kiểu gen liên quan với tính trạng tăng trưởng cá tra nuôi CHƯƠNG TỔNG QUAN 1.1 Giới thiệu chung cá tra ni Pangasianodon hypophthalmus Lồi cá tra ni Pangasianodon hypophthalmus (Sauvage, 1878) có tên gốc Helicophagus hypophthalmus (Sauvage, 1878), hay cịn có tên khác Pangasius sutchi, thuộc chi Pangasius, họ cá tra (Pangasiidae), cá da trơn hay cá nheo (Siluriformes), loài cá nuôi phổ biến vùng lưu vực sông Mê Kông (Việt Nam, Thái Lan, Lào, Campuchia) sông ChaoPhraya (Thái Lan) Căn Quyết định số 50/2018/QĐ-TTg Thủ tướng phủ, cá tra đối tượng thủy sản nuôi chủ lực nước ta, phục vụ xuất tiêu thụ nước Trong năm 2022, ngành cá tra dự kiến kim ngạch xuất đạt 1,6 tỷ USD Để đạt mục tiêu đề ra, Bộ Nông nghiệp Phát triển Nông thôn yêu cầu địa phương nâng cao chất lượng giống cá tra, đạo sản xuất cung ứng đủ giống chất lượng cao để nâng cao hiệu sản xuất, giảm hao hụt, hạ giá thành sản xuất Năm 2018, toàn hệ gen cá tra nuôi (P hypophthalmus) giải mã NGS với kích thước hệ gen nhân khoảng 700 Mbp, chứa 28600 gen mã hóa protein, sử dụng làm hệ gen tham chiếu, sở phát triển nghiên cứu tìm kiếm thị phân tử liên quan đến tính trạng quan tâm phục vụ chọn giống 1.2 Tăng trưởng (phát triển cơ) cá gen liên quan Phát triển trình tăng trưởng quan trọng cá điều khiển hệ trục hormone liên quan đến sinh trưởng, có hệ thống nhân tố tăng trưởng tương tự insulin (IGF) Nhiều nghiên cứu mối liên quan đa hình gen thuộc hệ trục hormone liên quan đến tăng trưởng, đặc biệt gen thuộc hệ thống IGF tính trạng tăng trưởng cá xương 1.3 Vai trò, chức đặc điểm cấu trúc số gen /protein thuộc hệ thống IGF Hệ thống yếu tố tăng trưởng tương tự insulin (Insulin-like Growth Factor (IGF)) bao gồm phối tử IGF1, IGF2, thụ thể tương ứng IGF (IGF Receptor (IGFR)) protein bám vào IGF (IGF binding proteins (IGFBPs)) Sự tương tác IGF, IGFR IGFBP protein khác chuỗi dẫn truyền tín hiệu dẫn tới q trình sinh trưởng, biệt hóa tăng sinh tế bào IGF1 IGF2 thúc đẩy tăng trưởng cách tăng cường phân chia biệt hóa tế bào vệ tinh xương, kích thích sinh tổng hợp protein phát triển phình cơ, đồng thời ức chế phân hủy protein teo Phối tử IGF truyền tín hiệu thơng qua IGF1R –một thụ thể tyrosine kinase IGF2R có khả bám cao với IGF2 theo hướng để phân hủy IGF2 Các IGFBP điều khiển hoạt tính sinh học IGF mơi trường ngoại bào, từ tác động đến khả bám phối tử IGF với thụ thể Các IGFBPs thuộc họ protein tiết, chia làm loại từ IGFBP-1 đến -6, có lực cao với IGF Ngồi ra, IGFBP-7 hay gọi IGFBP-rP1 (thuộc loại protein liên quan với IGFBP (IGFBP related proteins (IGFBP-rPs)) có cấu trúc tương đồng với IGFBP, có lực với IGF thấp IGFBP-1 đến -6 Trong cấu trúc gen IGF1 lớp thú có exon lớp cá, gen có exon Cấu trúc gen IGF2 loài cá so sánh với cấu trúc gen IGF2 lớp thú cho thấy phức tạp hơn, ổn định với exon Cấu trúc gen IGF1Ra IGF1Rb loài cá gồm 21 exon, cách intron với kích thước đa dạng Các gen IGFBP từ đến chứa exon quy định IGFBP có chung cấu trúc bảo thủ với hai domain chức IGFBP đầu N thyroglobulin tuýp đầu C, nối với domain nối 1.4 Cơ sở tiến hành xác định đa hình đơn nucleotit (SNP) số gen thuộc hệ thống IGF liên quan đến tính trạng tăng trưởng cá tra ni Vai trị quan trọng SNP việc xác định thị phân tử liên quan đến tính trạng quan tâm quy mơ hệ gen lẫn quy mơ gen đích chứng minh Trong thủy sản, SNP thường sử dụng rộng rãi việc xác định thị phân tử tiềm liên quan đến tính trạng chọn giống, kinh tế tăng trưởng, chống chịu bệnh Ở quy mơ tìm kiếm SNP tiềm gen đích, phương pháp SNP genotyping dựa nguyên lý PCR sử dụng đầu dị, hay giải trình tự phát triển, ứng dụng rộng rãi Trong đó, phương pháp kéo dài nucleotit (Single Base Extension –SBE) phát tetra – allelic SNPs với độ nhạy đặc hiệu cao khả giải trình tự tự động thời gian ngắn Các nghiên cứu SNP số gen thuộc hệ thống IGF cá xương mối liên quan SNP gen IGF1, IGF2, IGF1R kiểu gen đơn bội (haplotype), tổ hợp kiểu gen phát sinh với tính trạng tăng trưởng loài cá như: cá hồi Đại Tây Dương Salmo salar, cá chép Cyprinus carpio, cá vược châu Âu Dicentrarchus labrax, cá rô phi sông Nin Oreochromis niloticus, cá địa Trung Quốc Odontobutis potamophila Từ hệ gen tham chiếu, gen thuộc hệ thống IGF cá tra nuôi xác định gồm gen quy định cho IGF1, gen quy định cho IGF2, gen quy định IGF1R, 11 gen quy định IGFBP gồm IGFBP-1, -2, -3, -5, -6, -7, sử dụng để thiết kế thí nghiệm phân tích đa hình gen liên quan đến tính trạng quan tâm CHƯƠNG NGUYÊN VẬT LIỆU VÀ PHƯƠNG PHÁP 2.1 Nguyên vật liệu Các cá thể cá tra nuôi (P hypophthalmus) sử dụng luận án kế thừa từ đề tài nghiên cứu trước Cụ thể, 160 cá thể chọn lọc từ hệ thứ (G3) cộng gộp (năm 2015) quần đàn chọn giống cá tra theo hướng tăng trưởng dựa phương pháp di truyền số lượng Viện Nghiên cứu Nuôi trồng Thủy sản 2, Việt Nam Trong đó, 20 cá thể thuộc mẫu khởi tạo sử dụng để phát sàng lọc SNP gồm: 10 cá thể tăng trưởng nhanh có giá trị chọn giống ước đoán (EBV) cá thể cao thuộc gia đình có EBV gia đình cao 10 cá thể tăng trưởng chậm có EBV cá thể thấp thuộc gia đình có EBV gia đình thấp Bộ mẫu kiểm nghiệm gồm 140 cá thể sử dụng để xác định SNP sàng lọc quy mô lớn gồm: 70 cá thể tăng trưởng nhanh có EBV cá thể cao thuộc 24 gia đình có EBV gia đình cao theo thứ tự xếp hạng 70 cá thể tăng trưởng chậm có EBV cá thể thấp thuộc 31 gia đình có EBV gia đình thấp theo thứ tự xếp hạng 2.2 Phương pháp 2.2.1 Phân tích cấu trúc gen đích Dựa trình tự tham chiếu gen IGF1, IGF2, IGF1R, IGFBP-1, -2, -3, -5, -6, -7 cá tra nuôi giải mã NGS, cấu trúc gen/protein suy diễn phân tích phần mềm BLASTn, ProteinBLAST (blastp), SignalP5.0 để xác định vùng gen quan trọng quy định domain chức năng, chuỗi peptit tín hiệu protein, vùng điều hòa phiên mã, dịch mã để giải mã nhiều cá thể nhằm phát SNP 2.2.2 Tách chiết DNA tổng số DNA tổng số từ tế bào mô vây tách chiết theo phương pháp thường quy sử dụng phenol: chloroform, sau kiểm tra nồng độ chất lượng quang phổ kế NanoDrop One Spectrophotometer (Thermo Fisher Scientific) điện di gel agarose % 2.2.3 Khuếch đại gen phản ứng PCR Để khuếch đại đoạn gen IGF1, IGF2, IGF1R, IGFBP-1, -2, -3, 5, -6, -7 xác định, DNA tổng số tách chiết từ mẫu vây cá tra dùng làm khuôn cho phản ứng PCR với 55 cặp mồi thiết kế phần mềm Primer (v.0.4.0) Sản phẩm PCR sau điện di kiểm tra kích thước gel agarose 1% tinh kit Thermo Scientific GeneJET PCR Purification Kit (Thermo Fisher Scientific) theo hướng dẫn nhà sản xuất 2.2.4 Giải trình tự gen IGF1, IGF2, IGF1R, IGFBP-1, -2, -3, -5, -6, -7 phương pháp Sanger Các sản phẩm PCR tinh sử dụng làm khuôn cho phản ứng PCR giải trình tự sử dụng kit BigDye Terminator v3.1 Cycle Sequencing Kit (ThermoFisher Scientific) theo hướng dẫn nhà sản xuất Các sản phẩm PCR giải trình tự tinh điện di mao quản hệ thống ABI®3500 Genetic Analyzer (Applied Biosystems) Kết giải mã thu từ máy giải trình tự biên tập phần mềm BioEdit 2.2.5 Kiểm tra tính xác thực kết giải mã Sanger so với trình tự tham chiếu Trình tự gen đích thuộc hệ thống IGF cá thể cá tra nuôi giải mã Sanger so sánh với trình tự tham chiếu phần mềm BLASTn để tìm mức độ tương đồng, phản ánh tính xác thực trình tự giải mã Sanger so với trình tự tham chiếu 2.2.6 Phát sàng lọc SNP gen đích mẫu khởi tạo Để phát SNP, trình tự nucleotit đoạn xác định 20 cá thể thuộc mẫu khởi tạo giải mã phương pháp Sanger, sau so sánh với trình tự tham chiếu tương ứng giải mã NGS thông qua phần mềm MUSCLE Trong số SNP phát hiện, SNP đánh giá sàng lọc SNP xác định 20 cá thể (số lượng cá thể không xác định SNP (NN) = 0), gây nên thay đổi axit amin protein tương ứng (1), đảm bảo có tần số xuất SNP đạt 0,3 nhóm trở lên (2) thành phần kiểu gen và/hoặc thành phần alen nhóm khác biệt có ý nghĩa thống kê (3), (4) (giá trị p C, 15392 T>A 83894 A>G, nên sàng lọc để kiểm nghiệm mẫu lớn (Bảng 3.3) 3.3.4 Phát sàng lọc SNP gen IGFBP-1 Bốn SNP phát gen này, có SNP thuộc vùng promoter SNP thuộc vùng intron Tuy nhiên, khơng có SNP đạt đủ tiêu chí để sàng lọc 3.3.5 Phát sàng lọc SNP gen IGFBP-2 Mười SNP phát gen IGFBP-2 gồm SNP thuộc vùng mã hóa, khơng làm thay đổi trình tự axit amin SNP nằm vùng khơng mã hóa, khơng có SNP đạt đủ tiêu chí để sàng lọc 3.3.6 Phát sàng lọc SNP gen IGFBP-3 Mười SNP phát hiện, gồm SNP thuộc intron SNP thuộc vùng 5’UTR, vùng mã hóa (CDS) vùng 3’-UTR Hình 3.9: Kết phát IGFBP-3.704 C>G gen IGFBP-3 thơng qua so sánh trình tự tương ứng giải mã phương pháp Sanger với trình tự tham chiếu REF: trình tự tham chiếu N1 - N10: trình tự 10 cá thể cá tra tăng trưởng nhanh C1 C10: trình tự 10 cá thể cá tra tăng trưởng chậm Mũi tên khung màu đỏ: vị trí SNP phát cá thể 12 SNP 704C>G exon (Hình 3.9) nằm vùng mã hóa làm thay đổi trình tự axit amin thứ Leucine thành Valine, nên SNP sàng lọc để kiểm nghiệm mẫu lớn Các SNP cịn lại nằm vùng khơng mã hóa khơng đạt đủ tiêu chí để sàng lọc 3.3.7 Phát sàng lọc SNP gen IGFBP-5 Bốn SNP phát gen thuộc exon, đó, SNP 525T>A exon gây thay đổi trình tự axit amin thứ 16 Valine thành axit Glutamic sàng lọc để kiểm nghiệm lại mẫu lớn (Hình 3.10) Ba SNP cịn lại khơng đạt đủ tiêu chí để sàng lọc Hình 3.10 Kết phát IGFBP-5.525 T>A gen IGFBP-5 thơng qua so sánh trình tự tương ứng giải mã phương pháp Sanger với trình tự tham chiếu REF: trình tự tham chiếu N1 - N10: trình tự 10 cá thể cá tra tăng trưởng nhanh C1 C10: trình tự 10 cá thể cá tra tăng trưởng chậm Mũi tên khung màu đỏ: vị trí SNP phát cá thể 3.3.8 Phát sàng lọc SNP gen IGFBP-6 Mười bảy SNP phát gen IGFBP-6, thuộc vùng khơng mã hóa Trong đó, có SNP có tần số xuất SNP đạt 0,3 nhóm trở lên gồm: 560 A>G, 2275 C>A, 2278 C>A, 2423 G>T, 3177 T>C, 3469 T>C 3505 G>A (Bảng 3.8, trích) Tuy nhiên, có SNP 2278 C>A sàng lọc có khác biệt có ý nghĩa thành phần kiểu gen (p = 0,02) (Bảng 3.8, trích) 13 Bảng 3.8 Các SNP phát gen IGFBP-6 (trích) STT Vị trí SNP gen I1_560(2) Ref Alt Thành phần kiểu gen Thành phần alen TTN (a) TTC (a) TTN TTC * A G 6AA:2AG:2GG 8AA:1AG:1GG 14A:6G 17A:3G (0,50) (0,22) p = 0,52 p = 0,45 (2) * 11 I3_2275 C A 8CC:2AA 5CC:5AA 16C:4A 10C:10A (0,25) (1,00) p = 0,35 p = 0,09 12 I3_2278(2,4) C A* 8CC:2AA 4CC:6AA 16C:4A 8C:12A (0,25) (1,50) p = 0,17 p = 0,02 13 I3_2423(2) G T* 6GG:4TT 4GG:6TT 12G:8T 8G:12T (0,67) (1,50) p = 0,66 p = 0,34 * 15 E4_3’UTR T C 6TT:4CC 6TT:4CC 12T:8C 12T:8C 3177(2) (0,67) (0,67) p = 1,0 p = 1,0 * 16 E4_3’UTR T C 3TT:2TC:5CC 1TT:9CC 8T:12C 2T:18C 3469(2) (0,71) (0,11) p = 0,13 p = 0,06 * 17 E4_3’UTR G A 7GG:3AA 6GG:4AA 14G:6A 12G:8A 3505(2) (0,43) (0,67) p = 1,0 p = 0,74 * a : alen thiểu số, TTN: tăng trưởng nhanh, TTC: tăng trưởng chậm, ( ): Tần số xuất SNP nhóm, (2), (4): đáp ứng tiêu chí sàng lọc SNP số 2, tương ứng 3.3.9 Phát sàng lọc SNP gen IGFBP-7 Bảng 3.9 Các SNP phát gen IGFBP-7 (trích) STT 12 Vị trí SNP gen Ref E1 - CDS 344 (1) I2 2060(2,3,4) T* A Alt Thành phần kiểu gen a Thành phần alen a TTN ( ) TTC ( ) TTN TTC C 1TT:2TC:7CC 3TT:3TC:4CC 4T:16C 9T:11C G* 10GG (0,00) 20G 8A:12G 3AA:2AG:5GG (1,40) p = 0,02 p = 0,003 E3 - CDS C* A 2CC:3CA:5AA 10AA 7C:13A 20A (1) 4559 * : alen thiểu số, TTN: tăng trưởng nhanh, TTC: tăng trưởng chậm, (a): Tần số xuất SNP nhóm, (1), (2), (3), (4): đáp ứng tiêu chí sàng lọc SNP số 1, tương ứng 20 Có 27 SNP phát gen IGFBP-7, SNP gây thay đổi axit amin 344 T>C (p.Leu78Pro) 4559 C>A (p.Leu189Met) (Bảng 3.9, trích) Trong SNP cịn lại, 17 SNP có tần số xuất SNP đạt 0,3 nhóm trở lên, bao gồm -376 T>G promoter, 561 G>A, 598 C>A, 1052 T>A, 1117 C>G, 1160 G>C 1216 C>A intron 1, 2060 A>G, 2138 T>C, 3981 T>G, 4058 A>G, 4334 G>A 4465 C>T intron 2, 4685 T>C intron 3, 7405 C>T, 7676 G>C 7692 T>C 14 intron Tuy nhiên, có SNP 2060 A>G đạt tiêu chí khác biệt có ý nghĩa thành phần kiểu gen/thành phần alen hai nhóm tăng trưởng nhanh/chậm (với giá trị p nhỏ 0,05) (Bảng 3.9, trích) Do vậy, SNP 344 T>C (p.Leu78Pro), 2060 A>G 4559 C>A (p.Leu189Met) sàng lọc để tiếp tục genotyping mẫu lớn 3.4 Phân tích liên quan đến tính trạng tăng trưởng SNP sàng lọc 3.4.1 SNP genotyping cá thể thuộc mẫu kiểm nghiệm Các đoạn gen chứa 10 SNP sàng lọc gen IGF1, IGF1R, IGFBP-3, -5, -6, -7 140 cá thể thuộc mẫu kiểm nghiệm phân lập thành công, làm khuôn cho phản ứng SBE xác định SNP Dữ liệu SNP thu từ tổng cộng 160 cá thể mẫu khởi tạo mẫu kiểm nghiệm gộp lại để phân tích liên quan SNP sàng lọc tính trạng tăng trưởng 3.4.2 Phân tích mối liên quan SNP sàng lọc tính trạng tăng trưởng cá tra nuôi 3.4.2.1 SNP sàng lọc gen IGF1 Sự khác biệt thành phần kiểu gen phát sinh từ SNP IGF1.13680 A>T hai nhóm tăng trưởng nhanh/chậm có ý nghĩa với p 0,009 (Bảng 3.11), cho thấy SNP có liên quan đến tính trạng tăng trưởng Bảng 3.11 Phân tích mối liên quan SNP 13680 A>T gen IGF1 với tính trạng tăng trưởng cá tra ni Các thơng số Thành phần kiểu gen (b) Nhóm tăng trưởng nhanh AA (18) AT (61) TT (01) Nhóm tăng trưởng chậm AA (07) AT (64) TT (07) NN (02) A (78) T (78) p 0,009** Thành phần A (97) 0,06 alen (c) T (63) PIC 0,494 MAF 0,446 (b): Số lượng cá thể mang kiểu gen tương ứng, NN: cá thể không xác định kiểu gen, (c): số lượng alen tương ứng, **: p < 0,01 3.4.2.2 Các SNP sàng lọc gen IGF1R Trong số SNP sàng lọc gen IGF1R 13357 T>C, 15392T>A 83894 A>G, SNP 13357 T>C thể khác biệt thành phần kiểu gen nhóm tăng trưởng nhanh nhóm tăng trưởng chậm (giá trị p 0,03) (Bảng 3.12) 15 Bảng 3.12 Phân tích mối liên quan SNP gen IGF1R với tính trạng tăng trưởng cá tra ni Thành phần kiểu gen (b) Thành phần alen (c) PIC MAF TTN TTC p TTN TTC p TT (32) TT (26) 0,03* T (111) T (96) 0,11 0,454 0,349 TC (47) TC (44) C (49) C (62) CC (01) CC (09) NN (01) 15392 TT (06) TT (10) 0,35 T (80) T (84) 0,74 0,495 0,450 T>A TA (68) TA (64) A (68) A (66) AA (01) NN (06) NN (05) 83894 AA (09) AA (02) 0,06 A (84) A (73) 0,22 0,499 0,491 A>G AG (66) AG (69) G (76) G (87) GG (05) GG (09) TTN: Tăng trưởng nhanh, TTC: Tăng trưởng chậm, (b): Số lượng cá thể mang kiểu gen tương ứng, NN: cá thể không xác định kiểu gen, (c): số lượng alen tương ứng, *: p < 0,05 Tên SNP 13357 T>C Kết phân tích haplotype cho thấy haplotype IGF1R_H1 (CAA), H4 (TTA) H5 (TTG) có mối liên quan chặt chẽ với nhóm tăng trưởng nhanh (pA A>G C A A IGF1R_H1 TTN (d) TTC (d) P 35,39 (0,239) 10,18 (0,068) 2,73e-5*** C T G IGF1R_H2 3,77 (0,025) 46,79 (0,312) 7,47e-11*** T A A IGF1R_H3 28,96 (0,196) 54,78 (0,365) 0,001** T T A IGF1R_H4 11,15 (0,075) 1,01(0,007) 0,002** T T G IGF1R_H5 62,59 (0,423) 34,17 (0,228) 0,00018*** TTN: Tăng trưởng nhanh, TTC: Tăng trưởng chậm, (d): tần số xuất haplotype nhóm, haplotype có tần số xuất hai nhóm nhỏ 0,03 khơng phân tích giá trị p, **pG (p.Leu8Val) gen IGFBP-3 với tính trạng tăng trưởng cá tra ni Các thơng số Thành phần kiểu gen (b) Nhóm tăng trưởng nhanh CG (45) GG (35) Nhóm tăng trưởng chậm CG (26) GG (53) NN (01) C (26) G (132) p 0,03* Thành phần C (45) 0,013* alen (c) G (115) PIC 0,347 MAF 0,223 b ( ): Số lượng cá thể mang kiểu gen tương ứng, NN: cá thể không xác định kiểu gen, (c): số lượng alen tương ứng, *p < 0,05 3.4.2.4 SNP sàng lọc gen IGFBP-5 Thành phần kiểu gen thành phần alen phát sinh từ SNP 525 T>A (p.Val16Glu) khác biệt có ý nghĩa hai nhóm tăng trưởng nhanh/chậm (với giá trị p nhỏ 0,001) (Bảng 3.16) Bảng 3.16 Phân tích mối liên quan SNP 525 T>A (p.Val16Glu) gen IGFBP-5 với tính trạng tăng trưởng cá tra ni Các thơng số Nhóm tăng trưởng nhanh Thành phần TT (07) kiểu gen (b) TA (69) AA (03) NN (01) Thành phần T (83) alen (c) A (75) PIC 0,459 MAF 0,357 Nhóm tăng trưởng chậm p TT (41) 1,13e-8*** TA (37) NN (02) T (119) A (37) 1,14e-5*** (b): Số lượng cá thể mang kiểu gen tương ứng, NN: cá thể không xác định kiểu gen, (c): số lượng alen tương ứng, *p < 0,05, **: p < 0,01 3.4.2.5 SNP sàng lọc gen IGFBP-6 SNP 2278 C>A gen IGFBP-6 sau kiểm nghiệm khơng cho thấy khác biệt có ý nghĩa thành phần kiểu gen hay thành phần alen hai nhóm tăng trưởng nhanh/chậm 3.4.2.6 Các SNP sàng lọc gen IGFBP-7 Kết kiểm nghiệm cho thấy SNP 344 T>C (p.Leu78Pro) khác thành phần kiểu gen/thành phần alen hai nhóm tăng trưởng nhanh/chậm, với giá trị p lớn 0,05 SNP 2060 A>G thể khác biệt có ý nghĩa thành phần kiểu gen/thành phần alen hai nhóm tăng trưởng nhanh/chậm, với hai giá trị p nhỏ 0,001 SNP 4559 C>A (p.Leu189Met) thể khác biệt thành phần kiểu gen hai nhóm với p nhỏ 0,05 17 (Bảng 3.18) Như vậy, SNP 2060 A>G 4559 C>A (p.Leu189Met) coi thị SNP tiềm liên quan đến tính trạng tăng trưởng cá tra nuôi Bảng 3.18 Phân tích mối liên quan SNP gen IGFBP-7 với tính trạng tăng trưởng cá tra ni Thành phần kiểu gen (b) Thành phần alen (c) PIC Nhóm Nhóm p Nhóm Nhóm p tăng tăng tăng tăng trưởng trưởng trưởng trưởng nhanh chậm nhanh chậm 344 TT (01) TT (03) 0,165 T (58) T (50) 0,43 0,449 T>C TC (56) TC (44) C (102) C (106) CC (23) CC (31) NN (02) 2060 AA (04) AA (35) 1,01e-9*** A (54) A (107) 6,34e- 0,499 A>G AG (46) AG (37) G (106) G (49) 10*** GG (30) GG (06) NN (02) 4559 CC (04) CC (03) 0,047* C (15) C (24) 0,104 0,216 C>A CA (07) CA (18) A (145) A (132) AA (69) AA (57) (b): Số lượng cá thể mang kiểu gen tương ứng, NN: cá thể không xác định (c): số lượng alen tương ứng, *: p < 0,05 **: p < 0,01, ***: p < 0,001 Tên SNP MAF 0,342 0,491 0,123 kiểu gen, Tạo nên từ SNP sàng lọc gen IGFBP-7, haplotype IGFBP-7_H1 (CAA) H2 (CAC) có mối liên quan với nhóm tăng trưởng chậm với giá trị p nhỏ 0,001 Trong đó, haplotype IGFBP-7_H3 (CGA) H4 (CGC) tương quan chặt chẽ với nhóm tăng trưởng nhanh với giá trị p nhỏ 0,001 p nhỏ 0,01, tương ứng (Bảng 3.20) Bảng 3.20 Phân tích mối liên quan haplotype phát sinh từ SNP gen IGFBP-7 lên tính trạng tăng trưởng Haplotype tạo nên từ SNP 344 2060 4559 Ký hiệu T>C A>G C>A C A A IGFBP7_H1 TTN (d) TTC (d) p 20,32 (0,127) 58,84 (0,377) 2,97e-7*** C A C IGFBP7_H2 2,75 (0,017) 22,13 (0,142) 3,97e-5*** C G A IGFBP7_H3 66,69 (0,417) 23,17 (0,148) 1,31e-7*** C G C IGFBP7_H4 12,25 (0,077) 1,86 (0,012) 0,0054** T A A IGFBP7_H5 30,93 (0,193) 26,02 (0,167) 0,54 T G A IGFBP7_H6 27,07 (0,169) 23,97 (0,154) 0,708 d TTN: Tăng trưởng nhanh, TTC: Tăng trưởng chậm, ( ): tần số xuất haplotype nhóm, haplotype có tần số xuất hai nhóm nhỏ 0,03 khơng phân tích giá trị p, **pC 704 525 2060 C>G T>A A>G T G T A IGF BP7 4559 C>A A A T G T G A A C G T A A T T C A A A T T C A G A T T G A A A T T G T A A T T G T A C T T G T G A T T G A G A T C C A A A T C C A G A T C G T G A T C G A A A Ký hiệu TTN (d) TTC (d) p COH1 COH2 COH3 COH4 COH5 COH6 COH7 COH8 COH9 COH10 COH11 COH12 COH13 COH14 5,39 (0,034) 65,44 (0,414) 0,00 (0,000) 6,98 (0,044) 9,37 (0,059) 6,34 (0,040) 0,00 (0,000) 0,00 (0,000) 1,20 (0,008) 2,27 (0,014) 16,54 (0,105) 3,20 (0,020) 0,00 (0,000) 7,84 (0,050) 26,92 (0,179) 4,69 (0,031) 33,54 (0,224) 12,46 (0,083) 1,99 (0,013) 2,32 (0,015) 7,88 (0,053) 8,52 (0,057) 7,70 (0,051) 9,64 (0,064) 0,00 (0,000) 4,51 (0,030) 7,79 (0,052) 0,00 (0,000) 7,18e-5 *** 2,22e-16 *** 9,09e-10 *** 0,218 0,022* 0,152 0,004** 0,003** 0,029* 0,032* 2,04e-5*** 0,658 0,005** 0,003** CO: Combination, TTN: Tăng trưởng nhanh, TTC: Tăng trưởng chậm, (d): tần số xuất haplotype nhóm, *pC, IGFBP-3 704C>G (p.Leu8Val), IGFBP-5 525T>A (p.Val16Glu), IGFBP-7 2060 A>G IGFBP-7 4559 C>A (p.Leu189Met) phân tích thơng qua khác biệt tỉ lệ haplotype/tổ hợp kiểu gen hai nhóm tăng trưởng nhanh/chậm, cho thấy haplotype chiếm tỉ lệ cao nhóm tăng trưởng nhanh CO_H2, H5, H11, H14 haplotype chiếm tỉ lệ cao 19 nhóm tăng trưởng chậm CO_H1, H3, H7, H8, H9, H10, H14 (Bảng 3.21) Bảng 3.22 Phân tích tác động tổ hợp kiểu gen phát sinh từ thị SNP lựa chọn lên tính trạng tăng trưởng cá tra ni Tổ hợp kiểu gen tạo thành từ SNP IGF IGF IGF IGF IGF1 IGF1R BP3 BP5 BP7 BP7 13680 13357 704 525 2060 4559 A>T T>C C>G T>A A>G C>A AA CT GG AT GG AA AA CT GC AT GA AA AT CT GG AT GG AA AT CT GG AT GA AA AT CT GG TT AA AA AT CT GG TT AA AC AT CT GG TT AG AA AT CT GC AT GG AA AT CT GC AT GA AA AT CT GC AT AA AA AT TT GG AT GA AA AT TT GG TT AA AC AT TT GG TT AG AA AT TT GG TT AG AC AT TT GC AT GG AA AT TT GC AT GA AA AT TT GC AT AA AA TT CT GG TT GG AA TTN (e) TTC (e) p (3,75%) (3,75%) (3,75%) (10%) (0%) (0%) (0%) (3,75%) 14 (17,5%) (2,5%) (5%) (0%) (0%) (0%) (10%) (7,5%) (1,25%) (0%) (0%) (0%) (0%) (7,5%) (3,75%) (3,75%) (3,75%) (0%) (6,25%) (7,5%) (5%) (3,75%) (3,75%) (3,75%) (0%) (1,25%) (5%) (3,75%) 0,083 0,083 0,083 0,592 0,083 0,083 0,083 0,083 0,038* 0,157 1,000 0,083 0,083 0,083 0,004** 0,058 0,179 0,083 CO: Combination, (e): tần số tổ hợp kiểu gen nhóm, tổ hợp kiểu gen có tần số xuất hai nhóm nhỏ 3% khơng phân tích giá trị p, *pA gây thay đổi trình tự axit amin Leu8Val, Val16Glu, Leu78Pro Leu189Met protein tương ứng Trong đó, Leu8Val, Val16Glu xác định nằm chuỗi peptit tín hiệu đầu N protein IGFBP-3 IGFBP-5 Do chuỗi peptit tín hiệu đóng vai trị quan trọng việc vận chuyển tiết protein IGFBP-3 IGFBP-5, nên tác động thay đổi trình tự axit amin lên chức hai protein cá tra nuôi cần tiếp tục nghiên cứu sâu So sánh trình tự protein IGFBP-7 cá tra ni số lồi cá xương khác cho thấy Leucine vị trí 78, bị thay Proline SNP 344T>C, không nằm vùng bảo thủ, Leucine vị trí 189, bị thay Methionine SNP 4559C>A, lại nằm vùng bảo thủ thuộc domain Ig Ig3, vốn có chức miễn dịch 4.3 Sự liên quan đa dạng di truyền gen thuộc hệ thống IGF với tính trạng tăng trưởng cá tra nuôi SNP 13680 A>T intron gen IGF1 thể liên quan đến tính trạng tăng trưởng cá tra nuôi, phù hợp với nghiên cứu khác tìm SNP nằm vùng khơng mã hóa gen IGF1 có liên quan đến tính trạng tăng trưởng lồi cá xương cá chép C carpio, cá hồi Đại Tây Dương S salar loài gia súc chim Trong số SNP sàng lọc genotyping gen IGF1R cá tra ni, có SNP 13357 T>C intron tiếp tục thể khác biệt thành phần kiểu gen hai nhóm tăng trưởng nhanh/chậm, tương tự nghiên cứu đa hình gen IGF1R loài cá địa Trung 22 Quốc O potamophila xác định SNP vùng khơng mã hóa có SNP liên quan đến tính trạng tăng trưởng quan trọng Phần lớn SNP gen IGFBP-3 IGFBP-5 liên quan đến tính trạng tăng trưởng người, lợn, cá chép, gà nằm vùng khơng mã hóa Như vậy, luận án có phát SNP nằm vùng mã hóa làm thay đổi trình tự axit amin IGFBP-3 704 C>G (p.Leu8Val) IGFBP5 525 T>A (p.Val16Glu) có liên quan đến tăng trưởng cá tra nuôi Điều này, mặt khác lại phù hợp với nghiên cứu mối liên quan SNP gen FOXO, MSTN, Myogenin gây thay axit amin với tính trạng tăng trưởng loài thủy sản ngao, Culter alburnus (♀) x Ancherythroculter nigrocauda (♂) cá nheo Mỹ I punctatus Có SNP gen IGFBP-6 sàng lọc để kiểm nghiệm liên quan tới tính trạng tăng trưởng cá tra ni Điều phù hợp với tình hình nghiên cứu chưa sáng tỏ vai trò chức IGFBP-6 tăng trưởng cá xương Hai SNP 2060 A>G intron 4559 C>A (p.Leu189Met) gen IGFBP-7 thể mối liên quan đến tính trạng tăng trưởng cá tra nuôi, củng cố thêm mối liên quan chặt chẽ tính trạng tăng trưởng cá xương với SNP intron, với SNP làm thay đổi trình tự axit amin nghiên cứu trước Sáu SNP tiềm liên quan đến tăng trưởng có giá trị PIC đa phần nằm khoảng 0,25 đến 0,5, cho thấy mức độ đa dạng di truyền trung bình, sở tiềm cho việc sử dụng chúng chọn giống; phần lớn giá trị MAF khoảng từ 20 đến 50 %, cho thấy SNP biến dị thường gặp, góp phần đáng kể vào đa dạng di truyền Riêng giá trị PIC MAF SNP IGFBP-7 4559C>A (p.Leu189Met) thấp so với SNP tiềm lại khơng nằm khoảng giá trị trên, SNP gây thay đổi trình tự axit amin vùng bảo thủ domain IgIg3 protein IGFBP-7 Đối với gen IGF1R, SNP 15392 T>A 83894 A>G mối liên quan đến tính trạng tăng trưởng cá tra ni đứng riêng lẻ haplotype tạo nên từ SNP SNP 13357 T>C gen lại liên quan chặt chẽ đến tính trạng tăng trưởng Tương tự, gen IGFBP-7, SNP 344 T>C (p.Leu78Pro) khơng liên quan đến tính trạng tăng trưởng cá tra nuôi, kết hợp SNP với thị SNP tiềm gen 2060 A>G 23 4559 C>A (p.Leu189Met) haplotype ưu nhóm tăng trưởng Kết SNP đứng riêng lẻ đơi khơng có ý nghĩa, phân tích kết hợp với SNP khác dạng haplotype lại thể liên quan đến tính trạng quan tâm, tương tự với tính trạng tăng trưởng cá vược miệng rộng Micropterus salmoides, cá nheo Mỹ I punctatus nhấn mạnh vai trò thị haplotype với tính trạng tăng trưởng nghiên cứu cá hồi Đại Tây Dương S salar 4.4 Phát triển thị phân tử SNP nhằm ứng dụng chọn giống cá tra theo hướng tăng trưởng Tác động tổng hợp SNP tiềm liên quan đến tính trạng tăng trưởng cá tra ni phân tích thơng qua khác biệt tần số haplotype tổ hợp kiểu gen hai nhóm tăng trưởng nhanh/chậm cho thấy thống nhất, hợp lý xuyên suốt kết thu được, cung cấp thêm thị haplotype, tổ hợp kiểu gen tiềm liên quan đến tính trạng quan tâm Từ đó, tính trạng tăng trưởng cá tra nuôi nhận định tính trạng đa gen, tương tự tính trạng tăng trưởng cá hồi vân Oncorhynchus mykiss, cá chép C carpio, củng cố cho việc phát triển thị phân tử dạng panel, tích hợp nhiều SNP tiềm gen liên quan khác để đánh giá tính trạng tăng trưởng KẾT LUẬN VÀ KIẾN NGHỊ Kết luận Trình tự cấu trúc gen thuộc hệ thống IGF (bao gồm IGF1, IGF2, IGF1R, IGFBP-1, -2, -3, -5, -6, -7) phân tích, vùng gen chứa SNP liên quan đến tính trạng tăng trưởng cá tra nuôi xác định giải mã Tổng số 103 SNP gen (IGF1, IGF2, IGF1R, IGFBP-1, -2, -3, 5, -6 -7) cá thể cá tra nuôi thuộc mẫu khởi tạo gồm cá thể tăng trưởng nhanh cá thể tăng trưởng chậm phát hiện, 10/103 SNP chọn lọc cho kiểm nghiệm quần thể lớn Các SNP kiểm nghiệm quần thể lớn phương pháp kéo dài nucleotide (Single base extension) thu SNP tiềm liên quan đến tính trạng tăng trưởng cá tra ni bao gồm: IGF1 13680 A>T, IGF1R 13357 T>C, IGFBP-3 704C>G (p.Leu8Val), IGFBP-5 24 525T>A (p.Val16Glu), IGFBP-7 2060 A>G IGFBP-7 4559 C>A (p.Leu189Met) Các haplotype tạo nên từ SNP tiềm (theo thứ tự trình bày kết luận 3) liên quan đến tính trạng tăng trưởng nhanh gồm: CO_H2 (ATGTGA), CO_H5 (TTCAGA), CO_H11 (TCCAAA), CO_H14 (TCGAAA); liên quan đến tính trạng tăng trưởng chậm gồm: CO_H1 (ATGTAA), CO_H3 (ACGTTA), CO_H7 (TTGTAA), CO_H8 (TTGTAC), CO_H9 (TTGTGA), CO_H10 (TTGAGA), CO_H13 (TCGTGA) Phân tích tổ hợp kiểu gen (diplotype) cho thấy tổ hợp kiểu genAT,CT,GC,AT,GA,AA (diplotype H2/H11) AT,TT,GC,AT,GG,AA (diplotype H2/H5) liên quan đến tính trạng tăng trưởng nhanh Kiến nghị Cần tiếp tục kiểm nghiệm liên quan tính trạng tăng trưởng cá tra ni thị SNP haplotype, diplotype, tổ hợp kiểu gen phát sinh mẫu lớn nữa, hướng tới sử dụng chúng thị phân tử hỗ trợ chọn giống tính trạng tăng trưởng cá tra ni NHỮNG ĐĨNG GĨP MỚI CỦA LUẬN ÁN - Đã phát hiện, phân tích, sàng lọc thị SNP tiềm gen thuộc hệ thống IGF liên quan đến tính trạng tăng trưởng cá tra nuôi - Đã phân tích haplotype, tổ hợp kiểu gen liên quan đến SNP có tiềm liên quan đến tính trạng tăng trưởng cá tra nuôi 25 DANH MỤC CƠNG TRÌNH CỦA TÁC GIẢ Lê Thị Ngun Bình, Nguyễn Thị Hoa, Trần Thị Huyền Trang, Nguyễn Thành Phương, Kim Thị Phương Oanh Phân tích cấu trúc gen mã hóa Insulin-like Growth Factor (IGF2) cá tra ni (Pangasianodon hypophthalmus) Tạp chí Cơng nghệ sinh học, 2019, 17(3): 455-463 Trần Thị Huyền Trang, Lê Thị Nguyên Bình, Nguyễn Thị Hoa, Trần Sơn Hồng, Kim Thị Phương Oanh Phân tích cấu trúc số gen Insulin-like Growth Factor Binding Protein (IGFBP) cá tra nuôi (Pangasianodon hypophthalmus) Tuyển tập Hội nghị Cơng nghệ Sinh học tồn quốc, 2019:17-22 Trang Thi Huyen Tran, Hoa Thi Nguyen, Binh Thi Nguyen Le, Phuc Huu Tran, Sang Van Nguyen, Oanh Thi Phuong Kim Characterization of single nucleotide polymorphism in IGF1 and IGF1R genes associated with growth traits in striped catfish (Pangasianodon hypophthalmus Sauvage, 1878) Aquaculture, 2021, 538: e736542 Trang Thi Huyen Tran, Hoang Son Tran, Binh Thi Nguyen Le, Sang Van Nguyen, Hai-Anh Vu, Oanh Thi Phuong Kim Significant association between a non-synonymous SNP in IGFBP5 gene and the growth of striped catfish (Pangasianodon hypophthalmus, Sauvage, 1878) Tạp chí Công nghệ sinh học, chấp nhận đăng Trang Thi Huyen Tran, Hoang Son Tran, Binh Thi Nguyen Le, Sang Van Nguyen, Hai-Anh Vu, Oanh Thi Phuong Kim Novel single nucleotide polymorphisms of Insulin-like Growth Factor Binding Protein (IGFBP7) gene significantly associated with growth traits in striped catfish (Pangasianodon hypophthalmus Sauvage, 1878) Molecular Genetics and Genomics, accepted