BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC NÔNG LÂM TP. HỒ CHÍ MINH CAO PHƯỚC UYÊN TRÂN ƯỚC LƯỢNG CÁC THÔNG SỐ DI TRUYỀN VÀ GIÁ TRỊ GÂY GIỐNG CỦA MỘT SỐ TÍNH TRẠNG SINH SẢN THEO PHƯƠNG PHÁP DFREML, BLUP VÀ GIBBS SAMPLING TRÊN CÁC GIỐNG HEO TẠI TRẠI HEO CAO SẢN KIM LONG LUẬN VĂN THẠC SĨ KHOA HỌC NÔNG NGHIỆP Thành phố Hồ Chí Minh Tháng 082009 BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC NÔNG LÂM TP. HỒ CHÍ MINH CAO PHƯỚC UYÊN TRÂN ƯỚC LƯỢNG CÁC THÔNG SỐ DI TRUYỀN VÀ GIÁ TRỊ GÂY GIỐNG CỦA MỘT SỐ TÍNH TRẠNG SINH SẢN THEO PHƯƠNG PHÁP DFREML, BLUP VÀ GIBBS SAMPLING TRÊN CÁC GIỐNG HEO TẠI TRẠI HEO CAO SẢN KIM LONG Chuyên ngành : Chăn Nuôi Mã số : 60.62.40 LUẬN VĂN THẠC SĨ KHOA HỌC NÔNG NGHIỆP Hướng dẫn khoa học: PGS.TS. TRỊNH CÔNG THÀNH Thành phố Hồ Chí Minh Tháng 82009 ƯỚC LƯỢNG CÁC THÔNG SỐ DI TRUYỀN VÀ GIÁ TRỊ GÂY GIỐNG CỦA MỘT SỐ TÍNH TRẠNG SINH SẢN THEO PHƯƠNG PHÁP DFREML, BLUP VÀ GIBBS SAMPLING TRÊN CÁC GIỐNG HEO TẠI TRẠI HEO CAO SẢN KIM LONG CAO PHƯỚC UYÊN TRÂN Hội đồng chấm luận văn: 1. Chủ tịch: TS. VÕ THỊ TUYẾT Trường Đại học Nông Lâm TP. Hồ Chí Minh 2. Thư ký: TS. TRẦN VĂN CHÍNH Trường Đại học Nông Lâm TP. Hồ Chí Minh 3. Phản biện 1: TS. KIỀU MINH LỰC Công ty CP Group Việt Nam 4. Phản biện 2: TS. ĐOÀN VĂN GIẢI Công ty cổ phần đầu tư, thương mại, chăn nuôi Đông Á 5. Ủy viên: PGS. TS. TRỊNH CÔNG THÀNH Trường Đại học Nông Lâm TP. Hồ Chí Minh ĐẠI HỌC NÔNG LÂM TP. HỒ CHÍ MINH HIỆU TRƯỞNG LÝ LỊCH CÁ NHÂN Tôi tên là Cao Phước Uyên Trân, sinh ngày 27 tháng 01 năm 1981 tại thành phố Hồ Chí Minh, con Ông Cao Phước Hiệp và Bà Hồ Thị Nguyên. Tốt nghiệp tú tài tại Trường Trung học phổ thông chuyên Lê Hồng Phong, Q.5 Thành phố Hồ Chí Minh năm 2000. Tốt nghiệp Đại học: ngành Chăn nuôi hệ chính quy năm 2005, ngành Thú Y hệ chính quy năm 2008, tại Đại học Nông Lâm TP. Hồ Chí Minh Từ năm 2006 đến nay làm việc tại Bộ Môn Di Truyền Giống Khoa Chăn Nuôi Thú Y trường ĐH Nông Lâm TP.HCM, chức vụ giảng viên. Tháng 09 năm 2006 theo học Cao học ngành Chăn nuôi tại Đại học Nông Lâm TP. Hồ Chí Minh. Trình trạng gia đình: Chồng: Lê Chí Thành, năm kết hôn 2006. Con: Lê Cao Bảo Quỳnh, năm sinh 2009 Địa chỉ liên lạc: 42510A Phạm Văn Hai F3, Q.Tân Bình, TP. Hồ Chí Minh Điện thoại: 0918.605.456 Email: caophuocuyentran271yahoo.com LỜI CAM ĐOAN Tôi cam đoan đây là công trình nghiên cứu của tôi. Các số liệu, kết quả nêu trong luận văn là trung thực và chưa từng được ai công bố trong bất kỳ công trình nào khác. Cao Phước Uyên Trân CẢM TẠ Tôi xin chân thành cảm ơn Ban Giám hiệu Trường Đại học Nông Lâm TP. Hồ Chí Minh, Ban Chủ Nhiệm Khoa cùng quý Thầy Cô Khoa Chăn Nuôi Thú Y và quý Thầy Cô Phòng đào tạo Sau đại học đã tạo điều kiện thuận lợi, tận tình giúp đỡ và động viên cho tôi cùng các bạn trong lớp hoàn thành tốt khóa học Cao học Chăn nuôi 2006. Tôi xin được bày tỏ lòng biết ơn chân thành và tình cảm đến quý Thầy Cô Bộ Môn Di Truyền Giống, Bộ Môn Chăn Nuôi Chuyên Khoa đã hết lòng động viên, chia sẽ những khó khăn, giúp đỡ và tạo điều kiện cho tôi được học và hoàn thành khóa học này. Đặc biệt là Thầy Phạm Trọng Nghĩa, Thầy Trần Văn Chính và em Trần Đoàn Vĩnh Khánh những người đã hết lòng dạy dỗ, hỗ trợ tôi trong công việc để tôi có điều kiện học tập. Tôi cũng xin được bày tỏ lòng biết ơn chân thành và sự kính trọng đến Thầy Trịnh Công Thành – Giáo viên hướng dẫn luận văn tốt nghiệp cao học đồng thời là trưởng bộ môn Di truyền Giống người đã kiên trì và tận tụy truyền đạt kiến thức, gợi mở cho tôi con đường nghiên cứu, học tập và giảng dạy. Tôi xin chân thành cảm ơn Ban Giám đốc Trại heo cao sản Kim Long, các anh chị kỹ thuật giống, công nhân viên của trại đã thu thập và cung cấp số liệu cho tôi. Nếu không có sự kiên trì làm việc và tinh thần chia sẻ thông tin của trại và các anh chị, tôi chắc luận văn này không thể có được. Tôi xin chân thành cảm ơn các anh, chị, các bạn lớp cao học 2006 đã kề vai sát cánh cùng tôi học tập, trao đổi, tìm hiểu tri thức mới trong suốt khóa học. Và tôi cũng xin được bày tỏ tình yêu đến những người ruột thịt ,thân yêu đã sinh ra, lo lắng, gánh vác và giúp đỡ tôi trong suốt chặng đường đã qua cũng như mãi đến những ngày sau. TÓM TẮT Đề tài “Ước lượng các thông số di truyền và giá trị gây giống của một số tính trạng sinh sản theo hai phương pháp DFREML, BLUP và Gibbs Sampling trên một số giống heo tại trại heo giống cao sản Kim Long”. Đề tài được tiến hành từ tháng 082008 đến tháng 082009 với 2.018 số liệu về tính trạng số con sơ sinh sốngổ, 1.558 số liệu về tính trạng trọng lượng 21 ngày tuổiổ của 855 nái Landrace và 1.618 số liệu về tính trạng số con sơ sinh sốngổ, 1.177 số liệu về tính trạng trọng lượng 21 ngày tuổiổ của 625 nái Yorkshire tại trại có năm sinh từ năm 2000 đến năm 2008. Mục tiêu là áp dụng phương pháp chọn mẫu Gibbs và DFREMLBLUP để ước lượng một số thông số di truyền, giá trị giống của một số tính trạng sinh sản và so sánh kết quả đạt được. Kết quả nghiên cứu cho thấy các thông số di truyền ước lượng theo 2 phương pháp DFREML và Gibbs thì có sự khác biệt, mức độ khác biệt thay đổi theo giống và tính trạng : Hệ số di truyền của tính trạng SCS ở nhóm giống Landrace là 0,092 (GSS) và 0,076 (DFREML) cao hơn Yorkshire là 0,064 (GSS) và 0,066 (DFREML). Hệ số di truyền của tính trạng TL21 ở nhóm Landrace là 0,070 (GSS) và 0,071 (DFREML),Yorkshire là 0,052 (GSS) và 0,079 (DFREML). Tương quan kiểu hình giữa 2 tính trạng là âm với nhóm giống Landrace lần lượt là 0,052 (GSS), 0,044 (DFREML), nhóm giống Yorkshire 0,006 (GSS); 0,005 (DFREML). Tương quan di truyền giữa 2 tính trạng này theo 2 phương pháp lần lượt là 0,177 (GSS) và 0,397 (DFREML) ở nhóm giống Landrace; 0,174 (GSS) và 0,390 (DFREML) ở nhóm giống Yorkshire. Giá trị gây giống được ước lượng cũng có sự khác biệt giữa 2 phương pháp. Phương pháp GSS cho kết quả cao hơn phương pháp BLUP ở tính trạng SCS của cả 2 giống (đàn heo Landrace là + 0,065 (GSS); 0,009 (BLUP); đàn heo Yorkshire là + 0,042 (GSS); 0,017 (BLUP)). Ngược lại ở tính trạng TL21 kết quả theo BLUP cao hơn GSS ở đàn heo Yorkshire (+ 0,034(GSS); + 0,041(BLUP)) nhưng thấp hơn ở đàn heo Landrace (+ 0,039 (GSS); +0,173 (BLUP)). Sự phù hợp của 2 phương pháp GS và BLUP trong việc xếp hạng heo dựa trên giá trị gây giống là không cao. Hệ số tương quan Spearman ở nhóm giống Landrace là 0,74 (SCS), 0,78 (TL21); nhóm giống Yorkshire là 0,72 (SCS), 0,78 (TL21) với P < 0,0001. ABSTRACT The study “Estimation of genetic parameters and breeding values for some reproduction traits of pig by DFREMLBLUP and Gibbs Sampling at Kim Long pig Farm, Binh Duong province”. The study was carried out from August 2008 to August 2009. Data contained 855 Landrace sows with 2.018 records of number born alive (SCS), 1.558 records of litter weight at 21 days of age (TL21), and 625 Yorkshire sows with 1.618 records of number born alive (SCS), 1.177 records of litter weight at 21 days of age (TL21), these sow were born from 2000 to 2008. The aims of this study are to estimate genetic parameters and breeding values of SCS and TL21 for Yorkshire and Landrace pigs by Gibbs Sampling and DFREMLBLUP, and to compare breeding values estimated by two methods. There were differences about variance components and genetic parameters estimated by MTGSAM and DFREML, levels of differences depend on breed and traits: Heritabilities of SCS Landrace estimated by GS and DFREML were 0,092 (GSS) and 0,076 (DFREML) higher than those of Yorkshire: 0,064(GSS) and 0,066 (DFREML). Heritabilities of TL21 of Landrace estimated were 0,070 (GSS) and 0,071 (DFREML), Yorkshire were 0,052 (GSS) and 0,079 (DFREML). Phenotype correlations between two traits were negative with Landrace being 0,052 (GSS); 0,044(DFREML), Yorkshire 0,006 (GSS); 0,005 (DFREML). Genetic correlations between two traits were 0,177 (GSS) and 0,397 (DFREML) of Landrace; 0,174 (GSS) and 0,390 (DFREML) of Yorkshire. Estimated breeding values were different between two methods, too. Result of GSS method was higher BLUP method in SCS of two breed (Landrace: + 0,065 (GSS); 0,009 (BLUP); Yorkshire + 0,042 (GSS); 0,017 (BLUP)). Conversely, estimated breeding values of TL21 trait estimated with BLUP were higher than those estimated with GSS in Yorkshire (+ 0,034 (GSS); +0,041(BLUP)) but lower in Landrace (+0,039 (GSS); +0,173 (BLUP)). The agreement of two methods GS and BLUP in EBV based ranking was not strong. Spearman rank correlation of Landrace were 0,74 (SCS), 0,78 (TL21); Yorkshire were 0,72 (SCS), 0,78 (TL21) with (P < 0,0001). MỤC LỤC CHƯƠNG TRANG Trang tựa Trang Chuẩn Y.................................................................................................... i Lý Lịch Cá Nhân ................................................................................................. ii Lời Cam Đoan..................................................................................................... iii Cảm tạ................................................................................................................. iv Tóm tắt................................................................................................................ v Mục lục ............................................................................................................... viii Danh sách các chữ viết tắt .................................................................................. xi Danh sách các bảng ............................................................................................ xii Danh sách các biểu đồ ....................................................................................... xiii 1. ĐẶT VẤN ĐỀ ................................................................................................ 1 1.1 Đặt vấn đề. .................................................................................................... 1 1.2 Mục tiêu của đề tài ........................................................................................ 2 1.3 Yêu cầu của đề tài ......................................................................................... 2 2. TỔNG QUAN ............................................................................................... 3 2.1 Khái niệm về thông số di truyền .................................................................... .3 2.1.1 Hệ số di truyền............................................................................................ .3 2.1.2 Tương quan di truyền, ngoại cảnh và tương quan kiểu hình ........................ 5 2.1.3 Hệ số lặp lại .............................................................................................. 6 2.2 Các phương pháp ước lượng thông số di truyền ............................................. 7 2.2.1 Phương pháp hồi quy.................................................................................. 7 2.2.2 Phương pháp phân tích phương sai (ANOVA)............................................ 9 2.2.3 Phương pháp REML................................................................................... 11 2.2.4 Phương pháp Gibbs Sampling..................................................................... 14 2.2.4.1 Khái quát về thống kê Bayes.................................................................... 14 2.2.4.2 Gibbs Sampling ....................................................................................... 15 2.2.5 Phương pháp R........................................................................................... 18 2.3 Một số nghiên cứu sử dụng phương pháp DFREML và Gibbs Sampling trong ước lượng các thông số di truyền................................................................ 18 2.4 Giá trị gây giống............................................................................................ 21 2.4.1 Giá trị gây giống......................................................................................... 21 2.4.2 Ước lượng giá trị gây giống ....................................................................... 21 2.4.3 Nghiên cứu sử dụng phương pháp BLUP và Gibbs Sampling trong ước lượng giá trị gây giống (EBV) ...................................................................... 22 3. NỘI DUNG VÀ PHƯƠNG PHÁP NGHIÊN CỨU...................................... 23 3.1 Thời gian , địa điểm và đối tượng khảo sát .................................................... 23 3.2 Nội dung nghiên cứu ..................................................................................... 23 3.3 Phương Pháp nghiên cứu ............................................................................... 23 3.3.1 Các chỉ tiêu theo dõi ................................................................................... 23 3.3.1.1 Số con sơ sinh còn sốngổ (SCS).............................................................. 23 3.3.1.2 Trọng lượng lúc 21 ngày tuổi ổ (TL21)................................................... 24 3.3.2 Thu thập số liệu .......................................................................................... 25 3.3.3 Phân tích thống kê ...................................................................................... 25 3.3.3.1 Phân tích đơn biến ................................................................................... 25 3.3.3.2 Phân tích đa biến...................................................................................... 26 3.3.4 Phương pháp xử lý số liệu........................................................................... 26 4. KẾT QUẢ VÀ THẢO LUẬN ....................................................................... 28 4.1 Phân tích đơn biến ......................................................................................... 28 4.1.1 Nhóm giống Landrace ................................................................................ 28 4.1.1.1 Thông số di truyền ................................................................................... 28 4.1.1.2 Giá trị gây giống được ước lượng ............................................................ 29 4.1.2 Nhóm giống Yorkshire ............................................................................... 39 4.1.2.1 Thông số di truyền ................................................................................... 39 4.1.2.2 Giá trị gây giống được ước lượng ............................................................ 40 4.2 Phân tích đa biến ........................................................................................... 52 4.2.1 Nhóm giống Landrace ................................................................................ 52 4.2.2 Nhóm giống Yorkshire ............................................................................... 53 5. KẾT LUẬN VÀ ĐỀ NGHỊ .......................................................................... 55 5.1 Kết luận......................................................................................................... 55 5.2 Đề nghị.......................................................................................................... 55 TÀI LIỆU THAM KHẢO................................................................................. 56 DANH SÁCH CÁC CHỮ VIẾT TẮT BLUP Best Linear Unbased Prediction Dự đoán tuyến tính vô tư nhất DFREML Derivative free Restricted Maximum Likelihood – Tương đồng tối đa được giới hạn không dùng đạo hàm EBV Estimated breeding value giá trị gây giống ước lượng MTGSAM Multiple Trait Gibbs Sampling in animal Models GS Gibbs Sampling GSF Phương pháp GS với số tiên nghiệm có phân bố phẳng GSS Phương pháp GS với số tiên nghiệm có phân bố nhọn REML Restricted Maximum Likelihood – Tương đồng tối đa được giới hạn rG Hệ số tương quan di truyền rE Hệ số tương quan ngoại cảnh rP Hệ số tương quan kiểu hình rG1G2 Hệ số tương quan di truyền rP1P2 Hệ số tương quan kiểu hình SCS Số con sơ sinh sốngổ TL21 Trọng lượng toàn ổ lúc 21 ngày tuổi VC Variance Component – Thành phần phương sai A 2 Phương sai di truyền PE 2 Phương sai ngoại cảnh thường trực E 2 Phương sai sai số ngẫu nhiên P 2 Phương sai kiểu hình G1G 2 Hiệp phương sai di truyền của 2 tính trạng PE1PE2 Hiệp phương sai ngọai cảnh thường trực của 2 tính trạng E1E 2 Hiệp phương sai sai số ngẫu nhiên của 2 tính trạng P1P2 Hiệp phương sai kiểu hình của 2 tính trạng DANH SÁCH CÁC BẢNG BẢNG TRANG Bảng 2.1: Một số kết quả nghiên cứu về hệ số di truyền của các tính trạng sinh sản trên heo........................................................................... 4 Bảng 2.2: Một số kết quả nghiên cứu về hệ số tương quan giữa tính trạng số con sơ sinh sốngổ và trọng lượng 21 ngày tuổiổ..................... 6 Bảng 3.1: Hệ số điều chỉnh về 21 ngày tuổi ..........................................................24 Bảng 3.2: Hệ số hiệu chỉnh khối lượng 21 ngày tuổiổ về chuẩn 10conổ .................................................................................................25 Bảng 3.3: Các thông số sử dụng trong chương trình MTGSAM............................26 Bảng 4.1:Các thành phần phương sai (TPPS) và thông số di truyền (TSDT) được ước lượng của nhóm giống Landrace.............................. 28 Bảng 4.2:Trung bình BLUP EBV và GS EBV nhóm giống Land......................... 29 Bảng 4.3: Hệ số tương quan Spearman giữa các giá trị gây giống của tính trạng scs nhóm giống Land được ước lượng bởi Blup và GS........................................................................................................ 34 Bảng 4.4:Hệ số tương quan spearman giữa các giá trị gây giống của tính trạngTL21 nhóm giống Land được ước lượng bởi Blup và GS ................................................................................................... 38 Bảng 4.5:Các thành phần phương sai (TPPS) và thông số di truyền (TSDT) được ước lượng của nhóm giống Yorkshire............................. 39 Bảng 4.6:Trung bình BLUP EBV và GS EBV nhóm giống Yorkshire ................. 40 Bảng 4.7:Hệ số tương quan spearman giữa các giá trị gây giống của tính trạng scs nhóm giống Yorkshire được ước lượng bởi Blup và GS........................................................................................... 45 Bảng 4.8:Hệ số tương quan spearman giữa các giá trị gây giống của tính trạng TL21 nhóm giống Yorkshire được ước lượng bởi Blup và GS........................................................................................... 49 Bảng 4.9:Các thành phần phương sai (TPPS) và thông số di truyền (TSDT) được ước lượng của nhóm giống Landrace (đa biến)............... 52 Bảng 4.10:Các thành phần phương sai (TPPS) và thông số di truyền (TSDT) được ước lượng của nhóm giống Yorkshire(đa biến)............... 53 DANH SÁCH CÁC HÌNH VÀ BIỂU ĐỒ HÌNH VÀ BIỂU ĐỒ TRANG Hình 2.1 : Mô phỏng dạng phân phối xác xuất tiên nghiệm...............................14 Biểu đồ 4.1: Mức độ phù hợp giữa BLUP EBV và GSF EBV của tính trạng scs nhóm giống Land .............................................................31 Biểu đồ 4.2: Mức độ phù hợp giữa BLUP EBV và GSS EBV của tính trạng scs nhóm giống Land ............................................................. 32 Biểu đồ 4.3: Mức độ phù hợp giữa GSF EBV và GSS EBV của tính trạng scs nhóm giống Land ............................................................. 33 Biểu đồ 4.4: Trung bình giá trị EBV theo năm sinh và khuynh hướng di truyền của tính trạng scs giống Land ............................................... 34 Biểu đồ 4.5: Mức độ phù hợp giữa BLUP EBV và GSS EBV của tính trạng TL21 nhóm giống Land.......................................................... 35 Biểu đồ 4.6:Mức độ phù hợp giữa BLUP EBV và GSS EBV của tính trạngTL21 nhóm giống Land........................................................... 36 Biểu đồ 4.7: Mức độ phù hợp giữa BLUP EBV và GSS EBV của tính trạng TL21 nhóm giống Land.......................................................... 37 Biểu đồ 4.8: Trung bình giá trị EBV theo năm sinh và khuynh hướng di truyền của tính trạng TL21 giống Land ........................................... 38 Biểu đồ 4.9: Mức độ phù hợp giữa BLUP EBV và GSF EBV của tính trạng scs nhóm giống Yorkshire...................................................... 42 Biểu đồ 4.10: Mức độ phù hợp giữa BLUP EBV và GSS EBV của tính trạng scs nhóm giống Yorkshire...................................................... 43 Biểu đồ 4.11: Mức độ phù hợp giữa GSF EBV và GSS EBV của tính trạng scs nhóm giống Yorkshire...................................................... 44 Biểu đồ 4.12: Trung bình giá trị EBV theo năm sinh và khuynh hướng di truyền của tính trạng scs giống Yorkshire.................................... 45 Biểu đồ 4.13: Mức độ phù hợp giữa BLUP EBV và GSS EBV của tính trạng TL21 nhóm giống Yorkshire.................................................. 46 Biểu đồ 4.14: Mức độ phù hợp giữa BLUP EBV và GSS EBV của tính trạngTL21 nhóm giống Yorkshire ................................................... 47 Biểu đồ 4.15: Mức độ phù hợp giữa BLUP EBV và GSS EBV của tính trạng TL21 nhóm giống Yorkshire.................................................. 48 Biểu đồ 4.16: Trung bình giá trị EBV theo năm sinh và khuynh hướng di truyền của tính trạng TL21 giống Yorkshire................................ 49 Biểu đồ 4.17: Kiểm tra dạng phân phối của tính trạng Số con sơ sinh sốngổ ............................................................................................. 50 Biểu đồ 4.18: Kiểm tra dạng phân phối của tính trạng Trọng lượng 21 ngày tuổiổ .......................................................................................51 20 Chương 1 MỞ ĐẦU 1.1. ĐẶT VẤN ĐỀ Công tác giống là một phần quan trọng hoạt động chăn nuôi, mỗi quốc gia đều có những chương trình cải thiện di truyền khác nhau nhằm nâng cao năng suất vật nuôi. Ở nước ta hiện nay, trong công tác giống việc ước lượng các thông số di truyền nhằm ước lượng giá trị gây giống của các tính trạng dùng trong xây dựng chỉ số chọn lọc là rất quan trọng, do sự thành công của các chỉ số này phụ thuộc lớn vào độ chính xác của việc ước lượng các thông số di truyền và giá trị gây giống. Trong nhiều năm trước đây, các thông số di truyền được ước lượng bằng các phương pháp hồi quy, phân tích ANOVA. Năm 1971, Patterson và Thompson mô tả phương pháp tương đồng tối đa được giới hạn (REML), phương pháp này được phát triển mạnh và được ứng dụng nhiều đồng thời tỏ ra chiếm ưu thế trong ước lượng các thông số di truyền, từ đó các thông số này sẽ được áp dụng trong phương pháp dự đoán tuyến vô tư nhất (BLUP) để ước lượng tiếp giá trị gây giống, đặc điểm của phương pháp REML và BLUP là dựa trên lý luận của thống kê tần số để tính tóan. Tuy nhiên hiện nay, bên cạnh lý luận của thống kê tần số thì dựa trên lý luận của thống kê Bayes, phương pháp Gibbs Sampling cũng đang được sử dụng ở nhiều nước trên thế giới để ước lượng các thông số này. Tại Việt Nam, việc sử dụng phương pháp Gibbs Sampling trong lĩnh vực di truyền động vật chỉ mới có một số ít nghiên cứu được trình bày, với mong muốn được tìm hiểu và áp dụng phương pháp này trong di truyền động vật, được sự đồng ý của Phòng Đào Tạo sau Đại Học, Ban Chủ Nhiệm Khoa, dưới sự hướng dẫn của PGS.TS. Trịnh Công Thành chúng tôi tiến hành thực hiện đề tài 21 ” Ước lượng các thông số di truyền và giá trị gây giống của một số tính trạng sinh sản theo phương pháp DFREML, BLUP và Gibbs Sampling trên các giống heo tại trại heo cao sản Kim Long” 1.1 .MỤC TIÊU VÀ YÊU CẦU 1.1.1 Mục tiêu Áp dụng phương pháp chọn mẫu Gibbs để ước lượng một số thông số di truyền, giá trị giống của một số tính trạng sinh sản và so sánh kết quả khi áp dụng phương pháp DFREML và BLUP. 1.1.2 Yêu cầu Theo dõi và ghi nhận các số liệu về khả năng sinh sản của các heo thuộc hai nhóm giống Yorkshire, Landrace. Sử dụng chương trình VCE 6.0 và MTGSAM để ước lượng các thông số di truyền theo 2 phương pháp DFREML và Gibbs Sampling. Sử dụng các thông số di truyền có được để ước lượng EBV với chương trình PEST và MTGSAM. 22 Chương 2 TỔNG QUAN 2.1. Khái niệm về thông số di truyền Các thông số di truyền của quần thể bao gồm: Hệ số di truyền Hệ số tương quan: di truyền, ngoại cảnh và kiểu hình Hệ số lặp lại 2.1.1. Hệ số di truyền Theo Cameron (1997) hệ số di truyền là một hàm của các phương sai di truyền và ngọai cảnh và nó là trung tâm của lý thuyết chọn giống gia súc, việc dự đóan tốc độ cải thiện di truyền của quần thể và giá trị di truyền của con thú thì phụ thuộc vào hệ số di truyền. Nói cách khác hệ số di truyền chính là tỷ lệ giữa phương sai di truyền và phương sai kiểu hình có liên quan đến một tính trạng nhất định của một quần thể nhất định. Người ta phân biệt 2 loại hệ số di truyền theo nghĩa rộng (H) và nghĩa hẹp (h2): Hệ số di truyền biểu diễn bằng tỷ lệ của tổng phương sai di truyền so với phương sai kiểu hình thì gọi là hệ số di truyền theo nghĩa rộng, được biểu diễn bằng công thức sau: 2 2 2 G P H 23 Hệ số di truyền được biểu diễn bằng tỷ lệ của phương sai của giá trị giống so với phương sai kiểu hình thì gọi là hệ số di truyền theo nghĩa hẹp, hay nó còn được hiểu như là hệ số hồi quy của giá trị gây giống theo kiểu hình với công thức sau: A P A P h b 2 . 2 2 H ệ số di truyền theo nghĩa hẹp thường được sử dụng và là thông số căn bản trong công tác giống. Đặc điểm của hệ số di truyền: Vì hệ số di truyền được định nghĩa như là tỷ số giữa các phương sai và như là hệ số hồi qui của giá trị gây giống theo kiểu hình nên cả phương sai và hệ số hồi quy đều liên quan đến độ lệch của các quan sát so với trung bình của chúng. Hệ số di truyền là chuyên biệt cho một quần thể và cho một khỏang ngọai cảnh. Như vậy, hệ số di truyền có thể thay đổi. Khi hệ số di truyền của một tính trạng ở mức cao nghĩa là tương quan giữa giá trị kiểu hình và giá trị di truyền của các cá thể cũng sẽ cao nên việc chọn lọc dựa trên giá trị kiểu hình của chính cá thể đó sẽ mang lại hiệu quả cao.Trong khi đó, những tính trạng có hệ số di truyền thấp thì tương quan giữa giá trị kiểu hình và giá trị di truyền của cá thể sẽ thấp, vì vậy khi chọn lọc cần kết hợp năng suất bản thân với năng suất của thú thân tộc và đời sau. Bảng 2.1. Một số kết quả nghiên cứu về hệ số di truyền của các tính trạng sinh sản trên heo Hệ số di truyền của tính Tác giả Giống trạng SCS P21 Yorkshire 0,10 0,08 Chen và ctv (2003) Landrace 0,08 0,09 Duroc 0,09 0,07 Yorkshire 0,08 Landrace 0,07 Yorkshire 0,08 M. Boesch và ctv (1998) Landrace 0,07 D. Norris và ctv(2006) Landace 0,103 0,067 24 2.1.2. Hệ số tương quan di truyền, tương quan ngoại cảnh, tương quan kiểu hình Hệ số tương quan đo lường mức độ của mối quan hệ giữa 2 biến. Hệ số tương quan bằng +1 hay 1 diễn tả hai biến phụ thuộc nhau hoàn toàn, bằng 0 khi hai biến độc lập hoàn toàn + Hệ số tương quan di truyền( rA ): là hệ số tương quan giữa các giá trị gây giống, được dựa trên ảnh hưởng đa hiệu của gen. Trong tất cả các gen của một thú, một số gen ảnh hưởng tính trạng 1 và một số gen khác ảnh hưởng tính trạng 2. Nếu có các gen ảnh hưởng cả hai tính trạng 1 và 2, khi đó các tính trạng này có tương quan di truyền. Hệ số tương quan di truyền được tính như sau: Ax Ay x y A A A r . cov( , ) Với: x: tính trạng 1 y: tính trạng 2 + Hệ số tương quan ngọai cảnh ( rE ): cũng tương tự như hệ số tương quan di truyền, hệ số tương quan ngoại cảnh được giải thích như sau: Trong tất cả ảnh hưởng ngoại cảnh, một phần ảnh hưởng tính trạng 1 và một phần khác ảnh hưởng tính trạng 2, nếu có những yếu tố ngọai cảnh ảnh hưởng cả tính trạng 1 và 2 khi đó có tương quan ngoại cảnh giữa 2 tính trạng và công thức tính như sau: Ex Ey x y E E E r . cov( , ) Với: x: tính trạng 1 y: tính trạng 2 + Hệ số tương quan kiểu hình( rP ): được xem như là ảnh hưởng phối hợp của tương quan di truyền và ngoại cảnh. Được tính theo công thức sau: Px Py x y P P P r . cov( , ) Với: x: tính trạng 1 y: tính trạng 2 25 Trong thực tiễn sản xuất, các nhà chọn giống thường quan tâm đồng thời đến nhiều tính trạng vì vậy mà người ta rất quan tâm đến sự tương quan giữa các tính trạng, để mô tả đầy đủ mối quan hệ giữa các tính trạng thì việc xác định ba hệ số tương quan trên là cần thiết. Falconer và Mackay (1996) đã mô tả mối quan hệ giữa 3 hệ số tương quan trên trong qua biểu thức sau: rP rA.hx.hy rE.ex.ey Với: 2 1 ex hx và ey 1hy 2 2x hx h và hy hy 2 Từ mối quan hệ trên ta dễ dàng thấy rằng nếu cả 2 tính trạng đều có hệ số di truyền thấp thì tương quan kiểu hình do tương quan ngọai cảnh quyết định, nếu hệ số di truyền của cả 2 tính trạng đều cao thì tương quan di truyền sẽ quyết định tương quan kiểu hình. Sự hiểu biết về mức độ của mối quan hệ giữa các tính trạng sẽ giúp cho các nhà chọn giống đưa ra quyết định chính xác hơn khi chọn lọc cùng lúc nhiều tính trạng. Bảng 2.2. Một số kết quả nghiên cứu về hệ số tương quan giữa tính trạng số con sơ sinh sốngổ (SCS) và trọng lượng 21 ngày tuổiổ (P21) Tác giả Giống Hệ số tương quan giữa SCS và P21 Yorkshire 0,14 Chen và ctv,2003 Landrace 0,15 2.1.3. Hệ số lặp lại Một cách tổng quát hệ số lặp lại được hiểu như là sự tương quan trong các nhóm quan sát, nó đo lường mức giống nhau giữa các quan sát trong nhóm. Xét về mặt di truyền hệ số lặp lại là tỉ lệ giữa tổng phương sai di truyền và phương sai của ảnh hưởng ngọai cảnh thường trực với phương sai kiểu hình. Hệ số lặp lại = 2 2 2 2 2 2 P A EP B W B 26 Với: 2B : phương sai giữa các nhóm 2W : phương sai trong nhóm 2A : phương sai giá trị gây giống 2EP : phương sai ảnh hưởng ngọai cảnh thường trực 2P : phương sai kiểu hình Hệ số lặp lại biến thiên từ 0 đến 1 và bằng hệ số di truyền khi E 2P =0 như vậy hệ số lặp lại luôn lớn hơn hoặc bằng hệ số di truyền vì vậy nó là giới hạn trên của hệ số di truyền. 2.2. Các phương pháp ước lượng thông số di truyền 2.2.1. Phương pháp hồi quy Dựa trên sự giống nhau giữa các thú có quan hệ di truyền, bằng phương pháp hồi quy của con theo cha mẹ chúng ta có thể ước lượng hệ số di truyền như sau: Nếu chúng ta vẽ các quan sát ở con theo giá trị của cha mẹ chúng (cha, mẹ hay trung bình cha mẹ) chúng ta có thể thực hiện phân tích hồi quy con cha mẹ. Độ dốc của đường hồi qui phản ánh sự khác biệt kiểu hình tìm thấy ở cha mẹ đã thể hiện ở con chúng là bao nhiêu. Hồi qui con theo cha mẹ: Theo Cameron (1997), nếu các cha mẹ được lựa chọn cho mục đích ước lượng hồi qui con theo cha mẹ thì hệ số hồi qui bằng ½ hệ số di truyền: 2 2 2 1 2 1 2 var( ) cov( , ) h P P P b P A P o P OP X (P) Y(O) Y= a+ bOPX 0 O: kiểu hình tính trạng thú con P:kiểu hình tính trạng thú cha mẹ bOP: hệ số hồi qui con theo cha mẹ 27 Với: Cov(PO ,PP): hiệp phương sai kiểu hình của con và cha mẹ Var(PP): phương sai kiểu hình thú cha mẹ Tương quan kiểu hình giữa cha mẹ và con cái bằng phương pháp hồi quy được tính như sau: 2 2 2 2 1 2 . 1 2 var( ).var( ) cov( , ) h P P P P r P P A O P O P OP Với: rOP: tương quan kiểu hình giữa con và cha mẹ Cov(PO ,PP): hiệp phương sai kiểu hình của con và cha mẹ Var(PP): phương sai kiểu hình thú cha mẹ Var(PO): phương sai kiểu hình thú con Hồi qui của con theo trung bình cha mẹ: Hệ số hồi qui được tính như sau: 2 2 2 1 2 1 2 var( ) cov( , ) h P P P b A P P o P OP Với: cov(P O, PP ): hiệp phương sai kiểu hình của con và trung bình cha mẹ Var(PP) ): phương sai trung bình kiểu hình thú cha mẹ Tương quan di truyền: 2 2 2 2 1 2. .1 2 1 2 var( ).var( ) cov( , ) h P P P P r P P A O P O P OP Hồi qui con cha mẹ thường không được sử dụng trong thực tế. Nó đòi hỏi số liệu ở 2 thế hệ và chỉ dùng số liệu này. Nó cũng không thể sử dụng mối quan hệ di truyền giữa các cha mẹ. 28 2.2.2. Phương pháp phân tích phương sai (ANOVA) ANOVA cân bằng Trong di truyền số lượng, phương pháp phân tích phương sai thường được dùng để phân tích tổng phương sai giữa các số quan sát thành các phương sai thành phần, ví dụ như phương sai di truyền và phương sai ngọai cảnh. Như ta đã biết hệ số di truyền chính là tỷ lệ giữa phương sai di truyền và phương sai kiểu hình có liên quan đến một tính trạng nhất định của một quần thể nhất định. Như vậy ta cũng có thể dùng phương pháp phân tích phương sai (ANOVA) để ước lượng các thông số di truyền trong quần thể nhất là khi có nhiều ảnh hưởng ngẫu nhiên. Vào những năm 1960, bắt nguồn từ sự nghiệp nghiên cứu của Bill Hill, các ước lượng bằng phương pháp này đã được dùng phổ biến trong việc ước lượng các thông số di truyền. Ở phương pháp này các con thú có thể được chia nhóm, mà các thành viên trong nhóm phải có cùng mức độ quan hệ. Khi áp dụng phân tích phương sai để ước lượng người ta thường quan tâm đến cấu trúc gia đình của các thú quan sát: đó là các nhóm anh em cùng cha khác mẹ, hay cùng anh em ruột. Trong trường hợp các nhóm anh em cùng cha khác mẹ các con của một thú cha được xử lý như là một nhóm và các con của các cha khác nhau thì được xem như là các nhóm khác nhau. Đối với phương pháp ANOVA, hiệp phương sai giữa các thành viên của một gia đình hay một nhóm các thú có quan hệ, thường được xác định như là thành phần phương sai giữa các nhóm. Việc tính phương sai giữa các nhóm liên quan đến việc phân chia tổng các bình phương quan sát (SS) thành các nguồn gốc biến thiên khác nhau trong mô hình phân tích. Với việc phân tích thành phần phương sai lần lượt các phương sai giữa các thú cha ( s 2 ), phương sai giữa các thú mẹ ( d 2 ), phương sai sai biệt ( e 2 ) được tính tóan từ đó ta xác định được phương sai di truyền ( A 2 ), phương sai kiểu hình ( P 2 ), tương quan giữa anh em cùng cha khác mẹ (rHS) và anh em ruột (rFS) như sau: 2 2 4 A s 2 2 2 2 P e d s 29 2s2P rHS 2 2 2 P s d rFS Từ những thành phần phương sai trên hệ số di truyền cũng được tính dựa trên tương quan giữa anh em cùng cha khác mẹ như sau: HS s P A P h 4 4.r 2 2 2 2 2 ANOVA không cân bằng Thông thường tất cả các nhóm thú không có số quan sát như nhau, số liệu thường không cân bằng vì vậy các phương pháp tương tự ANOVA đã ra đời để ứng dụng cho các trường hợp số liệu không cân bằng. Được biết đến nhiều nhất là phương pháp 3 của Henderson (1953). Phương pháp này thay thế SS trong ANOVA cân bằng bằng các dạng thức bình phương liên quan đến các đáp số bình phương nhỏ nhất của các ảnh hưởng theo đó các phương sai được ước lượng. Xét mô hình tuyến tính một tính trạng y= Xb + Zu +e Với y, b, u và e là vectơ các số quan sát, các ảnh hưởng cố định, các ảnh hưởng ngẫu nhiên, và các sai số, một cách tương ứng X, Z là các ma trận mẫu. Giả định các mức độ của u liên quan đến nguồn gốc biến thiên, và V(u) = u 2 I; V(e) = e 2 I; cov(u,e’)=0 Các phương trình bình phương nhỏ nhất là: Z y X y b u Z X Z Z X X X Z ˆ ˆ Việc hấp thu các ảnh hưởng cố định rút gọn các phương trình thành Z’MZ u ˆ = Z’My với M = I – X’(X’X)1 X’ Khi nghịch đảo của (X’X) không xảy ra, nghịch đảo tổng quát hóa có thể được sử dụng để thay thế Các thành phần phương sai được ước lượng như sau: 30 2e = ( ( ) ( ) 1 ( ˆ ˆ ) N r X r Z y y u Z y b X y 2e = ( ) ( ˆ ( ( ) 1) ˆ 2) tr Z MZ u ZMy r Z e Với r(X) và r(Z) diển tả hạng cột của X và Z một cách tương ứng, N là số quan sát và tr là vết. Trong phương pháp này, các hiệp phương sai giữa các mức độ của u (tức mối quan hệ giữa các thú cha) là không được tính đến. Việc phát triển các phương pháp 3 có tính đến mối quan hệ giữa các u được đề nghị bởi Sorensen và Kennedy (1986). 2.2.3. Phương pháp REML Năm 1971, Patterson và Thompson đã giới thiệu phương pháp tương đồng tối đa được giới hạn (REML) dựa trên phương pháp tương đồng tối đa (ML) có tính đến việc giảm độ tự do, do việc làm thích hợp các ảnh hưởng cố định. Đây là phương pháp được dùng rộng rãi cho việc ước lượng các thông số di truyền, nhờ khả năng khắc phục những khuyết điểm của các phương pháp trước đó, vì nó có chú ý đến sự chọn lọc nhờ sử dụng các phương trình của mô hình hỗn hợp (MME) của Henderson (1973). Trong REML, mục tiêu là tìm tập hợp các thông số làm tối đa sự tương đồng của số liệu. Sự tương đồng của số liệu cho một mô hình được cho trước có thể được viết như một hàm số. Với REML hàm tương đồng của số liệu được làm tối đa trong “ không gian của các so sánh các sai số”. Nói cách khác, hàm mật độ được làm tối đa sau khi điều chỉnh tất cả các quan sát về các ảnh hưởng cố định. Phương pháp REML được chia thành hai nhóm phương pháp: phương pháp dùng đạo hàm và phương pháp không dùng đạo hàm (Derivative free REMLDFREML). Phương pháp REML dùng đạo hàm Phương pháp này đòi hỏi nhiều tính tóan cho đạo hàm bậc hai ngay cả đối với các mô hình đơn giản, do đó nhiều áp dụng REML lúc đầu đều dựa trên thuật 31 toán EM (Expectation – Maximization algorithm), thuật toán này là phương pháp lặp lại để có các số ước lượng. Phương pháp này đòi hỏi việc đánh giá các đạo hàm bậc nhất của hàm tương đồng để tìm các thông số ban đầu. Xét mô hình y= Xb + Zu +e Với y, b, u và e là vectơ các số quan sát, các ảnh hưởng cố định (trại, năm, mùa), các ảnh hưởng ngẫu nhiên (giá trị gây giống), và các sai số, một cách tương ứng X, Z là các ma trận mẫu. Từ phương trình của mô hình hỗn hợp (MME): Z Y X Y b u Z X Z Z A X X X Z 1 Với: X, Z: là các ma trận mẫu Y : Vectơ các số quan sát X’,Z’: lần lượt là các ma trận chuyển vị của X,Z A: ma trận quan hệ di truyền cộng hợp 2 2 2 2 4 h h e s N gười ta tiến hành tìm ma trận C, là nghịch đảo của phương trình MME tương ứng với các ảnh hưởng ngẫu nhiên. Từ đó, ta lần lượt tính được các ước lượng b,u. Với các đáp số này các tổng bình phương sẽ lần lượt được tính. Từ đó ta sẽ tính được các thành phần phương sai như sau: u 2 u.A1u tr(A1C) e 2 q e 2 Y Y bX Y uZYN r(X ) Trong đó N là số quan sát, q là mức độ của ảnh hưởng di truyền ngẫu nhiên, r(X) là hạng của ma trận X 32 Từ các thành phần phương sai ước lượng có được từ đây người ta dùng các giá trị này trong việc ước lượng các ảnh hưởng của mô hình, điều này sẽ tạo ra một giá trị mới cho các phương sai, và các giá trị mới sẽ lại được dùng tính trở lại cho đến khi các ước lượng mới hầu như bằng với ước lượng của lần lặp lại trước đó. Hay nói cách khác là các giá trị cũ và mới trở nên càng giống nhau và cuối cùng hội tụ vào kết quả cuối cùng và đó chính là những phương sai cần tìm để ước lượng các thông số di truyền. Phương pháp REML không dùng đạo hàm (DFREML) Smith và Graser (1986) đã giới thiệu phương pháp REML không đạo hàm, ở phương pháp này nhóm tác giả trên đã trình bày một thuật toán hiệu quả hơn để ước lượng các thành phần phương sai của các mô hình mà không phải dùng phép nghịch đảo ma trận hệ số của phương trình MME, làm giảm bớt những phức tạp trong tính toán của phương pháp REML dùng đạo hàm. Ở phương pháp này sự tối đa hóa hàm tương đồng cũng được thực hiện bằng việc so sánh các giá trị khác nhau của hàm tương đồng, sau khi hàm này được lọai bỏ các ảnh hưởng cố định. Với thuật toán phi đạo hàm, từ giá trị 2 2u e r dự đoán trước, e 2 được ước lượng theo công thức sau: ( ) ˆ 2 N r X y Py e Với: y’Py là tổng bình phương các sai số (theo Smith và Graser,1986) 1 1 1 1 P V V X (X V X ) X V và V ZAZr I N: số quan sát, r(X): hạng của ma trận X Khi đã ước lượng được e 2 đối với một giá trị r cho trước, ta sẽ tính được ˆ u 2 các phương sai được ước lượng này cũng được tiếp tục ước lượng bằng phương pháp tương đồng tối đa với hàm tương đồng đã lọai bỏ ảnh hưởng cố định: L const q log u N loge YPY logW log A 12 log 2 2 33 Với W là ma trận hệ số của phương trình MME, log A là hằng số không phụ thuộc vào các thông số được quan tâm. Hiện nay, đã có nhiều chương trình máy tính ứng dụng phương pháp DFREML được sử dụng để ước lượng các thành phần phương sai di truyền từ đó ước lượng các thông số di truyền, nhằm giúp cho việc tính toán trở nên dễ dàng hơn và có thể áp dụng cho các dữ liệu có dung lượng lớn làm tăng độ chính xác như: MTDFREML (Boldman và ctv, 1995), VCE (Groenneveld, 1991), DFREML (Meyer, 1988) 2.2.4. Phương pháp Gibbs Sampling 2.2.4.1. Khái quát về thống kê Bayes Lý luận của thống kê Bayes bắt nguồn từ định lý Bayes. Định lý Bayes cho phép tính xác suất xảy ra của một sự kiện ngẫu nhiên X khi biết sự kiện liên quan Y đã xảy ra (P(XY)). Đại lượng này được gọi xác suất hậu nghiệm vì nó được rút ra từ giá trị được cho của Y hoặc phụ thuộc vào giá trị đó, được tính theo công thức sau: ( ) ( ) ( ) ( ) P Y P Y X P X P X Y P(X) là xác suất của X. Xác suất xảy ra X của riêng nó, không quan tâm đến Y, nó được gọi xác suất tiên nghiệm. Phân phối xác xuất tiên nghiệm sẽ có dạng phẳng khi chúng ta không có thông tin cũng như hiểu biết về X, và sẽ có dạng nhọn (có đỉnh) khi mà chúng ta có thông tin về X. P(Y) là xác suất của Y P(Y|X) là xác suất của Y nếu X xảy ra. Hình 2.1. Mô phỏng dạng phân phối xác xuất tiên nghiệm Phân phối dạng phẳng Phân phối dạng có đỉnh nhọn 34 Trường phái tần số Trường phái Bayes Trong ước lượng thông số: phân tích thí nghiệm để đưa ra một khoảng tin cậy có chứa đựng giá trị thật của thông số đó Thông thường giá trị giống được giả định là có phân phối chuẩn, chúng được xử lý như là các ảnh hưởng ngẫu nhiên có tương quan Chỉ sử dụng định lý Bayes cho các biến ngẫu nhiên, có sự phân biệt khi xử lý biến ngẫu nhiên và biến cố định Trong ước lượng thông số:phân tích thí nghiệm để đưa ra một phân phối xác suất về giá trị thật của thông số đó Các phân phối chuẩn của những ảnh hưởng ngẫu nhiên chỉ là một phân phối tiên nghiệm cho các thông số cần tìm Sử dụng định lý Bayes cho cả biến ngẫu nhiên và cố định, không phân biệt 2 loại biến này khi xử lý. Tất cả đều được xử lý như là biến ngẫu nhiên với một phân phối tiên nghiệm thích hợp. Stern (1998) đã nói về lý do tại sao chúng ta nên sử dụng thống kê Bayes, tác giả này cho rằng: trước hết, thống kê bayes cung cấp một phương pháp nhất quán trong phân tích dữ liệu với xác xuất tự nhiên, dựa trên sự giải thích các kết quả. Thứ 2 là nó cho phép vẽ những lý luận bayes chính xác, trong các trường hợp mẫu hữu hạn, ngược lại loại trừ những trường hợp đặc biệt, kiểm tra tần suất và khoảng tin cậy dựa trên những kết quả gần đúng. Cuối cùng là trong những vấn đề đa tham số thì thông tin của số tiên nghiệm thì không phải là không quan trọng như suy nghĩ của 1 số người. Ví dụ, thông tin của số tiên nghiệm có thể gợi ý cho chúng ta rằng một ấn định cho các thông số có thể được xử lý như một mẫu từ một quần thể. Ngày càng có nhiều những động lực thuyết phục hơn trong việc sử dụng thống kê bayes được tìm thấy trong các mô hình mà các mô hình này thì tinh vi hơn so với các mẫu độc lập của chúng ta. Các mô hình tinh vi này thì không nhất thiết phải quá phức tạp, nó thường rất thực tế trong việc giải quyết những vấn đề mang tính chất khoa học. 2.2.4.2. Gibbs Sampling Gibbs Sampling là một trong số các phương pháp Markov Chain Monte Carlo (MCMC) thuộc trường phái thống kê Bayes 35 Theo Goddard (2003), Gibbs Sampling là phương pháp phổ biến nhất để phân tích di truyền trong nhóm phương pháp MCMC. Mục đích của những phương pháp này là lấy mẫu từ những phân phối hậu nghiệm để từ đó tìm khoảng tin cậy của thông số. Trong khi đó đối với thống kê tần số để tìm khoảng tin cậy thì họ đưa ra 2 giả thiết đối lập H0 và H1 từ đó thông qua các trắc nghiệm thống kê để tìm ra khoảng tin cậy này. Trong chọn mẫu Gibbs, chúng ta lấy những mẫu ngẫu nhiên của một thông số tại một thời điểm, mà ta giả định rằng những giá trị hiện tại của các thông số khác đều đúng. Sau đó, chúng ta tiếp tục tiến hành tương tự với thông số tiếp theo, tạo thành 1 vòng tròn liên tục, tất cả các thông số lần lượt được lấy mẫu nhiều lần. Mặc dù không phải là điều dễ thấy nhưng thủ tục này tạo ra các mẫu từ các phân phối hậu nghiệm của tất cả các thông số. Xét mô hình: y= Xb + Zu +e Với y, b, u và e là vectơ các số quan sát, các ảnh hưởng cố định (trại, năm, mùa), các ảnh hưởng ngẫu nhiên (giá trị gây giống), và các sai số, một cách tương ứng X, Z là các ma trận mẫu. Mục đích là có được các mẫu ngẫu nhiên từ các phân phối biên của số hậu nghiệm và tất cả gì chưa biết từ các hàm: fb1 y, fb2 y,….. fu1 y, fu2 y,… f u 2 y, f e 2 y và cũng là có được những kết hợp chưa biết như: f u 2 u 2 e 2 y f h2 y Các mẫu này sẽ được dùng trong việc suy luận tính tóan, chúng có thể dùng cho việc vẽ các đồ thị mà những đồ thị này sẽ cho những hình dạng gần đúng của phân phối hậu nghiệm, và chúng cũng ước lượng các số trung bình, số mode, và trung vị của phân phối, hay là dùng để ước lượng các khỏang tin cậy. Để lấy được các mẫu này, trước tiên phải có được các mẫu hoàn toàn ngẫu nhiên từ phân phối hậu nghiệm của các hàm f b,u, u 2, e 2 y. Điều này sẽ giúp ta có được một ma trận 36 mà mỗi hàng của ma trận là một mẫu của những yếu tố chưa biết và mỗi cột sẽ là tập hợp những điểm được lấy mẫu ngẫu nhiên của đường biên giới hạn phân phối hậu nghiệm. 2 2 1 2 1 2 21 21 11. 21. 11 21 ......... ....... .... .... ......... .... .... ....... .... .... ......... ....... i i i i ui ei u e b b u u b b u u Do đó, các giá trị (b11, ....., b1i,.....) có được ở trên là mẫu ngẫu nhiên của phân phối hậu nghiệm từ hàm fb1 y, và nó sẽ được dùng để suy ra b1, tương tự như vậy đối với các cột khác. Để tính ra được hệ số di truyền thì sau đó ta phải thiết lập thêm cột mới sử dụng u 2 và e 2 ở mỗi hàng, sau đó thiết lập u 21 u 21 e 21,......, u 2i u 2i e 2i,........là một mẫu hoàn toàn ngẫu nhiên của phân phối hậu nghiệm từ hàm f h2 y. Tuy nhiên việc lấy mẫu ngẫu nhiên trực tiếp từ hàm đa chiều f b,u, u 2, e 2 ylà không thể, nên để làm giảm tính đa chiều và lấy mẫu từ hàm này người ta dùng một kỹ thuật lấy mẫu thường dùng nhất của MCMC là Gibbs Sampling. Kỹ thuật này bao gồm việc lấy mẫu từ những phân phối có điều kiện theo cách lặp lại. Viết hàm điều kiện f b1 b2,b3,...,bi,u1,u2,u3,.....ui,......, u 2, e 2, y Sau đó, từ những giá trị cho trước b2,b3,...,bi,u1,u2,u3,.....ui,......, u 2, e 2 và lấy mẫu 1 giá trị ngẫu nhiên của b1 từ hàm phân phối có điều kiện trên. Để làm được điều này, phân phối có điều kiện phải ở dạng mà thuật toán lấy mẫu có thể tiến hành được. Với việc lấy mẫu một cách ngẫu nhiên giá trị b1 và những giá trị cho trước khác, thì việc lấy mẫu ngẫu nhiên của b2 từ hàm phân phối có điều kiện cũng được tính tương tự, cứ như vậy ta lần lượt tìm được từng mẫu cho từng phân phối. Sau đó, chúng ta tiến hành lặp lại để tìm lần lượt mẫu mới trên nhưng giá trị mẫu vừa tìm được, và tiếp tục lặp lại vòng lặp trên, sau vài lần lặp thì một lượng mẫu ngẫu nhiên sẽ được tìm thấy từ các phân phối điều kiện và cũng là từ phân phối tiên nghiệm. Tuy nhiên cần lưu ý để tránh sai lầm trong chọn mẫu Gibbs thì những vòng lặp đầu 37 tiên được coi là chạy thử và bỏ qua trong xem xét số liệu, theo Mike Goddard thì thường khỏang 10% mẫu thu được sẽ được loại bỏ. Hiện nay, đã có chương trình máy tính ứng dụng của phương pháp Gibbs Sampling giúp cho việc tính toán trở nên nhẹ nhàng hơn và dễ ứng dụng hơn như: MTGSAM 2.2.5. Phương pháp R Reverter và ctv (1994) đã giới thiệu phương pháp R dùng để ước lượng các thành phần phương sai ứng dụng trong di truyền động vật. Theo Cantet và ctv (2000) gần đây phương pháp R được đề cử như là một ứng cử viên thay thế cho REML trong việc ước lượng các mẫu phân tán. Sự bắt nguồn của phương pháp R không liên quan đến bất kỳ một nguyên tắc tổng quát để có được số ước lượng như là các phương trình MME, hay phương trình bình phương nhỏ nhất. Tuy nhiên hiện nay ở nước ta phương pháp này trong phân tích di truyền động vật vẫn chưa có ứng dụng cũng như nghiên cứu nào. 2.3. Một số nghiên cứu sử dụng phương pháp DFREML và Gibbs Sampling trong ước lượng các thông số di truyền Hiện nay, việc sử dụng phương pháp DFREML và Gibbs Sampling trong ước lượng các thông số di truyền rất phổ biến ở nhiều nước trên thế giới. Sau đây là một số nghiên cứu đã áp dụng các phương pháp này: Southwood và Kennedy (1991), trong nghiên cứu của mình đã dùng phương pháp DFREML để ước lượng thông số di truyền của các tính trạng: tổng số heo con sinh ra (NOBN), số heo con sinh ra còn sống (NOBA), số heo con cai sữa (NOWN),với dữ liệu thu thập từ 3.944 lứa đẻ đầu tiên của các giống heo Yorkshire và Landrace thuần được sinh trong giai đoan từ giữa 2 năm 1977 và 1987. Các thông số di truyền của các tính trạng này được ghi nhận như sau: Giống NOBN NOBA NOWN Y 0,127 0,131 0,1 L 0,133 0,086 0,068 38 Năm 1998, trong Hội nghị thế giới lần 6 về Di truyền ứng dụng trong chăn nuôi gia súc tại Australia, Boesch, R Roehe và ctv, đã trình bày một nghiên cứu trên 18.876 ổ đẻ của 3.387 nái Landrace , 2.750 nái Yorkshire và 12.183 ổ đẻ của 3.347 nái lai giữa 2 giống trên dùng để ước lượng hệ số di truyền và hệ số tương quan di truyền giữa năng suất giống thuần và giống lai về tính trạng số con sơ sinh còn sống. Các ước lượng được so sánh bởi chương trình Gibbs Sampling và MTDFREML. Hệ số di truyền ước lượng được từ các giống thuần thì cao hơn các giống lai, hệ số tương quan di truyền giữa giống lai và giống Y thì cao hơn giống lai và giống L. Ảnh hưởng ngọai cảnh thường trực tác động lên giống lai thì cao hơn giống thuần. Kết quả được trình bày như sau: Các thông số di truyền MTGSAM MTDFREML h2Y h2L h2lai r g(Y:lai) r g(L:lai) c 2 Y c2L c 2 lai r e Y r e L r e lai 0,08 0,07 0,02 0,74 0,49 0,10 0,11 0,12 0,82 0,82 0,86 0,08 0,07 0,02 0,81 0,59 0,10 0,11 0,12 0,82 0,82 0,85 Với: h2Y (L, lai): hệ số di truyền giống Y(L, lai), rg(Y:lai) : tương quan di truyền giữa giống Y(hoặc giống landrace) và giống lai, c2Y: ảnh hưởng ngọai cảnh thường trực lên giống Yorkshire (hoặc Landrace, hoặc giống lai), re : hệ số tương quan ngọai cảnh. 39 Holm và ctv (2004) áp dụng phương pháp Gibbs Sampling để ước lượng mối quan hệ di truyền giữa bốn tính trạng: Số con sơ sinh còn sống, thời gian sinh, sự cần thiết có sự hỗ trợ sinh, số heo con chết khi sinh, của 6.718 nái Norwegian Landrace đẻ lứa đầu mang thai trong gia đoạn từ năm 20012003. Chuỗi Gibbs được thực hiện qua 100.000 vòng lặp, và 10.000 mẫu có được đầu tiên được bỏ qua, 90.000 vòng lặp còn lại được dùng để phân tích Gibbs. Kết quả về hệ số di truyền của các tính trạng: số con sinh ra còn sống là 0,07. thời gian sinh là 0,05, sự cần thiết hỗ trợ sinh sản là 0,05, số heo con chết khi sinh là 0,04. Tương quan di truyền: giữa số con sơ sinh sốngổ và sự cần thiết hỗ trợ sinh sản là r g= 0,24 + 0,01, giữa số con sơ sinh sốngổ và thời gian sinh là rg= 0,2 + 0,01, giữa số con chết khi sinh và cần thiết hỗ trợ sinh sản là rg= 0,74 + 0,01, giữa số con chết khi sinh và thời gian sinh là rg= 0,66 + 0,01, giữa thời gian sinh và sự cần thiết hỗ trợ sinh sản là rg= 0,89 + 0,00. Norris và ctv (2006) đã trình bày ước lượng phương sai di truyền cộng hợp và phương sai tính trội trên giống heo Landrace ở Nam Mỹ với phương pháp dùng để ước lượng các thành phần phương sai và thông số di truyền từ những phân phối tiên nghiệm là Gibbs Sampling. Các tính trạng được theo dõi là: số con sơ sinh còn sống, trọng lượng 21 ngày tuổi, khoảng cách lứa đẻ của giống heo Landrace Nam Mỹ. Với 26.223 số liệu về số con còn sống, 21.335 số liệu về trọng lượng 21 ngày tuổi, 16.370 số liệu về khoảng cách lứa đẻ. Mô hình phân tích: sử dụng mô hình lặp lại. Kết quả phân tích được trình bày như sau: Số con sơ sinh sốngổ Khoảng cách lứa đẻ Trọng lượng 21 h 2 A 0,103 0,020 0,067 D 2 0,068 0,058 0,019 P 2 0,001 0,025 0,057 h 2 A = hệ số di truyền của các ảnh hưởng cộng hợp, D2 = tỷ lệ phương sai của những ảnh hưởng tính trội, P 2 = tỉ lệ phương sai của các ảnh hưởng thường trực 40 2.4 Giá trị gây giống 2.4.1 Giá trị gây giống Trong mô hình di truyền cơ bản, giá trị kiểu hình của một tính trạng nào đó là kết quả của giá trị di truyền và ngoại cảnh : P G E Tuy nhiên, phân tích sâu hơn người ta chia giá trị di truyền thành các ảnh hưởng di truyền công hợp, ảnh hưởng tính trội và ảnh hưởng ức chế. Từ đó, giá trị kiểu hình của môt tính trạng có thể được biểu diễn bằng phương trình sau: P A D I E Với: P: giá trị kiểu hình, A: ảnh hưởng di truyền cộng hợp, D ảnh hưởng tính trội, I: ảnh hưởng át chế, E: ảnh hưởng của môi trường đến giá trị kiểu hình. Giá trị giống là phần giá trị di truyền được truyền cho đời con, nhưng xét trong giá trị di truyền ta thấy các ảnh hưởng tính trội, ảnh hưởng át chế sẽ không được truyền lại cho đời con trong khi đó ảnh hưởng của di truyền cộng hợp A là được truyền lại cho đời con nên nó chính là giá trị gây giống và mỗi thú cha mẹ sẽ truyền ½ giá trị A của nó cho con. 2.4.2 Ước lượng giá trị gây giống Giá trị gây giống của một con thú được ước lượng dựa vào các đo lường kiểu hình trên chính con thú đó vàhay trên các thú có quan hệ thân tộc với nó. Dựa trên giá trị kiểu hình bản thân: EBV h2(P i P) Trong đó: EBV: giá trị gây giống ước lượng P i : giá trị kiểu hình của tính trạng i P : trung bình của nhóm tương đồng Dựa trên giá trị kiểu hình và thông tin gia phả: Trên nền tảng thống kê cổ điển (thống kê tần số) ta có: phương pháp dự đóan tuyến tính vô tư nhất (BLUP: Best linear Unbiased Prediction), đây là phương pháp chính xác và được sử dụng phổ biến trên thế giới với chương trình PEST. 41 Trên nền tảng lý luận của thống kê Bayes ta có phương p
BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC NÔNG LÂM TP HỒ CHÍ MINH -*** CAO PHƯỚC UYÊN TRÂN ƯỚC LƯỢNG CÁC THÔNG SỐ DI TRUYỀN VÀ GIÁ TRỊ GÂY GIỐNG CỦA MỘT SỐ TÍNH TRẠNG SINH SẢN THEO PHƯƠNG PHÁP DFREML, BLUP VÀ GIBBS SAMPLING TRÊN CÁC GIỐNG HEO TẠI TRẠI HEO CAO SẢN KIM LONG LUẬN VĂN THẠC SĨ KHOA HỌC NƠNG NGHIỆP Thành phố Hồ Chí Minh Tháng 08/2009 BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC NÔNG LÂM TP HỒ CHÍ MINH -*** CAO PHƯỚC UYÊN TRÂN ƯỚC LƯỢNG CÁC THÔNG SỐ DI TRUYỀN VÀ GIÁ TRỊ GÂY GIỐNG CỦA MỘT SỐ TÍNH TRẠNG SINH SẢN THEO PHƯƠNG PHÁP DFREML, BLUP VÀ GIBBS SAMPLING TRÊN CÁC GIỐNG HEO TẠI TRẠI HEO CAO SẢN KIM LONG Chuyên ngành : Chăn Nuôi Mã số : 60.62.40 LUẬN VĂN THẠC SĨ KHOA HỌC NÔNG NGHIỆP Hướng dẫn khoa học: PGS.TS TRỊNH CÔNG THÀNH Thành phố Hồ Chí Minh Tháng 8/2009 ƯỚC LƯỢNG CÁC THƠNG SỐ DI TRUYỀN VÀ GIÁ TRỊ GÂY GIỐNG CỦA MỘT SỐ TÍNH TRẠNG SINH SẢN THEO PHƯƠNG PHÁP DFREML, BLUP VÀ GIBBS SAMPLING TRÊN CÁC GIỐNG HEO TẠI TRẠI HEO CAO SẢN KIM LONG CAO PHƯỚC UYÊN TRÂN Hội đồng chấm luận văn: Chủ tịch: TS VÕ THỊ TUYẾT Trường Đại học Nơng Lâm TP Hồ Chí Minh Thư ký: TS TRẦN VĂN CHÍNH Trường Đại học Nơng Lâm TP Hồ Chí Minh Phản biện 1: TS KIỀU MINH LỰC Công ty CP Group Việt Nam Phản biện 2: TS ĐỒN VĂN GIẢI Cơng ty cổ phần đầu tư, thương mại, chăn nuôi Đông Á Ủy viên: PGS TS TRỊNH CƠNG THÀNH Trường Đại học Nơng Lâm TP Hồ Chí Minh ĐẠI HỌC NƠNG LÂM TP HỒ CHÍ MINH HIỆU TRƯỞNG LÝ LỊCH CÁ NHÂN Tơi tên Cao Phước Uyên Trân, sinh ngày 27 tháng 01 năm 1981 thành phố Hồ Chí Minh, Ông Cao Phước Hiệp Bà Hồ Thị Nguyên Tốt nghiệp tú tài Trường Trung học phổ thông chuyên Lê Hồng Phong, Q.5 Thành phố Hồ Chí Minh năm 2000 Tốt nghiệp Đại học: ngành Chăn ni hệ quy năm 2005, ngành Thú Y hệ quy năm 2008, Đại học Nơng Lâm TP Hồ Chí Minh Từ năm 2006 đến làm việc Bộ Môn Di Truyền Giống- Khoa Chăn Nuôi Thú Y- trường ĐH Nông Lâm TP.HCM, chức vụ giảng viên Tháng 09 năm 2006 theo học Cao học ngành Chăn nuôi Đại học Nơng Lâm TP Hồ Chí Minh Trình trạng gia đình: Chồng: Lê Chí Thành, năm kết 2006 Con: Lê Cao Bảo Quỳnh, năm sinh 2009 Địa liên lạc: 425/10A Phạm Văn Hai F3, Q.Tân Bình, TP Hồ Chí Minh Điện thoại: 0918.605.456 Email: caophuocuyentran271@yahoo.com LỜI CAM ĐOAN Tơi cam đoan cơng trình nghiên cứu Các số liệu, kết nêu luận văn trung thực chưa công bố cơng trình khác Cao Phước Un Trân CẢM TẠ Tôi xin chân thành cảm ơn Ban Giám hiệu Trường Đại học Nơng Lâm TP Hồ Chí Minh, Ban Chủ Nhiệm Khoa quý Thầy Cô Khoa Chăn Ni Thú Y q Thầy Cơ Phịng đào tạo Sau đại học tạo điều kiện thuận lợi, tận tình giúp đỡ động viên cho tơi bạn lớp hồn thành tốt khóa học Cao học Chăn ni 2006 Tơi xin bày tỏ lịng biết ơn chân thành tình cảm đến quý Thầy Cô Bộ Môn Di Truyền Giống, Bộ Môn Chăn Nuôi Chuyên Khoa hết lòng động viên, chia khó khăn, giúp đỡ tạo điều kiện cho tơi học hồn thành khóa học Đặc biệt Thầy Phạm Trọng Nghĩa, Thầy Trần Văn Chính em Trần Đoàn Vĩnh Khánh - người hết lịng dạy dỗ, hỗ trợ tơi cơng việc để tơi có điều kiện học tập Tơi xin bày tỏ lịng biết ơn chân thành kính trọng đến Thầy Trịnh Công Thành – Giáo viên hướng dẫn luận văn tốt nghiệp cao học đồng thời trưởng mơn Di truyền Giống- người kiên trì tận tụy truyền đạt kiến thức, gợi mở cho đường nghiên cứu, học tập giảng dạy Tôi xin chân thành cảm ơn Ban Giám đốc Trại heo cao sản Kim Long, anh chị kỹ thuật giống, công nhân viên trại thu thập cung cấp số liệu cho tơi Nếu khơng có kiên trì làm việc tinh thần chia sẻ thơng tin trại anh chị, luận văn khơng thể có Tơi xin chân thành cảm ơn anh, chị, bạn lớp cao học 2006 kề vai sát cánh học tập, trao đổi, tìm hiểu tri thức suốt khóa học Và tơi xin bày tỏ tình u đến người ruột thịt ,thân yêu sinh ra, lo lắng, gánh vác giúp đỡ suốt chặng đường qua đến ngày sau TĨM TẮT Đề tài “Ước lượng thơng số di truyền giá trị gây giống số tính trạng sinh sản theo hai phương pháp DFREML, BLUP Gibbs Sampling số giống heo trại heo giống cao sản Kim Long” Đề tài tiến hành từ tháng 08/2008 đến tháng 08/2009 với 2.018 số liệu tính trạng số sơ sinh sống/ổ, 1.558 số liệu tính trạng trọng lượng 21 ngày tuổi/ổ 855 nái Landrace 1.618 số liệu tính trạng số sơ sinh sống/ổ, 1.177 số liệu tính trạng trọng lượng 21 ngày tuổi/ổ 625 nái Yorkshire trại có năm sinh từ năm 2000 đến năm 2008 Mục tiêu áp dụng phương pháp chọn mẫu Gibbs DFREML-BLUP để ước lượng số thông số di truyền, giá trị giống số tính trạng sinh sản so sánh kết đạt Kết nghiên cứu cho thấy thông số di truyền ước lượng theo phương pháp DFREML Gibbs có khác biệt, mức độ khác biệt thay đổi theo giống tính trạng : Hệ số di truyền tính trạng SCS nhóm giống Landrace 0,092 (GS-S) 0,076 (DFREML) cao Yorkshire 0,064 (GS-S) 0,066 (DFREML) Hệ số di truyền tính trạng TL21 nhóm Landrace 0,070 (GS-S) 0,071 (DFREML),Yorkshire 0,052 (GS-S) 0,079 (DFREML) Tương quan kiểu hình tính trạng âm với nhóm giống Landrace -0,052 (GS-S), -0,044 (DFREML), nhóm giống Yorkshire -0,006 (GS-S); -0,005 (DFREML) Tương quan di truyền tính trạng theo phương pháp 0,177 (GS-S) 0,397 (DFREML) nhóm giống Landrace; 0,174 (GS-S) 0,390 (DFREML) nhóm giống Yorkshire Giá trị gây giống ước lượng có khác biệt phương pháp Phương pháp GS-S cho kết cao phương pháp BLUP tính trạng SCS giống (đàn heo Landrace + 0,065 (GS-S); - 0,009 (BLUP); đàn heo Yorkshire + 0,042 (GS-S); - 0,017 (BLUP)) Ngược lại tính trạng TL21 kết theo BLUP cao GS-S đàn heo Yorkshire (+ 0,034(GS-S); + 0,041(BLUP)) thấp đàn heo Landrace (+ 0,039 (GS-S); +0,173 (BLUP)) Sự phù hợp phương pháp GS BLUP việc xếp hạng heo dựa giá trị gây giống khơng cao Hệ số tương quan Spearman nhóm giống Landrace 0,74 (SCS), 0,78 (TL21); nhóm giống Yorkshire 0,72 (SCS), 0,78 (TL21) với P < 0,0001 ABSTRACT The study “Estimation of genetic parameters and breeding values for some reproduction traits of pig by DFREML-BLUP and Gibbs Sampling at Kim Long pig Farm, Binh Duong province” The study was carried out from August 2008 to August 2009 Data contained 855 Landrace sows with 2.018 records of number born alive (SCS), 1.558 records of litter weight at 21 days of age (TL21), and 625 Yorkshire sows with 1.618 records of number born alive (SCS), 1.177 records of litter weight at 21 days of age (TL21), these sow were born from 2000 to 2008 The aims of this study are to estimate genetic parameters and breeding values of SCS and TL21 for Yorkshire and Landrace pigs by Gibbs Sampling and DFREML-BLUP, and to compare breeding values estimated by two methods There were differences about variance components and genetic parameters estimated by MTGSAM and DFREML, levels of differences depend on breed and traits: Heritabilities of SCS Landrace estimated by GS and DFREML were 0,092 (GS-S) and 0,076 (DFREML) higher than those of Yorkshire: 0,064(GS-S) and 0,066 (DFREML) Heritabilities of TL21 of Landrace estimated were 0,070 (GS-S) and 0,071 (DFREML), Yorkshire were 0,052 (GS-S) and 0,079 (DFREML) Phenotype correlations between two traits were negative with Landrace being -0,052 (GS-S); -0,044(DFREML), Yorkshire -0,006 (GS-S); -0,005 (DFREML) Genetic correlations between two traits were 0,177 (GS-S) and 0,397 (DFREML) of Landrace; 0,174 (GS-S) and 0,390 (DFREML) of Yorkshire Estimated breeding values were different between two methods, too Result of GS-S method was higher BLUP method in SCS of two breed (Landrace: + 0,065 (GS-S); - 0,009 (BLUP); Yorkshire + 0,042 (GS-S); 0,017 (BLUP)) Conversely, estimated breeding values of TL21 trait estimated with BLUP were higher than those estimated with GS-S in Yorkshire (+ 0,034 (GS-S); +0,041(BLUP)) but lower in Landrace (+0,039 (GS-S); +0,173 (BLUP)) The agreement of two methods GS and BLUP in EBV based ranking was not strong Spearman rank correlation of Landrace were 0,74 (SCS), 0,78 (TL21); Yorkshire were 0,72 (SCS), 0,78 (TL21) with (P < 0,0001) 1.00 2.50 2.00 0.433 GS-S EBV 1.00 -3.00 0.50 -1.50 0.00 -2.00 -1.00 -0.500.00 Hieu so EBV 1.50 1.00 2.00 3.00 -1.00 0.50 0.00 -0.50 0.00 0.50 1.00 1.50 hs2 -0.50 hstb-2SD -0.550 hstb+2SD -1.00 -1.00 -1.50 -2.00 EBV -1.50 -2.50 trungbìnhEBV BLUPEBV Biểuđồ4.10:MứcđộphùhợpgiữaBLUPEBVvàGS-SEBVcủatínhtrạngscsnhómgiốngYorkshire 62 0.30 2.50 0.20 2.00 0.50 -1.00 0.00 -0.50 1.00 -1.00 -1.50 2.00 3.00 hstb-2SD hstb+2SD -1.00 0.00 -2.00 0.10 Hieu so EBV GS-S EBV 1.00 -3.00 HS3 0.117 1.50 -0.50 0.00 0.00 0.50 1.00 1.50 -0.10 -0.133 -0.20 EBV -0.30 -2.00 trungbìnhEBV -2.50 GS-FEBV Biểuđồ4.11:MứcđộphùhợpgiữaGS-F EBVvàGS-SEBVcủatínhtrạngscsnhómgiốngYorkshire 63 1.00 y = 0.0071x - 14.206 R = 0.0064 y = -0.0004x + 0.879 R = 0.0001 0.80 EBV 0.60 y = -0.0003x + 0.6194 R = 3E-05 0.40 0.20 0.00 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 -0.20 BLUP -0.40 GS-F năm GS-S Linear (BLUP) Linear (GS-F) Linear (GS-S) Biểu đồ 4.12: Giá trị EBV theo năm sinh khuynh hướng di truyền tính trạng SCS giống Yorkshire Bảng 4.7: Hệ số tương quan spearman giá trị gây giống tính trạng SCS nhóm giống Yorkshire ước lượng Blup GS Phương pháp GS-F EBV GS-F EBV GS-S EBV BLUP EBV 0,725 0,997 64 0,724 3.00 2.00 1.257 5.00 1.00 Hieu so EBV 4.00 3.00 GS-F EBV 2.00 1.00 -6.00 -4.00 -2.00 0.00 -1.000.00 -2.00 -3.00 2.00 4.00 -4.00 -3.00 EBV -1.00 0.00 0.00 hs 1.00 2.00 3.00 4.00 -1.00 -1.274 6.00 -2.00 hstb+2SD -2.00 -3.00 -4.00 -4.00 trung bình EBV -5.00 BLUP EBV Biểu đồ 4.13: Mức độ phù hợp BLUP EBV GS-F EBV tính trạng TL21 nhóm giống Yorkshire 65 hstb-2SD 3.00 5.00 2.00 4.00 1.321 3.00 GS-S EBV -6.00 0.00 -4.00 -3.00 -2.00 -1.00 0.00 1.00 2.00 3.00 4.00 -1.00 1.00 0.00 -4.00 -2.00 -1.000.00 Hieu so EBV 1.00 2.00 2.00 4.00 6.00 -2.00 -2.00 -3.00 -3.00 -4.00 -1.306 EBV -4.00 trungbìnhEBV -5.00 BLUPEBV Biểuđồ4.14:MứcđộphùhợpgiữaBLUP EBVvàGS-SEBVcủatínhtrạngTL21nhómgiốngYorkshire 66 hs2 hstb-2SD hstb+2SD 1.50 5.00 4.00 1.00 3.00 GS-S EBV 2.00 -6.00 1.00 0.00 -4.00 -2.00 -1.000.00 Hieu so EBV 0.554 -3.00 2.00 4.00 6.00 0.50 -2.00 0.00 -1.00 0.00 1.00 3.00 4.00 -0.50 HS3 -0.523 -2.00 -1.00 -3.00 -4.00 2.00 EBV -1.50 -5.00 trungbìnhEBV GS-FEBV Biểuđồ4.15:MứcđộphùhợpgiữaGS-FEBVvàGS-SEBVcủatínhtrạngTL21nhómgiốngYorkshire 67 hstb-2SD hstb+2SD y = -0.0717x + 144.09 R = 0.1005 y = -0.0162x + 32.567 R = 0.0327 y = -0.0125x + 25.097 R = 0.0393 EBV 1.5 0.5 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 -0.5 BLUP GS-F GS-S Linear (BLUP) Linear (GS-F) Linear (GS-S) năm Biểu đồ 4.16: Giá trị EBV theo năm sinh khuynh hướng di truyền tính trạng TL21 giống Yorkshire Bảng 4.8: Hệ số tương quan spearman giá trị gây giống tính trạng TL21 nhóm giống Yorkshire ước lượng Blup GS Phương pháp GS-F EBV GS-F EBV GS-S EBV BLUP EBV 0,779 0,996 0,781 Tóm lại, kết sau sử dụng phân tích đơn biến phương pháp GS BLUP với tính trạng nhóm giống cho thấy có khác biệt thành phần phương sai thông số di truyền ước lượng phương pháp Việc sử dụng dạng phân phối số tiên nghiệm (thông số định dạng) khác nghiên cứu phương pháp GS có khác biệt kết không nhiều, điều thể rõ xếp hạng giá trị gây giống ước lượng phương pháp GS hai dạng phân phối phẳng nhọn có mức độ phù hợp cao (biểu đồ Bland & Altman) với hệ số tương quan Spearman 0,99 tính trạng giống Việc xếp hạng thú theo giá trị gây giống ước lượng từ 68 hai phương pháp GS BLUP tính trạng giống có mức độ phù hợp khơng cao (0,7) Khuynh hướng di truyền tính trạng nhóm giống Yorkshire có xu hướng tăng thấp (tính trạng SCS) giảm (tính trạng TL21), nhóm giống Landrace có xu hướng tăng Sự thay đổi EBV hai tính trạng phụ thuộc vào năm sinh nhóm giống Landrace cao nhóm Yorkshire 300 250 Frequency 200 150 100 50 12 SCSLAND 15 18 21 12 SCSYORK 15 18 21 200 Frequency 150 100 50 Biểu đồ 4.17 : Kiểm tra dạng phân phối tính trạng số sơ sinh sống/ổ 69 180 160 140 Frequency 120 100 80 60 40 20 40 48 56 64 72 TL21LAND 80 88 96 120 100 Frequency 80 60 40 20 40 48 56 64 TL21YORK 72 80 88 Biểu đồ 4.18: Kiểm tra dạng phân phối tính trạng trọng lượng 21 ngày tuổi Các biểu đồ 4.17, 4.18 dùng để kiểm tra dạng phân phối tính trạng nhóm giống, tính trạng theo số liệu thu thập trại lệch so với phân phối chuẩn (P