Phần 3 Vật liệu và phƣơng pháp nghiên cứu
3.5. Phƣơng pháp nghiên cứu
3.5.8. Lập bản đồ liên kết (GWAS)
Phân tích liên kết đƣợc thực hiện cho cả tập đoàn giống nghiên cứu, với tổng 185 mẫu giống và 21623 marker; cho nhóm giống thuộc lồi phụ indica với
115 giống và 13814 marker; và nhóm giống thuộc lồi phụ japonica với 64 giống và 8821 marker; sử dụng phần mềm TASSEL v3 (Bradbury et al., 2007). Sử
dụng mơ hình hỗn hợp (MLM2), với các thông số về cấu trúc quần thể (PCA– Q) và quan hệ họ hàng (Kinship – K) để hạn chế tỷ lệ dƣơng tính giả có thể xảy ra. Sử dụng tùy chọn không nén (no compression) và đánh giá lại thành phần phƣơng sai cho mỗi điểm đánh dấu (re-evaluation) trong q trình phân tích. Ba ma trận đƣợc đƣa vào dữ liệu đầu vào là: 1) dữ liệu phân tích cấu trúc quần thể, gồm 6 trục PCA đầu tiên đƣợc giữa lại và tỷ lệ phần trăm thành phần di truyền của các mẫu giống tham gia trục cấu trúc đó; 2) ma trận thể hiện mối quan hệ họ hàng giữa các mẫu nghiên cứu (Kinship –K), đƣợc thiết lập bằng chỉ số IBS (the pairwise Identity by State) đƣợc tính bởi TASSEL; 3) dữ liệu genotyping của các giống và số liệu kiểu hình tƣơng ứng. Các QQ-plots đƣợc vẽ bởi TASSEL là căn cứ để đánh giá số lƣợng các dƣơng tính giả so với mơ hình chuẩn. Chỉ số lạm phát lambda (λ) đƣợc tính tốn để ƣớc lƣợng độ lệch giữa phân bố thực tế của P- value với đƣờng hồi quy tiêu chuẩn, sử dụng hàm “estlambda” từ gói cơng cụ GenABEL của phần mềm R. Nếu giá trị của λ = 1 thì tức là khơng có tình huống lạm phát xảy ra. Ngƣỡng P-value đƣợc chọn để xác định sự kiện liên kết xảy ra đáng tin cậy là ≤ 1e-04. Sau đó, chúng tơi tính giá trị q tƣơng ứng với từng giá trị P-value để kiểm tra mức độ tin cậy của các P-value, sử dụng gói phần mềm R Q V1.0 (Gao, 2011). Đồ thị “Manhattan plots” biểu diễn giá trị P-value của tất cả các điểm đánh dấu trên từng nhiễm sắc thể khác nhau đƣợc chúng tôi vẽ bằng cơng cụ hỗ trợ có sẵn trong TASSEL.