Dữ liệu giải trình tự được phân tích bằng phần mềm Miseq Reporter 2.6 và BlueFuse Multi 4.0 của hãng Illumina Mỹ.
- Số liệu khảo sát được phân tích bằng phần mềm STATA 12.0.
Số liệu được nhập vào hệ thống cơ sở dữ liệu bằng cách mã hóa cho từng bệnh nhân, từng phôi và lưu trong file dưới dạng file excel. Đề tài sử dụng các thuật toán về phân tích thống kê mô tả, thống kê suy luận và phân tích tương quan (các thuật toán có ý nghĩa thống kê khi p < 0,05). Trong đó, phân tích thông kê mô tả đối với biến định tính được thực hiện thông qua dưới dạng tần số và tỷ lệ phần trăm, dạng độ tập trung (trung bình, trung vị) và độ phân tán (biên
độ, độ lệch chuẩn, phương sai) với các biến định lượng 73 . Sử dụng các kiểm
định phù hợp với từng loại số liệu và đặc điểm phân bố của dữ liệu.
Xác định tương quan, liên quan giữa các biến định lượng qua hệ số tương quan và hồi quy tuyến tính. Sử dụng hệ số tương quan Pearson r để đánh giá mối tương quan giữa các biến định lượng có phân phối chuẩn.
Hệ số tương quan r có giá trị (-1) → (+1), r > 0 tương quan là đồng biến, r < 0 tương quan là nghịch biến.
r < 0,3: tương quan yếu
0,3 ≤ r < 0,5: tương quan trung bình 0,5 ≤ r < 0,7: tương quan chặt r ≥ 0,7: tương quan rất chặt.
Đối với phân tích hồi quy tuyến tính: xây dựng phương trình toán học thể hiện mối quan hệ giữa 1 biến số định lượng với một hay nhiều biến khác (biến độc lập): Y = a + bx1 + cx2 + dx3 + …
Y: biến số phụ thuộc (là biến định lượng, phân bố chuẩn) X: biến độc lập (có thể là biến định lượng hoặc định tính) a: hằng số