Trước khi thực hiện phân tích gộp, mức độ dị biệt giữa các nghiên cứu cần được đánh giá. Bất kì sự khác nhau nào giữa các nghiên cứu trong tổng quan hệ thống đều được gọi là “dị biệt” [89]. Mức độ dị biệt, ký hiệu là I2, là % tổng những khác biệt giữa các nghiên cứu [88].
Phân tích gộp được thực hiện theo một trong hai mô hình : phân tích gộp ảnh hưởng bất biến (hay còn gọi là phân tích gộp cố định ảnh hưởng) và phân thích gộp ảnh hưởng biến thiên [2, 89].
Sử dụng mô hình ảnh hưởng bất biến với giả định: các nghiên cứu đều đồng nhất như nhau. Có khác biệt nhau chẳng qua chỉ là do ngẫu nhiên. Tập hợp giá trị mức độ ảnh hưởng của các nghiên cứu sẽ tuân theo phân phối chuẩn [130]. Trong đó, mức độ ảnh hưởng (hay độ ảnh hưởng) của mỗi nghiên cứu là một chỉ số định lượng về độ ảnh hưởng của một can thiệp [3, 102].
Sử dụng mô hình ảnh hưởng biến thiên với giả định: các nghiên cứu không đồng nhất như nhau. Mỗi nghiên cứu nếu được lặp lại rất nhiều lần thì sẽ phân phối quanh một giá trị nhất định (theo phân phối chuẩn). Tập hợp các giá trị “nhất định đấy” tuân theo phân phối chuẩn [130].
Kết quả của phân tích gộp được thể hiện bằng 2 biểu đồ chính là biểu đồ gộp và biểu đồ phễu [89].
Biểu đồ gộp hiển thị các mức độ ảnh hưởng và khoảng tin cậy của từng nghiên cứu đơn lẻ và của cả nghiên cứu phân tích gộp. Mỗi nghiên cứu được trình
20
bày dưới dạng một hình vuông nằm giữa một đoạn kẻ ngang. Diện tích của hình vuông biểu thị độ lớn của trọng số, còn đoạn thẳng nằm ngang biểu thị khoảng tin cậy của mức độ ảnh hưởng. Trọng số là sự đóng góp của từng nghiên cứu vào chỉ số thống kê chung. Những nghiên cứu với cỡ mẫu lớn có trọng số lớn hơn các nghiên cứu có cỡ mẫu nhỏ [89].
Biểu đồ phễu là một loại biểu đồ phân tán đơn giản về các hệ số ảnh hưởng trong các nghiên cứu đơn lẻ so với thông số về cỡ mẫu hoặc độ chính xác của từng nghiên cứu tương ứng [89]. Độ chính xác (ký hiệu là precision) là nghịch đảo của sai số chuẩn của mức độ ảnh hưởng ở mỗi nghiên cứu [2]. Thông thường trong một biểu đồ phễu, trục hoành thể hiện mức độ ảnh hưởng, và trục tung thể hiện thông số về cỡ mẫu (hoặc độ chính xác).
Biểu đồ phễu thể hiện khả năng thiên vị trong xuất bản. Nếu biểu đồ phễu cân đối thì không xảy ra thiên vị xuất bản, ngược lại, sự thiếu cân đối của biểu đồ phễu là dấu hiệu cho thấy có sự thiên vị trong xuất bản [2, 89]. Biểu đồ phễu chỉ nên được sử dụng khi phép phân tích gộp bao gồm ít nhất 10 nghiên cứu, vì nếu có ít hơn 10 nghiên cứu, khả năng nhận định sự bất đối xứng trong biểu đồ phễu là rất thấp [89].