Nghiên cứu tổng quan hệ thống và phân tích dữ liệu microarray biểu hiện gen sfrp5 trong mô mỡ chuột Nghiên cứu tổng quan hệ thống và phân tích dữ liệu microarray biểu hiện gen sfrp5 trong mô mỡ chuột
Trang 1ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-
VŨ THỊ HUỆ
NGHIÊN CỨU TỔNG QUAN HỆ THỐNG VÀ PHÂN TÍCH
DỮ LIỆU MICROARRAY BIỂU HIỆN GEN SFRP5 TRONG
MÔ MỠ CHUỘT
LUẬN VĂN THẠC SĨ KHOA HỌC
Hà Nội – Năm 2023
Trang 2ĐẠI HỌC QUỐC GIA HÀ NỘI
TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN
-
VŨ THỊ HUỆ
NGHIÊN CỨU TỔNG QUAN HỆ THỐNG VÀ PHÂN TÍCH
DỮ LIỆU MICROARRAY BIỂU HIỆN GEN SFRP5 TRONG
MÔ MỠ CHUỘT
Chuyên ngành: Công nghệ sinh học
Mã số: 8420201.22
LUẬN VĂN THẠC SĨ KHOA HỌC
NGƯỜI HƯỚNG DẪN KHOA HỌC:
TS Tô Thanh Thúy
TS Chu Đình Tới
Hà Nội – Năm 2023
Trang 3LỜI CẢM ƠN
Tôi xin chân thành cảm ơn TS Chu Đình Tới, Trưởng Khoa Các khoa học
ứng dụng, Giám đốc Trung tâm Y sinh và sức khỏe cộng đồng Trường Quốc tế, ĐHQGHN là người trực tiếp đồng hành cùng tôi trong thời gian nghiên cứu vừa qua Nghiên cứu này được tài trợ bởi Quỹ Phát triển khoa học và công nghệ Quốc gia (NAFOSTED) trong đề tài mã số 106.02.2019.314 (Cho TS Chu Đình Tới)
Tôi cũng xin gửi lời cảm ơn sâu sắc tới TS Tô Thanh Thúy, Giảng viên Bộ
môn Sinh lý học và Sinh học người, Khoa Sinh học, Trường Đại học Khoa học Tự nhiên, ĐHQGHN đã luôn tận tình hỗ trợ và giúp đỡ tôi trong việc hoàn thiện luận văn một cách hoàn chỉnh nhất
Xin được cảm ơn Ban giám hiệu Trường Quốc tế, ĐHQGHN đã luôn tạo
điều kiện để tôi cân bằng được công việc của nhà trường và việc học của bản thân
Bên cạnh đó, tôi xin cảm ơn gia đình, bạn bè, các thành viên của Trung tâm
Y sinh và sức khỏe cộng đồng Trường Quốc tế, ĐHQGHN đã động viên và luôn
bên cạnh ủng hộ tôi, cổ vũ và giúp đỡ tôi rất nhiều để vượt qua những khó khăn trong quá trình học tập và công tác
Xin được gửi lời cảm ơn đến Quỹ Đổi mới sáng tạo Vingroup đã trao học bổng Thạc sĩ trong nước cho tôi vào năm 2021 với mã số VINIF.2021.ThS.79 và năm 2022 với mã số VINIF.2022.ThS.034 Học bổng đã tài trợ cho tôi trong quá trình thực hiện
đề tài này
Cuối cùng, tôi xin trân trọng cảm ơn tới các thầy cô Khoa Sinh học, và Phòng Đào tạo, Trường Đại học Khoa học Tự nhiên, ĐHQGHN đã tạo điều kiện thuận lợi
giúp đỡ tôi trong quá trình học tập và hoàn thành luận văn
Hà Nội, ngày tháng năm 2023
Trang 41.1.2 Sự biểu hiện của gen trên mô mỡ 4
1.2 Sự biểu hiện của gen Sfrp5 trên mô mỡ 5
1.2.1 Sơ lược về gen Sfrp5 5
1.2.2 Tiềm năng ứng dụng của gen Sfrp5 6
1.2.3 Nghiên cứu về sự biểu hiện của gen Sfrp5 trên mô mỡ 7
1.3 Phương pháp nghiên cứu tổng quan hệ thống 8
1.3.1 Khái niệm 8
1.3.2 Lý do thực hiện nghiên cứu tổng quan hệ thống 8
1.3.3 Các bước thực hiện tổng quan hệ thống 10
1.4 Công nghệ microarray trong nghiên cứu sự biểu hiện gen 11
1.4.1 Con chip microarray 11
1.4.2 Quy trình kỹ thuật 13
1.4.3 Phân tích dữ liệu microarray đã có về sự biểu hiện gen Sfrp5 18
Chương II PHƯƠNG PHÁP NGHIÊN CỨU 20
2.1 Nội dung nghiên cứu 20
2.2 Phương pháp nghiên cứu tổng quan hệ thống về sự biểu hiện của gen Sfrp5 trên mô mỡ 21
2.2.1 Đối tượng nghiên cứu 21
2.2.2 Thiết kế nghiên cứu 21
Trang 52.2.3 Tiêu chí lựa chọn và tiêu chí loại trừ 22
2.2.4 Nguồn dữ liệu và chiến lược tìm kiếm 23
2.2.5 Quá trình lọc và lựa chọn nghiên cứu 23
2.3 Phương pháp nghiên cứu biểu hiện gen Sfrp5 sử dụng dữ liệu microarray 24 2.3.1 Nghiên cứu của Leslie P Kozak và cộng sự năm 2010 và cơ sở cung cấp dữ liệu microarray cho đề tài 24
2.3.2 Đối tượng nghiên cứu 26
2.3.3 Phương pháp tiền xử lý dữ liệu microarray 26
2.3.3 Xác định gen thay đổi biểu hiện 29
2.3.4 Xác định các cụm gen 33
2.3.5 Phân tích bản thể gen học 34
Chương III KẾT QUẢ 35
3.1 Sự biểu hiện gen Sfrp5 trên mô mỡ bằng phương pháp nghiên cứu tổng quan hệ thống 35
3.1.1 Kết quả tìm kiếm 35
3.1.2 Đặc điểm đối tượng nghiên cứu 36
3.1.3 Sự biểu hiện gen Sfrp5 trên mô mỡ 41
3.1.4 Mối liên hệ của gen Sfrp5 với các bệnh liên quan đến rối loạn chuyển hóa và ứng dụng tiềm năng 42
3.1.5 Khoảng trống nghiên cứu tiềm năng 44
3.2 Sự biểu hiện mRNA của gen Sfrp5 từ phân tích dữ liệu mircroarray 46
3.2.1 Kết quả tiền xử lý dữ liệu 46
3.2.2 Mức độ biểu hiện mRNA của gen Sfrp5 và các gen liên quan tại các điều kiện dinh dưỡng và độ tuổi khác nhau 48
3.2.3 Vị trí và vai trò của gen Sfrp5 và một số gen liên quan trong các con đường tín hiệu đã biết 52
Chương IV BÀN LUẬN 56
4.1 Sự biểu hiện gen Sfrp5 trên mô mỡ 56
4.2 Vai trò tiềm năng của gen Sfrp5 58
Trang 6Chương V KẾT LUẬN VÀ KIẾN NGHỊ 61
5.1 Kết luận 61
5.2 Kiến nghị 62
TÀI LIỆU THAM KHẢO 63
Trang 7DANH MỤC CÁC KÝ HIỆU, CHỮ CÁI VIẾT TẮT
DNA Deoxyribonucleic acid Acid deoxyribonucleic FDR False discovery rate Tỉ lệ phát hiện dương tính giả FDR False discovery rate Tỉ lệ phát hiện dương tính giả
LON Lactation over-nutrition
condition Chế độ ăn giàu chất béo
LUN Lactation under-nutrition
condition Chế độ ăn thiếu dinh dưỡng MeSH Medical Subject Headings Chỉ mục và Tiêu đề Chủ đề Y tế
Mest Mesoderm specific transcript
mRNA Messenger ribonucleic acid ARN thông tin
PET/CT Positron Emission Tomography -
Computed Tomography Chụp cắt lớp position
PPARγ Peroxisome proliferator-
Ucp1 Uncoupling protein 1
Trang 8DANH MỤC HÌNH
Hình 1.1 Sự phân bố của WAT và BAT trên cơ thể người và chuột 4
Hình 1.2 Vị trí gen Sfrp5 5
Hình 1.3 Thứ tự độ tin cậy của các nghiên cứu y học 10
Hình 1.4 Microarray nghiên cứu mức độ biểu hiện gen của công ty Agilent 12
Hình 1.5 Quy trình kỹ thuật của công nghệ DNA microarray 13
Hình 1.6 Hình minh họa kết quả thu được từ một thí nghiệm microarray 17
Hình 2.1 Sơ đồ thiết kế nghiên cứu 21
Hình 2.2 Thiết kế thí nghiệm của GS Leslie P Kozak và cộng sự [28] 25
Hình 2.3 Một phần cấu trúc bộ dữ liệu thô 26
Hình 3.1 Kết quả tìm kiếm và sàng lọc dữ liệu dựa trên sơ đồ PRISMA 36
Hình 3.2 Các thiết kế thí nghiệm chính đã được thực hiện 40
Hình 3.3 Biểu hiện gen Sfrp5 trên mô mỡ 41
Hình 3.4 Các bệnh rối loạn chuyển hóa có liên quan đến sự biểu hiện gen Sfrp5 và ứng dụng tiềm năng 43
Hình 3.5 Khoảng trống nghiên cứu về sự biểu hiện gen Sfrp5 tại mô mỡ 44
Hình 3.6 Cấu trúc dữ liệu trước và sau khi xử lý 47
Hình 3.7 Phân bố dữ liệu sau khi chuẩn hóa 47
Hình 3.8 Mức độ biểu hiện mRNA của gen Sfrp5 giữa các điều kiện dinh dưỡng theo độ tuổi 48
Hình 3.9 Mức độ biểu hiện mRNA của gen Sfrp5 giữa các độ tuổi khác nhau theo điều kiện dinh dưỡng 50
Hình 3.10 Mức độ biểu hiện mRNA của cụm gen có cùng biểu hiện với Sfrp5 51
Hình 3.11 Biểu đồ volcano và venn diagram biểu diễn sự thay đổi biểu hiện mRNA của các gen ở 112 ngày tuổi so với 5 ngày tuổi 53
Trang 9DANH MỤC BẢNG
Bảng 3.1 Đặc điểm bài báo được lựa chọn vào nghiên cứu 36
Bảng 3.2 Vị trí và vai trò của gen Sfrp5 và một số gen liên quan thông qua phân tích
bản thể gen học 54
Trang 10MỞ ĐẦU
Thừa cân, béo phì là một bệnh lý gây ra rối loạn chức năng sinh lý của cơ thể người [15] Tỷ lệ thừa cân, béo phì đã đạt đến con số đáng báo động ở nhiều quốc gia Một nghiên cứu tổng quan hệ thống từ 199 quốc gia cho thấy có đến 1,46 tỷ người trưởng thành trên toàn thế giới bị thừa cân, trong đó có 502 triệu người béo phì [18] Béo phì là nguyên nhân hàng đầu của các bệnh chuyển hóa như tiểu đường, rối loạn lipid máu, các bệnh lý tim mạch và một số khối u ác tính [35, 40, 41, 47] Trong bối cảnh tỷ lệ và nguy cơ mắc thừa cân béo phì và các bệnh rối loạn chuyển hóa ngày càng tăng, việc nghiên cứu về cơ chế phân tử liên quan đến béo phì đóng một vai trò rất quan trọng nhằm hiểu hơn về căn bệnh này
Secreted frizzled-related protein 5 (Sfrp5) là gen thuộc họ Sfrps Sfrp5 được biết
đến với vai trò quan trọng trong quá trình kiểm soát sự tăng sinh, biệt hóa và tái tạo
tế bào thông qua ức chế con đường truyền tín hiệu Wnt bằng cách ngăn chúng liên
kết với các thụ thể Frizzled [37] Trong đó, vai trò này của gen Sfrp5 tác động rõ rệt nhất đối với các tế bào mỡ vì tế bào mỡ là nơi mà gen Sfrp5 biểu hiện mạnh mẽ nhất
Do đó, rối loạn biểu hiện gen Sfrp5 trong tế bào mỡ có liên quan trực tiếp đến quá
trình tạo mỡ, biệt hóa tế bào mỡ và chuyển hóa lipid [25, 52] Bên cạnh đó, việc các
tế bào mỡ tăng sinh quá mức có thể dẫn đến tình trạng viêm mãn tính mức độ thấp, việc này có thể là nguyên nhân dẫn đến các bệnh liên quan đến rối loạn chuyển hóa như đái tháo đường, gan nhiễm mỡ, tim mạch [53, 59] Chính vì những lý do này
khiến Sfrp5 là một gen tiềm năng để nghiên cứu trong bối cảnh béo phì và các bệnh
liên quan đến rối loạn chuyển hóa
Hiện nay, trên thế giới đã có nhiều nghiên cứu về sự biểu hiện của gen Sfrp5 và
mối liên quan của chúng với béo phì và các bệnh rối loạn chuyển hóa Các bằng chứng
thường tập trung mô tả biểu hiện gen Sfrp5 thông qua định lượng nồng độ Sfrp5 trong
máu tại các mô hình bệnh tật khác nhau Đây là một phương pháp thuận tiện và không xâm lấn, tuy nhiên, phương pháp này chỉ cung cấp thước đo gián tiếp về hoạt động
của Sfrp5 trong các mô có liên quan Để thực sự hiểu được chức năng sinh lý và cơ chế hoạt động của Sfrp5, các bằng chứng về sự biểu hiện của gen Sfrp5 cấp độ mô,
Trang 11đặc biệt là mô mỡ là ưu tiên hàng đầu Hiện nay đã có một số nghiên cứu về biểu hiện
của Sfrp5 trong mô mỡ ở cả người và động vật thí nghiệm [22, 25, 56, 57] Tuy nhiên,
để có cái nhìn tổng quát và phân tích sâu hơn về các bằng chứng đã công bố thì một nghiên cứu tổng quan hệ thống là rất cần thiết Nghiên cứu tổng quan hệ thống sẽ đóng vai trò là nguồn tài nguyên hữu ích cho các nhà nghiên cứu bằng cách tóm tắt
và tổng hợp những bằng chứng đã biết về sự biểu hiện của gen Sfrp5 trong mô mỡ và
vai trò của chúng đối với các bệnh rối loạn chuyển hóa, từ đó tìm ra các lỗ hổng và các hướng nghiên cứu tiềm năng trong tương lai
Mặt khác, phương pháp microarray đang trở thành một trong những tiêu chuẩn vàng trong nghiên cứu về mức độ biểu hiện gen do khả năng phân tích biểu hiện của hàng nghìn gen chỉ trong một thí nghiệm [3] Tuy nhiên, chi phí thực hiện cao và đòi hỏi thiết bị hiện đại là một trong những nhược điểm khiến phương pháp này chỉ được tiến hành tại các phòng thí nghiệm lớn trên thế giới Với điều kiện hiện tại ở Việt Nam, việc tiếp cận lượng thông tin khổng lồ từ bộ dữ liệu microarray chưa khai thác hết được coi là một hướng đi phù hợp [50] Phương pháp này sẽ giúp các nhà nghiên cứu tiết kiệm được thời gian, chi phí và tận dụng tối đa nguồn dữ liệu để đưa ra các kết quả nghiên cứu mong muốn mà vẫn đảm bảo tính mới cao [1] Do đó, đề tài của chúng tôi được thực hiện theo hai phương pháp chính Đầu tiên, một nghiên cứu tổng quan hệ thống được tiến hành để phân tích các bằng chứng hiện có và những khoảng
trống nghiên cứu về sự biểu hiện gen Sfrp5 trong mô mỡ Từ những kết quả này,
nghiên cứu tiến hành lựa chọn bộ dữ liệu microarray phù hợp để làm sáng tỏ một
trong những khoảng trống nghiên cứu về sự biểu hiện gen Sfrp5 trong mô mỡ tại các điều kiện khác nhau, đồng thời xác định vị trí và vai trò của gen Sfrp5 trong các con
đường tín hiệu đã biết Đề tài được thực hiện với hai mục tiêu chính:
Mục tiêu 1: Phân tích sự biểu hiện của gen Sfrp5 trên mô mỡ bằng phương pháp
tổng quan hệ thống
Mục tiêu 2: Đánh giá mức độ biểu hiện mRNA của gen Sfrp5 và một số gen
liên quan trên mô mỡ chuột thí nghiệm bằng phương pháp phân tích dữ liệu mircroarray đã có
Trang 12Chương I TỔNG QUAN 1.1 Mô mỡ và sự biểu hiện của gen trên mô mỡ
1.1.1 Mô mỡ
Mô mỡ chiếm có thể chiếm từ 4% đến 40% trọng lượng cơ thể ở người bình thường và đóng một vai trò quan trọng đối với việc duy trì cân bằng năng lượng Dựa vào nguồn gốc, đặc điểm hình thái và chức năng, có thể chia các mô mỡ ở người và động vật gặm nhấm thành 2 loại chính là mô mỡ trắng (White adipose tissue – WAT)
và mô mỡ nâu (Brown adipose tissue – BAT) Bên cạnh đó các nhà nghiên cứu cũng ghi nhận sự xuất hiện của các mô mỡ màu be (Brite adipose tissue – BrAT) [12, 23] Tùy thuộc từng loài mô mỡ mà chúng được phân bố ở các vị trí khác nhau trên hầu
khắp cơ thể (Hình 1.1)
Đối với động vật có vú, WAT được phân bố nhiều nhất ở các tạng và dưới da
Vị trí phân bố của WAT theo giải phẫu góp phần quyết định loại béo phì và các rối loạn chuyển hóa liên quan [19] Chức năng chính của WAT là dự trữ năng lượng và điều hòa quá trình chuyển hóa [13]
BAT có nguồn gốc từ các tế bào tiền trung mô Các nghiên cứu trước đây cho rằng BAT chỉ xuất hiện ở giai đoạn sơ sinh và sẽ biến mất trong những tháng đầu đời Tuy nhiên nhờ sự phát triển của các công nghệ chẩn đoán hình ảnh, các nghiên cứu
sử dụng kết quả chụp PET/CT đã cho thấy BAT vẫn tồn tại tại một số vị trí giải phẫu khác nhau ở người trưởng thành, ví dụ như vùng cổ, vùng thượng đòn và vùng gần cột sống Thời gian gần đây BAT nhận được nhiều sự quan tâm của các nhà nghiên cứu trên thế giới như là một hướng đi hứa hẹn trong điều trị thừa cân béo phì Tăng
lượng BAT trong cơ thể có thể thúc đẩy quá trình hoạt hóa Ucp1 và sinh nhiệt, cũng
như tăng năng lượng tiêu hao [14]
Do có nhiều đặc điểm giống với BAT, BrAT cũng được xếp vào nhóm tế bào
mỡ sinh nhiệt Nguồn gốc của các tế bào mỡ màu be còn gây ra nhiều tranh cãi Tuy nhiên do BrAT thường được tìm thấy tại các vị trí giải phẫu của WAT, một trong những giả thuyết nhận được nhiều ủng hộ là các tế bào mỡ màu be này xuất hiện nhờ quá trình nâu hóa của các tế bào mỡ trắng
Trang 13Hình 1.1 Sự phân bố của WAT và BAT trên cơ thể người và chuột
A Ở người mỡ trắng được dự trữ ở khắp các vùng trên cơ thể, nhất là dưới da
và trong ổ bụng B Ở chuột mô mỡ cũng phân chia ra thành mỡ nâu (BAT) và
mỡ trắng (WAT)
1.1.2 Sự biểu hiện của gen trên mô mỡ
Mô mỡ được coi là một trong những mô đóng vai trò quan trọng trong hoạt động sống Chúng tham gia trực tiếp vào quá trình trao đổi chất và dự trữ năng lượng của cơ thể Tương tự với các loại mô khác, các gen trong mô mỡ cũng được biểu hiện thông qua quá trình phiên mã từ DNA thành mRNA, sau đó dịch mã từ mRNA thành các protein cần thiết cho quá trình điều hòa hoạt động của tế bào mỡ Việc nghiên cứu sự biểu hiện của các gen trong mô mỡ là cần thiết trong bối cảnh béo phì và các bệnh liên quan đến rối loạn chuyển hóa hiện nay [15] Các kết quả chỉ ra có thể làm sáng tỏ cơ chế điều hòa quá trình trao đổi chất và dự trữ năng lượng của tế bào mỡ Đặc biệt, các nghiên cứu so sánh mức độ biểu hiện gen có thể tiết lộ gen nào bị ức chế hoặc tăng cường biểu hiện trong điều kiện khác nhau [11] Từ những bằng chứng này, các nhà khoa học có thể tìm ra các biện pháp dự phòng hoặc điều trị béo phì và các bệnh liên quan đến rối loạn chuyển hóa thông qua con đường điều hòa biểu hiện các gen trong mô mỡ
Trang 141.2 Sự biểu hiện của gen Sfrp5 trên mô mỡ
1.2.1 Sơ lược về gen Sfrp5
Sfrp5 là một gen thuộc họ Sfrps Gen này nằm trên nhiễm sắc thể số 10, cụ thể
là ở locus 10q24.1 Chúng có kích thước 5,249 bases, bao gồm 317 gốc axit amin, 3
exon và mã hóa chủ yếu protein Sfrp5 [58]
Hình 1.2 Vị trí gen Sfrp5
Hiện nay, gen Sfrp5 được biết đến với vai trò quan trọng trong quá trình kiểm
soát sự tăng sinh, biệt hóa và tái tạo tế bào thông qua ức chế con đường truyền tín
hiệu Wnt bằng cách ngăn chúng liên kết với các thụ thể Frizzled [37] Chúng ban đầu
được phát hiện là biểu hiện cao trong các tế bào biểu mô sắc tố võng mạc và biểu hiện
vừa phải ở tuyến tụy [7] Hiện nay, gen Sfrp5 được chỉ ra rằng chúng biểu hiện mạnh
mẽ nhất tại tế bào mỡ Do đó, rối loạn biểu hiện gen Sfrp5 trong tế bào mỡ có liên
quan trực tiếp đến quá trình tạo mỡ, biệt hóa tế bào mỡ và chuyển hóa lipid [25, 52]
Sfrp5 là mục tiêu của yếu tố phiên mã PPARγ, do đó chúng có vai trò quan trọng
trong quá trình hình thành các tế bào mỡ [52] Các bằng chứng đã chỉ ra rằng mô mỡ
của chuột bị mất chức năng gen Sfrp5 có kích thước tế bào mỡ giảm đáng kể nhưng
số lượng tế bào mỡ không thay đổi, điều đó chỉ ra rằng Sfrp5 ảnh hưởng đến phì đại
tế bào mỡ hơn là tăng sinh [32] Mặt khác, chuột bị mất chức năng gen Sfrp5 đã được
chứng minh là có khả năng chống lại bệnh béo phì thông qua chế độ ăn uống [59], từ
đó cho thấy vai trò của các gen Sfrp5 trong bối cảnh béo phì và các bệnh rối loạn
chuyển hóa liên quan
Mặt khác, việc các tế bào mỡ tăng sinh quá mức có thể dẫn đến tình trạng viêm mãn tính mức độ thấp, việc này có thể là nguyên nhân dẫn đến các bệnh liên quan
đến rối loạn chuyển hóa như đái tháo đường, gan nhiễm mỡ, tim mạch [53, 59] Sfrp5
được chứng mình rằng có thể ức chế tình trạng viêm mãn tính, tăng độ nhạy insulin
và cải thiện chuyển hóa glucolipid Một nghiên cứu cho rằng Sfrp5 có khả năng chống
Trang 15viêm bằng cách liên kết với Wnt5a ở bên ngoài tế bào và ức chế liên kết của nó với thụ thể Frizzled [37] Trong một nghiên cứu trên mô hình động vật với chế độ ăn
HFD, người ta thấy rằng các đột biến nhắm mục tiêu Sfrp5 có thể gây ra hiện tượng
kháng insulin, không dung nạp glucose và nhiễm trùng gan [53] Những con chuột bị
loại bỏ gen Sfrp5 được cho ăn một chế độ ăn nhiều calo đã mất đi khả năng dung nạp glucose nghiêm trọng, ngoài ra còn gây ra tình trạng gan nhiễm mỡ [59] Sfrp5 cũng
có khả năng làm giảm xơ gan thông qua tín hiệu Wnt5a / Fz2 và có tác dụng bảo vệ
tuyến tụy [8]
1.2.2 Tiềm năng ứng dụng của gen Sfrp5
Thừa cân, béo phì là một bệnh lý gây ra rối loạn chức năng sinh lý của cơ thể người [15] Tỷ lệ thừa cân, béo phì đã đạt đến con số đáng báo động ở nhiều quốc gia Một nghiên cứu tổng quan hệ thống từ 199 quốc gia cho thấy có đến 1,46 tỷ người trưởng thành trên toàn thế giới bị thừa cân, trong đó có 502 triệu người béo phì [18] Nguy hiểm hơn là người mắc béo phì có thể gặp các biến chứng nghiêm trọng, ảnh hưởng lớn đến sức khỏe Béo phì là nguyên nhân hàng đầu của các bệnh chuyển hóa như tiểu đường, rối loạn lipid máu, các bệnh lý tim mạch và một số khối u ác tính [40, 41, 47] Một vài nghiên cứu đã chỉ ra rằng nhóm đối tượng bị béo phì đang có
xu hướng trẻ hóa Ước tính hiện tại cho thấy tỷ lệ mắc béo phì ở trẻ em gái là 16% và trẻ em trai là 18%, trong đó các tỷ lệ này đã tăng gần gấp ba lần trong 25 năm qua [35] Trong bối cảnh tỷ lệ và nguy cơ mắc thừa cân béo phì và các bệnh rối loạn chuyển hóa ngày càng tăng, việc nghiên cứu về cơ chế phân tử liên quan đến béo phì đóng một vai trò rất quan trọng nhằm hiểu hơn về căn bệnh này
Vào năm 2010, vai trò của Sfrp5 lần đầu tiên được mô tả trong nghiên cứu của Ouchi và cộng sự [37] Tác giả đã chỉ ra rằng Sfrp5 có vai trò quan trọng trong việc
ức chế chất tiền viêm adipokine Wnt5a Tình trạng viêm mãn tính mức độ thấp được
cho nguyên nhân tiềm ẩn dẫn đến các bệnh liên quan đến rối loạn chuyển hóa như đái
tháo đường, gan nhiễm mỡ, tim mạch [53, 59] Từ nghiên cứu đó, Sfrp5 đã được các
nhà khoa học quan tâm hơn để làm sáng tỏ cơ chế và ảnh hưởng của chúng đến các bệnh rối loạn chuyển hóa
Trang 16Do sự biểu hiện của gen Sfrp5 trên mô mỡ tương quan thuận với quá trình phì đại mô mỡ, Sfrp5 được coi là một marker tiềm năng để đánh giá tình trạng sinh tổng hợp mỡ [11] So với Leptin, sự biểu hiện mRNA của Sfrp5 trên mô mỡ hoặc trong
máu toàn phần có khả năng dự đoán sớm sự phì đại mô mỡ và có thể được sử dụng trong các thử nghiệm lâm sàng để theo dõi điều trị béo phì bằng cách điều chỉnh chế
độ ăn Bên cạnh đó, việc điều hòa sự biểu hiện của gen Sfrp5 cho thấy những tác động
tích cực trong việc giảm lượng mỡ và giảm tình trạng béo phì do chế độ ăn [32]
N Ouchi và cộng sự đã cho thấy Sfrp5 có khả năng làm tăng độ nhạy insulin
và cải thiện chuyển hóa glucolipid [59] Chính vì thế, Sfrp5 cũng có tác dụng tiềm
năng trong việc phát triển thuốc hoặc các liệu pháp điều trị khác nhằm hỗ trợ kiểm soát tình trạng béo phì và các rối loạn chuyển hóa liên quan
1.2.3 Nghiên cứu về sự biểu hiện của gen Sfrp5 trên mô mỡ
Hiện nay, trên thế giới đã có một sô nghiên cứu về sự biểu hiện của gen Sfrp5
trên mô mỡ trong các điều kiện và môi trường khác nhau Jura và cộng sự (2016) đã tiến hành một thí nghiệm tại Ba Lan trên những con chuột C57BL / 6J có nguy cơ béo phì [25] Chúng đã được cho ăn một chế độ ăn nhiều chất béo Kết quả của nghiên
cứu chỉ ra rằng Sự biểu hiện của gen Sfrp5 tăng lên cùng với sự phát triển khối lượng
chất béo, tuy nhiên, sự biểu hiện gen tiếp tục giảm khi nồng độ mỡ đạt đến mức ổn định Sự cân bằng của các yếu tố kiểm soát sự lắng đọng chất béo có thể được đánh
giá một phần bằng sự biểu hiện gen Sfrp5
Một nghiên cứu tại Mỹ do nhóm tác giả Koza đã tiến hành thí nghiệm trên các dòng chuột A / J, C57BL / 6J, AKR / J, DBA / 2J, 129SVImJ và C57BL / 6J đực [57] Những con chuột được cho ăn chế độ ăn nhiều chất béo trong 8 tuần nhằm so sánh sự
biểu hiện gen Sfrp5 và Mest giữa các dòng chuột Kết quả nghiên cứu chỉ ra rằng sự biểu hiện Sfrp5 trong mô mỡ ở chuột DBA/2J cao hơn so với các dòng chuột khác Mặt khác, sự biểu hiện của Sfrp5 thấp nhất ở chủng C57BL/6J Đáng ngạc nhiên là
khi các nhóm tác giả nghiên cứu độc lập 2 chủng trên và cho chúng ăn chế độ ăn nhiều chất béo trong 8 tuần tiếp theo thì chủng DBA/2J không cho thấy sự gia tăng
thêm trong biểu hiện Sfrp5 trong khi mức độ biểu hiện ở chuột B6 đã tăng gần 20 lần
Trang 17Nghiên cứu của Dinh-Toi Chu và cộng sự năm 2016 đã sử dụng chuột C57BL / 6J và 129S làm mô hình di truyền cho sự biến đổi của bệnh béo phì do chế độ ăn uống để xác định các kiểu hình mỡ từ sơ sinh đến trưởng thành ở 8 tuần tuổi [10] Ngoài ra, nghiên cứu này cũng đã sử dụng phân tích microarray về biểu hiện gen trong quá trình phát triển mỡ bẹn Nhóm tác giả đã chỉ ra rằng có mối tương quan
thuận giữa sự biểu hiện Sfrp5 và Mest với khối lượng chất béo mào tinh, nhưng không
tìm thấy điều tương tự ở kho chất béo bẹn hoặc sau phúc mạc Mặc dù khối lượng
chất béo tiếp tục tăng ở chuột từ 19 đến 31 tuần tuổi nhưng sự biểu hiện gen Sfrp5 đã không tiếp tục tăng Điều này có thể thấy rằng sự biểu hiện của Sfrp5 tăng cùng với
sự gia tăng của khối lượng chất chéo nhưng sẽ chững lại khi đến một ngưỡng tuổi nhất định
Hiểu được sự biểu hiện và thay đổi của các dấu ấn sinh học quan trọng như
Sfrp5 trên mô mỡ là rất cần thiết, hữu ích trong việc chọn ra các dấu hiệu để chẩn
đoán và điều trị béo phì trong tương lai Ứng dụng các dấu ấn sinh học mô mỡ trong lâm sàng và khám phá sự thay đổi trong biểu hiện các dấu ấn sinh học của mô mỡ trong các điều kiện khác nhau là một trong những chiến lược trong lĩnh vực rối loạn chuyển hóa và béo phì trên thế giới Tuy nhiên, theo hiểu biết của tôi, hiện nay vẫn chưa có một đánh giá tổng quan cụ thể nào tổng hợp và phân tích các dữ liệu đã công
1.3.2 Lý do thực hiện nghiên cứu tổng quan hệ thống
Ngày nay, có quá nhiều thông tin và những bằng chứng được cập nhật mỗi ngày trên rất nhiều các tạp chí khoa học Tuy nhiên, thời gian mà chúng ta có thể dành ra mỗi ngày để tìm đọc những thông tin trên các tạp chí khoa học dường như
Trang 18còn rất hạn chế Một ước tính rằng hằng năm có khoảng 3 triệu bài báo được đăng trong các tạp chí y sinh học, đồng nghĩa với việc chúng ta dành thời gian để đọc hơn
8200 bài báo trong một ngày nếu muốn đọc hết tất cả các bài báo khoa học trong lĩnh vực y sinh học Điều này dường như là rất khó khăn đối với những nhà nghiên cứu
và những người bận rộn Ngoài ra, hiện nay nhiều nghiên cứu với chất lượng kém hoặc cho những thông tin không thích hợp vẫn có thể được đăng tải Điều này có thể khiến cho người đọc khó khăn trong việc chắt lọc các thông tin tin cậy Hơn thế nữa, việc có nhiều bài báo được công bố về cùng một chủ đề cũng gây ra hiện tượng khó khăn trong việc thống nhất thông tin và giải quyết các vấn đề gây tranh cãi Do đó, phương pháp nghiên cứu tổng quan hệ thống đã được xây dựng để giải quyết vấn đề này [2]
Tổng quan hệ thống được sử dụng để trả lời bất kỳ câu hỏi nghiên cứu định tính nào [49] Một tổng quan hệ thống được tiến hành như một phương tiện để kiểm tra kỹ lưỡng, đánh giá chính xác hơn kết quả của các nghiên cứu đã được thực hiện Theo Petticrew and Roberts (2005), một tổng quan hệ thống cần xác định toàn diện, thẩm định lại và tổng hợp lại tất cả các nghiên cứu có liên quan về một chủ đề nhất định [37] Do
đó, một nghiên cứu tổng quan hệ thống có thể cung cấp đến người đọc một cái nhìn tổng
quát về vấn đề quan tâm, bên cạnh đó thông tin cũng được đảm bảo độ tin cậy cao (Hình 1.3)
Trang 19Hình 1.3 Thứ tự độ tin cậy của các nghiên cứu y học [29]
1.3.3 Các bước thực hiện tổng quan hệ thống
* Petticrew và Roberts (2005) đã đưa ra về bảy bước để thực hiện tổng quan hệ thống [37] Các bước này là:
1 Xác định rõ ràng câu hỏi nghiên cứu hoặc giả thuyết;
2 Xác định các loại nghiên cứu cần thiết để thực hiện nghiên cứu;
3 Thực hiện tìm kiếm tài liệu toàn diện cần thiết để xác định nghiên cứu phù hợp;
4 Sàng lọc các nghiên cứu và đánh giá nếu chúng đáp ứng đã các tiêu chí lựa chọn; khi cần sẽ phân tích thêm;
5 Đánh giá nghiêm túc các nghiên cứu một lần nữa trước khi đưa vào tổng quan hệ thống;
Trang 206 Tổng hợp các nghiên cứu và đánh giá tính đồng nhất của chúng;
7 Đưa ra kết quả đánh giá
1.4 Công nghệ microarray trong nghiên cứu sự biểu hiện gen
Ngày nay, microarray đang trở thành một trong những tiêu chuẩn vàng trong nghiên cứu mức độ biểu hiện của gen [3] Trong khi các kỹ thuật như Northern Blot hoặc RT-PCR chi giới hạn nghiên cứu trong một số lượng nhỏ các gen được nhắm đến từ trước, thế mạnh của microarray là khả năng so sánh đồng thời sự biểu hiện và điều hòa của hàng nghìn gen chỉ trong một thí nghiệm, giúp các nhà nghiên cứu tìm
ra những thay đổi trong quá trình phiên mã đáp ứng với những biến đổi của môi trường
Nghiên cứu hồ sơ biểu hiện gen bằng công nghệ microarray cho phép cung cấp những thông tin về sự khác nhau trong mức độ biểu hiện gen giữa hai nhóm tế bào khác nhau, có thể là tế bào được điều trị so sánh với tế bào không được điều trị, hoặc
tế bào ung thư khi so sánh với tế bào thường Tuy nhiên microarray không hẳn phân tích được cụ thể số lượng mRNA được phiên mã, mà các kết luận tăng hoặc giảm mức độ biểu hiện là dựa trên tương quan với tế bào được so sánh [16]
1.4.1 Con chip microarray
Bản chất của con chip microarray là một giá thể rắn có gắn trên đó một mạng lưới các điểm hay giọt thông tin di truyền của một chuỗi trình tự đã biết một cách có
hệ thống (Hình 1.4) Những con chip này thường là các mảnh kính nhỏ hoặc nylon
(tương tự như một chiếc lam kính), với hàng ngàn các điểm, hay còn gọi là giếng, mỗi điểm chứa một đoạn trình tự cDNA khác nhau Mỗi điểm trên mạng lưới của con chip này có thể đại diện cho một thí nghiệm độc lập về sự tồn tại và mức độ phong phú của một chuỗi trình tự xác định trong mẫu nghiên cứu [20] Đoạn cDNA được
gắn lên các chip của một đoạn trình tự đã biết được gọi là đầu dò, trong khi đó chuỗi polynucleotid của đoạn trình tự chưa biết trong mẫu sinh học được gọi là đích Đoạn
trình tự đích này được đánh giá một cách gián tiếp thông qua quá trình lai hóa với đầu dò đã biết trên con chip
Trang 21Hình 1.4 Microarray nghiên cứu mức độ biểu hiện gen trên chuột của công ty
Agilent
Trang 22+ Phân lập tế bào
Các tế bào có thể được phân lập từ các chất nền phức tạp như mô hoặc máu bằng cách sử dụng phương pháp soi vi điểm bằng laser hoặc tinh sạch dựa trên ái lực
Trang 23kháng thể Việc lựa chọn tế bào đich là rất quan trọng vì phần tích hỗn hợp các tế bào khác nhau sẽ cho ra kết quả hồ sơ biểu hiện gen trung bình của hỗn hợp, vì vậy sự thay đổi trong biểu hiện gen của tế bào cần quan tâm có thể bị bỏ sót
+ Phân lập và tinh chế RNA
RNA tổng số được phân lập từ tế bào và được tinh sạch bằng các kit thương mại Do RNA dễ bị thoái hóa bởi các enzym nội sinh (Rnase), quá trình chuẩn bị RNA phải thêm các chất ngăn cản hoạt động của các enzym này Thông thường, các phương pháp dựa trên guanidinium isothiocyanate (GITC) được sử dụng trong các quy trình chuẩn bị RNA để tránh hoạt động của RNase Mặc dù hoạt động của RNase
bị ức chế trong quá trình chuẩn bị mẫu, RNA vẫn có thể bị phân hủy sau khi lấy mẫu nếu nó không được đông lạnh nhanh hoặc bị phân giải trực tiếp trong GITC có chứa đệm ly giải Do đó, để ổn định RNA, RNA được bảo quản lâu dài ở −20℃
+ Khuếch đại RNA
RNA tổng số cũng có thể được khuếch đại nếu cần thiết thông qua quá trình khuếch đại gián tiếp Phương pháp phổ biến nhất là phiên mã ngược mRNA thành cNDA sử dụng các đoạn mồi poly-T được thay đổi với các trình tự promoter T7 ở đầu 5’ Sợi đôi DNA được tạo thành trong đó mỗi đoạn mang một promoter T7 có
thẻ sử dụng cho phản ứng phiên mã trong môi trường in vitro [16]
+ Đánh dấu
Để xác định và đo lường mức độ hiện diện của các polynucleotid trong mẫu nghiên cứu (trình tự đích) sau khi nó liên kết bổ sung với các vật liệu di truyền trên microarray, các mẫu nghiên cứu được đánh dấu bằng thuốc nhuộm huỳnh quang như fluorescein, coumarin hoặc rhodamin Các thuốc nhuộm này được kết hợp với phân
tử cNDA trong quá trình phiên mã ngược các RNA Mỗi mẫu thường sử dụng một màu nhuộm khác nhau, và thường chỉ sử dụng hai màu nhuộm do ảnh hưởng đến quá trình quét và chụp ảnh để phát hiện cường độ huỳnh quang tại các bước sóng cụ thể Trên thực tế các thí nghiệm thường chọn một màu nhuộm huỳnh quang cho mẫu chưa biết hay mẫu thực nghiệm, và màu còn lại cho mẫu đã biết hay mẫu đối chứng [30]
Trang 24 Chế tạo microarray
+ Lựa chọn mồi
Các đầu dò sử dụng trong microarray được lựa chọn từ các trình tự nucleotid trên cơ sở dữ liệu, ví dụ như Genebank Chiến thuật lựa chọn đầu dò phụ thuộc nhiều vào ứng dụng và loại giá thể microarray được sử dụng, với yêu cầu là đầu dò đó phải đặc hiệu và gắn được gen đích một các hiệu quả Đối với các microarray trong nghiên cứu biểu hiện gen dựa trên các đầu dò có độ dài 25-60 nucleotid, trình tự của các đầu
dò này thường được lựa chọn từ đoạn trình tự nucleotid tại đầu 3’ của phiên mã Nguyên nhân là do quá trình tổng hợp cDNA thường được bắt đầu từ đầu 3’ của phiên
mã với mồi polyT, dẫn đến các đoạn cDNA chủ yếu đại diện cho đầu 3’ của phiên
mã Vì vậy để tối ưu hóa tín hiệu, các đầu đò thường có xu hướng gần đầu 3’ này Nếu có thể, các đầu dò nên có cùng nhiệt độ nóng chảy lý thuyết (Tm) để hoạt động với cùng mức độ nghiêm ngặt và cùng năng lượng tự do Gibbs để các tín hiệu lai giữa các điểm tương tự nhau Tuy nhiên đối với các microarray phân tích biểu hiện gen có đầu dò kích thước > 1000 nucleotid, các yêu cầu về Tm dường như không còn cần thiết vì có rất ít sự thay đổi về các base thành phần giữa các đoạn > 1000
+ Cố định các đầu dò lên microarray
Quá trình cố định các đầu dò cDNA, có bản chất là các đoạn oligo-nucleotid ngắn, lên microarray là một quá trình rất quan trọng, giúp tăng độ chính xác của kết quả thí nghiệm sau khi trải qua các quá trình lai hóa và rửa trôi Trong những năm vừa qua, có nhiều kỹ thuật cố định được các nhà khoa học phát triển, tuy nhiên chúng
có thể chia thành 3 cơ chế cố định chính là: hấp phụ vật lý, cố định bằng liên kết cộng hóa trị và cố định bằng streptavidin-biotin Việc lựa chọn một kỹ thuật cố định phù hợp phải dựa trên các đặc tính hóa lý của bề mặt microarray và đầu dò cDNA Sau khi được gắn vào các giếng, các đầu dò sẽ tiếp tục được làm khô và chiếu xạ để cố định [34]
Trang 25 Lai phân tử
Phản ứng lai phân tử là quá trình liên kết các sợi đơn poly-nucleotid thông qua bắt cặp các base theo nguyên tắc bổ sung Đây là một quá trình hóa học xảy ra giữa các sợi poly-nucleotid được đánh dấu của mô đích (bao gồm cả các đoạn có trình tự chưa biết) với các đầu dò cNDA bổ sung đã biết trình tự của chúng tại các điểm trên microarray Một quá trình lý tưởng nhất là một poly-nucleotid trong mẫu đích chứa đoạn trình tự base bổ sung với poly-nucleotid được gắn tại một điểm trên microarray
nó sẽ lai với phân tử tại điểm đó Và vị trí đó trên microarray sẽ được phát hiện bởi huỳnh quang phát ra trong quá trình quét và chụp ảnh Càng nhiều poly-nucleotid đích lai với các đầu dò cDNA thì các tín hiệu huỳnh quang phát ra có cường độ càng lớn [36] Số lượng đầu dò cDNA được cố định tại mỗi điểm trên microarray phải đủ nhiều sao cho nếu tồn tại hai đoạn poly-nucleotid cùng có trình tự bổ sung với cDNA thì có thể lai hóa đồng thời mà không gây nhiễu tín hiệu Sau đó các poly-nucleotid thừa sẽ được rửa sạch khỏi microarray trước khi tiến hành quét hình ảnh Kết quả của các tín hiệu lai phụ thuộc vào nhiều yếu tố, ví dụ như nhiệt độ, thời gian lai hóa và
xử lý, độ ẩm tương đối hay loại dung dịch đệm và thuốc thử được thêm vào, cách rửa trôi thuốc thử và mẫu còn dư [30, 44]
Quét tín hiệu
Các máy quét sử dụng ánh sáng từ laser với bước sóng nằm trong vùng cực tím
để phát hiện màu nhuộm huỳnh quang của các đoạn trình tự đích đã được lai hóa theo nguyên tắc bổ sung với đầu dò trong các giếng Một detector sẽ thu nhận và đo lường cường độ của các photon được giải phóng bởi ánh sáng bị kích thích, và chuyển chúng thành các tín hiệu điện [42]
Trong thực tế các máy quét thường là các kính hiển vi đồng tiêu nhằm ghi lại cường độ của các photon Vì quá trình thực nghiệm trong các nghiên cứu về mức độ biểu hiện gen thường sử dụng hai màu nhuộm huỳnh quang khác nhau nên mỗi microarray cần được quét hai lần ở hai bước sóng khác nhau, và thiết bị chụp ảnh phải có khả năng phát hiện các poly-nucleotid đã lai hóa và đo được số lượng của chúng ít nhất ở hai bước sóng này với độ phân giải đủ lớn Tỷ lệ phát xạ ánh sáng
Trang 26huỳnh quang giữa hai bước sóng khác nhau, tương ứng với hai màu thuốc nhuộm dùng để dán nhãn cho hai loại mẫu khác nhau, được sử dụng làm phép đo mức độ biểu hiện tương đối của cùng một gen giữa 2 mẫu [39, 42]
Xử lý tín hiệu ảnh
Cường độ màu thu được tại các giếng của microarray sẽ phán ánh tương đối
mức độ lai hóa của các poly-nucleotid với đầu dò cDNA ở giếng đó (Hình 1.6) Giả
sử poly-nucleotid từ mẫu thử được gắn thuốc nhuộm màu đỏ và poly-nucleotid từ mẫu chứng được gắn thuốc nhuộm màu xanh, vậy thì một cách tương đối điểm màu xanh lá cây sẽ chỉ ra poly-nucleotid đối chứng đã lai nhiều với cDNA gắn tại vị trí
đó Tương tự điểm màu vàng cho thấy poly-nucleotid thử nghiệm và đối chứng đã lai với số lượng tương đối bằng nhau, còn điểm đen cho thấy không xảy ra quá trình lai hóa Do đó màu đỏ thể hiện mức độ phiên mã cao hơn của gen trong mẫu thử nghiệm, trong khi màu xanh lá cây thể hiện gen thử nghiệm có mức độ phiên mã giảm so với đối chứng Định dạng hình ảnh tiêu chuẩn của microarray là các tệp 16-bit có đuôi TIFF
Hình 1.6 Hình minh họa kết quả thu được từ một thí nghiệm microarray
Xử lý dữ liệu microarray
Một con chip microarray thông thường, ví dụ như dòng AfFymetrix Gene Chip U113 plus 2.0 dành cho hệ gen người có thể ghi nhận tín hiệu biểu hiện của gần 1,3
Trang 27triệu điểm, tương ứng với gần 39 000 gen Quy trình xử lý các giá trị biểu hiện gen này khá phức tạp, bao gồm xử lý hình ảnh, phát hiển điểm, chuẩn hóa nền, tiêu chuẩn hóa và một loạt các kỹ thuật kiểm định chất lượng dữ liệu [38] Không hiếm thấy các nghiên cứu trên thế giới sử dụng hàng trăm con chip như thể này cho các thí nghiệm lặp lại nhằm cải thiện và nâng cao chất lượng dữ liệu Trước khi có các phân tích dữ liệu mang tính chiều sâu hơn, giá trị trên cùng một đầu dò phải được tổng hợp một cách chính xác dựa trên giá trị các bản sao Bên cạnh đó rất nhiều dạng phân tích dữ liệu microarray đòi hỏi phải cung cấp các loại thông tin khác nhau như vị trí trên nhiễm sắc thể, vị trí liên kết với yếu tố phiên mã và các con đường tín hiệu hay chuyển hóa Các thông tin trên cần được trích xuất từ nhiều cơ sở dữ liệu khác nhau, liên kết chúng với kết quả microarray và cần được cập nhật thường xuyên Chỉ sau khi đã thực hiện các bước tiền xử lý và xử lý trên, các câu hỏi liên quan đến mục tiêu thực
sự của một nghiên cứu, ví dụ như phát hiện tập hợp các gen thay đổi mức độ biểu hiện hoặc phát hiện các mạng lưới điều hòa, mới bắt đầu được giải quyết [27, 48]
Chính vì thế một quy trình xử lý dữ liệu microarray hoàn chỉnh rất phức tạp và phải trải qua nhiều bước khác nhau, phụ thuộc vào nhiều phần mềm và cơ sở dữ liệu Bên cạnh đó đối tượng xử lý còn là một số lượng lớn các dữ liệu không đồng nhất,
và cần hỗ trợ bởi nhiều công cụ khác nhau Đối với những nghiên cứu được tiến hành trong một khoảng thời gian dài, hoặc bao gồm kết quả tại nhiều phòng thí nghiệm khác nhau hoặc ngay cả việc được thực hiện bởi các nhóm kỹ thuật viên khác nhau, việc quản lý và chuẩn hóa dữ liệu là đặc biệt quan trọng để đảm bảo tối ưu hóa chất lượng của dữ liệu và giảm thiểu độ nhiễu [27] Trong những năm gần đây, các ứng dụng và dữ liệu microarray ngày càng trở nên phổ biến Tuy nhiên việc xử lý và phiên giải các dữ liệu này vẫn còn là một vấn đề khó khăn đối với các nhà sinh học
1.4.3 Phân tích dữ liệu microarray đã có về sự biểu hiện gen Sfrp5
Trên thế giới, một số nghiên cứu đã tiến hành khảo sát sự thay đổi của các gen
liên quan đến quá trình sinh tổng hợp mỡ trên chuột, trong đó có báo cáo về gen Sfrp5
để đánh giá sự ảnh hưởng của chế độ dinh dưỡng lên sự phát triển mô mỡ [24] Chi phí thực hiện cao và đòi hỏi thiết bị hiện đại là một trong những nhược điểm chính
Trang 28khiến các nghiên cứu thực hiện trên microarray ngày nay hầu như chỉ được tiến hành tại các phòng thí nghiệm sinh học phân tử lớn trên thế giới Với điều kiện hiện tại ở Việt Nam, việc tiếp cận lượng thông tin khổng lồ từ bộ dữ liệu microarray mà các nghiên cứu trước chưa khai thác hết được coi là một hướng đi phù hợp [50] Phương pháp này sẽ giúp các nhà nghiên cứu tiết kiệm được thời gian, chi phí và tận dụng tối
đa nguồn dữ liệu để đưa ra các kết quả nghiên cứu mong muốn mà vẫn đảm bảo tính mới cao
Trang 29Chương II PHƯƠNG PHÁP NGHIÊN CỨU 2.1 Nội dung nghiên cứu
Nghiên cứu này được thực hiện theo 02 nội dung chính:
- Nội dung 1: Phân tích sự biểu hiện của gen Sfrp5 trên mô mỡ bằng phương
pháp tổng quan hệ thống
Một nghiên cứu tổng quan hệ thống được tiến hành để phân tích các bằng chứng
hiện có và những khoảng trống nghiên cứu về sự biểu hiện gen Sfrp5 trong mô mỡ
Dữ liệu về sự biểu hiện gen Sfrp5 trong mô mỡ được tìm kiếm trên các cơ sở dữ liệu,
sau đó được lọc và xử lý Tất cả bài báo được lựa chọn sẽ được phân tích kết quả về
sự biểu hiện của gen Sfrp5 trên mô mỡ và vai trò đối với các bệnh liên quan đến rối
loạn chuyển hóa Từ đó, chúng tôi tìm ra những khoảng trống nghiên cứu về sự biểu
hiện gen Sfrp5 trong mô mỡ
- Nội dung 2: Đánh giá mức độ biểu hiện mRNA của gen Sfrp5 và một số gen
liên quan trên mô mỡ chuột thí nghiệm bằng phương pháp phân tích dữ liệu mircroarray đã có
Từ những kết quả từ nội dung 1, chúng tôi tiến hành lựa chọn bộ dữ liệu microarray phù hợp để làm sáng tỏ một trong những khoảng trống nghiên cứu về sự
biểu hiện gen Sfrp5 trong mô mỡ tại các điều kiện khác nhau, đồng thời xác định vị trí và vai trò của gen Sfrp5 trong các con đường tín hiệu đã biết
Sơ đồ thiết kế nghiên cứu được trình bày ở Hình 2.1
Trang 30Hình 2.1 Sơ đồ thiết kế nghiên cứu 2.2 Phương pháp nghiên cứu tổng quan hệ thống về sự biểu hiện của gen
Sfrp5 trên mô mỡ
2.2.1 Đối tượng nghiên cứu
Đối tượng nghiên cứu là những bài báo tìm được trên các cơ sở dữ liệu về sự
biểu hiện của gen Sfrp5 trên mô mỡ và vai trò của chúng đối với các bệnh rối loạn
chuyển hóa Các bài báo được tìm kiếm, thu thập và chọn lọc dựa trên quy trình mô
tả trong phương pháp nghiên cứu
2.2.2 Thiết kế nghiên cứu
Đề tài này thực hiện nghiên cứu tổng quan hệ thống theo chuẩn PRISMA (Preferred Reporting Items for Systematic Review and Meta-analysis) [31] Hiện nay, PRISMA là bộ hướng dẫn và tiêu chuẩn phổ biến nhất để thực hiện một nghiên cứu tổng quan hệ thống Tiêu chuẩn PRISMA giúp các nhà khoa học đảm bảo tính chính xác và khách quan nhất trong quá trình thực hiện một nghiên cứu tổng quan hệ thống
từ khâu lựa chọn câu hỏi nghiên cứu, thu thập dữ liệu, đánh giá nghiên cứu, tổng hợp
và phân tích kết quả
Trang 312.2.3 Tiêu chí lựa chọn và tiêu chí loại trừ
Tiêu chí lựa chọn
Theo các tiêu chí sau đây được sử dụng để xác định liệu một nghiên cứu có
được lựa chọn để đưa vào để phân tích sự biểu hiện của gen Sfrp5 trên mô mỡ
(PICOTS) [17]:
- P – Population (Đối tượng nghiên cứu): 1-Bài báo khoa học trên hai cơ sở dữ liệu Pubmed và Sciencedirect 2-Bài báo được viết bằng Tiếng Anh 3-Có thể đọc được toàn văn của bài báo
- I – Intervention (Can thiệp): Có hoặc không có can thiệp; Không giới hạn về các thiết kế nghiên cứu, tuy nhiên loại trừ các bài báo tổng quan tài liệu (review), tổng quan tài liệu hệ thống (systematic review) và phân tích gộp (meta analysis)
- C – Comparison (So sánh): Có hoặc không có nhóm so sánh trong nghiên cứu;
- O – Outcome (Kết quả): Sự biểu hiện của gen Sfrp5 trên mô mỡ và vai trò
của chúng trong các bệnh rối loạn chuyển hóa liên quan
- T – Time (Thời gian): Tất cả các bài báo được công bố tính đến nay;
- Nghiên cứu đo đường nồng độ Sfrp5 trong máu
- Nghiên cứu tổng quan, tổng quan hệ thống, phân tích gộp, v.v
- Báo cáo ca bệnh lâm sàng
- Nghiên cứu sử dụng chung dữ liệu
Trang 322.2.4 Nguồn dữ liệu và chiến lược tìm kiếm
- Từ khóa có trong tiêu đề và tóm tắt của các bài viết có liên quan Các thuật
ngữ Chỉ mục và Tiêu đề Chủ đề Y tế (MeSH) đã được sử dụng để phát triển một chiến
lược tìm kiếm đầy đủ và điều chỉnh cho từng cơ sở dử liệu
- Hai cơ sở dữ liệu được tìm kiếm bao gồm: PubMed và Science Direct
- Từ khóa được sử dụng để tìm kiếm: (Sfrp5) AND (gene expression) AND
((adipose tissues) OR (adipocytes)) AND (metabolic disorders)
- Phần mềm Zotero được sử dụng để lưu trữ dữ liệu khi tìm kiếm Các dữ liệu sau khi tìm kiếm sẽ được xuất và quản lý bằng và Microsoft Excel
2.2.5 Quá trình lọc và lựa chọn nghiên cứu
Quy trình lọc và lựa chọn các nghiên cứu để đưa vào đánh giá như sau:
Bước 1 Hợp nhất dữ liệu tìm kiếm, xóa các bài báo trùng lặp và loại bỏ các bài
báo không có tóm tắt (abstract)
Bước 2 Lọc dựa vào tiêu đề và tóm tắt của bài báo để loại bỏ các báo cáo có
chủ đề nghiên cứu không liên quan đến sự biểu hiện của gen Sfrp5 trên
mô mỡ và vai trò của chúng trong các bệnh rối loạn chuyển hóa liên quan
Bước 3 Truy xuất toàn văn của các bài báo
Bước 4 Lọc dựa vào toàn văn Đánh giá toàn văn của các bài báo với các tiêu
chí lựa chọn và tiêu chí loại trừ
Bước 5 Liên hệ với các tác giả khi cần thiết, để làm rõ mục tiêu nghiên cứu và có
thể yêu cầu thêm thông tin
Bước 6 Đưa ra quyết định cuối cùng về việc đưa vào nghiên cứu và tiến hành
thu thập dữ liệu
Toàn bộ văn bản trích dẫn được chọn sẽ được đánh giá chi tiết bởi hai nhà phê bình độc lập (CN.HVCH Vũ Thị Huệ và SV Ngô Anh Đào) Bất kỳ sự bất đồng nào
Trang 33phát sinh giữa những người đánh giá ở mỗi giai đoạn của quá trình lựa chọn nghiên cứu sẽ được giải quyết thông qua thảo luận, hoặc tham khảo ý kiến với người đánh giá thứ ba (TS Chu Đình Tới) Kết quả tìm kiếm sẽ được báo cáo đầy đủ trong báo
cáo cuối cùng và được trình bày trong sơ đồ PRISMA (Hình 3.1) [31]
2.3 Phương pháp nghiên cứu biểu hiện gen Sfrp5 sử dụng dữ liệu microarray
2.3.1 Nghiên cứu của Leslie P Kozak và cộng sự năm 2010 và cơ sở cung cấp dữ
liệu microarray cho đề tài
Từ những kết quả được chỉ ra từ phương pháp nghiên cứu tổng quan hệ thống, chúng tôi lựa chọn bộ dữ liệu microarray chưa qua xử lý từ nghiên cứu tiến hành bởi
GS Leslie P Kozak và cộng sự năm 2010 [28] Nghiên cứu của GS Leslie P Kozak được thực hiện tại Trung tâm Nghiên cứu Y sinh Pennington, Hoa Kỳ Nhóm tác giả
đã chia sẻ dữ liệu phi lợi nhuận với nhóm nghiên cứu của chúng tôi
Lý do chúng tôi lựa chọn bộ dữ liệu từ nghiên cứu này vì trong nghiên cứu của
GS Leslie P Kozak, các tác giả tập trung điều tra mối quan hệ giữa tình trạng dinh dưỡng trong thời kỳ mang thai của chuột mẹ và sự biểu hiện gen trong mô mỡ của
chuột con- đây là một trong những khoảng trống nghiên cứu về biểu hiện gen Sfrp5
mà chúng tôi chỉ ra từ phương pháp nghiên cứu tổng quan hệ thống Bên cạnh đó, kết quả microarray mà GS Leslie P Kozak và các cộng sự phân tích chỉ tập trung chủ
yếu vào việc đánh giá sự thay đổi biểu hiện mRNA của gen Mest và Bmp3 giữa các chế độ dinh dưỡng và xác định cụm gen có liên quan đến sự mở rộng mô mỡ Các tác
giả không chú trọng đến các phân tích sâu hơn như phân loại chức năng của gen, kiểm tra các con đường tín hiệu và cũng không đề cập đến sự thay đổi biểu hiện của gen
Sfrp5 trong mô mỡ là mối quan tâm chính trong nghiên cứu của chúng tôi Do đó,
chúng tôi đã lựa chọn bộ dữ liệu này để phân tích sự biểu hiện gen Sfrp5 và một số
gen liên quan trên mô mỡ chuột
Ở nghiên cứu thực nghiệm của GS Leslie P Kozak và cộng sự, chuột C57BL/6J (B6) được nuôi ở nhiệt độ 22-24oC với chu kỳ 12h sáng/tối từ khi sơ sinh đến 112
Trang 34ngày tuổi Các chế độ dinh dưỡng khác nhau đã được áp dụng trong 03 giai đoạn nuôi
dưỡng Thiết kế thí nghiệm được mô tả tại Hình 2.2
Hình 2.2 Thiết kế thí nghiệm của GS Leslie P Kozak và cộng sự [28]
- Giai đoạn 01: Chuột sơ sinh đến khi cai sữa (21 ngày tuổi) Tại giai đoạn này, chuột được bú sữa mẹ hoàn toàn Chuột mẹ được nuôi dưỡng theo 1 trong 3 chế
độ ăn khác nhau: 1- Chế độ ăn đối chứng (Control - CONT) với 22% chất béo 2- Chế độ ăn thiếu dinh dưỡng (Lactation undernutrition condition - LUN) với 50% lượng thức ăn của nhóm CONT 3- Chế độ ăn giàu chất béo (Lactation over-nutrition condition - LON) với 58% chất béo trên tổng số lượng thức ăn
- Giai đoạn 02: Chuột cai sữa mẹ đến khi trưởng thành (từ 21 – 56 ngày tuổi) Chuột được cho ăn tự do với chế độ ăn kiêng (CHOW) với 11% chất béo trong lượng thức ăn
- Giai đoạn 03: Chuột trưởng thành (từ 56 – 112 ngày tuổi) Tại giai đoạn này, chuột được nuôi trong chế độ giàu chất béo với 58% chất béo trên tổng số lượng thức ăn
RNA tổng số được phân lập từ mô mỡ trắng vùng bẹn của chuột Chất lượng của RNA tổng số được phân lập từ mô mỡ được xác định bằng công cụ Agilent 2100 Bioanalyzer với trị số đánh giá tính toàn vẹn của RNA (RNA integrity number – RIN)
Trang 35là 8,8-9,1 RNA được khuếch đại, đánh dấu và lai hóa lên chip Applied Biosystems Mouse Genome Survey Microarray với hơn 34.000 đầu dò Quá trình phát hiện tín hiệu quang, chụp ảnh, tạo lưới tự động và phân tích hình ảnh được thực hiện theo Applied Biosystems protocols và sử dụng phần mềm 1700 Chemiluminescent Microarray Analyzer Software v 1.0.3 Nhóm tác giả đã chia sẻ tất cả dữ liệu thô về cường độ tín hiệu micoarray thu được cho chúng tôi một cách phi lợi nhuận
2.3.2 Đối tượng nghiên cứu
Bộ dữ liệu thô được nhóm tác giả chia sẻ cho chúng tôi dưới dạng csv với dung
lượng 67.180kb được mô tả trong Hình 2.3 Bộ dữ liệu gồm 46 cột, trong đó 1 cột
chứa thông tin gen ID và 45 cột chứa thông tin tín hiệu micoarray thu được của 15 nhóm chuột và 32.382 hàng biểu thị dữ liệu tín hiệu microarray của 32.381 gen
Hình 2.3 Một phần cấu trúc bộ dữ liệu thô
2.3.3 Phương pháp tiền xử lý dữ liệu microarray
Mục đích của quá trình tiền xử lý dữ liệu là chuyển đổi dữ liệu thô sang các định dạng phù hợp phục vụ các phân tích tiếp theo Dữ liệu được xử lý và phân tích bằng ngôn ngữ R trên phần mềm RStudio v.4.3.1 với sự hỗ trợ của Bioconductor Laptop Surface Pro7, Intel(R) Core(TM) i5-1035G4 CPU, 1.10GHz, 1.50 GHz, Ram 16.00GB, ổ SDD 512GB đã được sử dụng để xử lý và phân tích số liệu
Trang 36Quá trình tiền xử lý dữ liệu gồm có 2 bước: Chuẩn hóa và Đánh giá
2.3.3.1 Chuẩn hóa
Trong các thí nghiệm cần sử dụng nhiều chip microarray để phân tích biểu hiện gen, các kết quả giữa các chip có thể chưa tương đồng với nhau do sự sai khác về lượng RNA khởi đầu, hoặc khác biệt trong quá trình đánh dấu và phát hiện màu huỳnh quang Điều này làm cho dữ liệu về mức độ biểu hiện gen giữa các chip chưa thể so sánh được với nhau Do đó, quá trình chuẩn hóa giúp các giá trị biểu hiện gen trên các chip khác nhau có phân phối tương đồng với nhau, sao cho các nhóm dữ liệu có thể so sánh với nhau một cách chính xác [36]
Trong quá trình tiền xử lý dữ liệu microarray, có nhiều các phương pháp chuẩn hóa khác nhau đã được sử dụng Tại nghiên cứu này, chúng tôi sử dụng phương pháp chuẩn hóa lượng tử (www.bioconductor.org), một trong những phương pháp phổ biến nhất để chuẩn hóa dữ liệu microarray [55] Phương pháp chuẩn hóa này có ưu điểm
là đặc biệt phù hợp khi so sánh dữ liệu microarray từ các điều kiện thí nghiệm khác nhau Dữ liệu về mức độ biểu hiện của các gen sau khi chuẩn hóa được biểu diễn dưới dạng log2 của cường độ tín hiệu
2.3.3.2 Đánh giá
Sau khi chuẩn hóa dữ liệu, một bước quan trọng cần thực hiện tiếp theo là đánh giá dữ liệu Bước này nhằm mục đích loại bỏ các gen có biểu hiện rất thấp trên các mẫu, từ đó giúp bộ dữ liệu tập trung vào các tín hiệu có ý nghĩa sinh học và tăng cường độ chính xác cho các phân tích xuôi dòng tiếp theo Nghiên cứu này sử dụng
Tỉ lệ phát hiện dương tính giả (False discovery rate - FDR) để đánh giá dữ liệu FDR được xác định là tỷ lệ dự kiến của các giải thuyết bị bác bỏ sai, theo kiểm định Bonferroni Giá trị FDR thường được chấp nhận là < 0,05 [46]
Thứ tự các câu lệnh trong quá trình tiền xử lý dữ liệu được sử dụng:
# Gọi các thư viện cần thiết
if (!require("BiocManager", quietly = TRUE))
install.packages("BiocManager")
Trang 37if (!require("limma", quietly = TRUE))
# Gắn ký hiệu gen theo Entrez gene ID
geneInfoFile <-'Mus musculus_gene_entrez_GeneInfo.csv'
geneSetFile <- 'Mus musculus_gene_ entrez.db'
# Chuẩn hóa và đánh giá dữ liệu
data <- read.csv("raw_count_data.csv")
ex <- exprs(data)
qx <- as.numeric(quantile(ex, c(0., 0.25, 0.5, 0.75, 0.99, 1.0), na.rm=T))
Trang 382.3.3 Xác định gen thay đổi biểu hiện
Phân tích thay đổi biểu hiện là quá trình phát hiện ra các thay đổi trong mức độ biểu hiện của một số gen giữa các mẫu khác nhau hay giữa các điều kiện thí nghiệm khác nhau, với mục đích cuối cùng là xác định mối quan hệ giữa các gen hoặc cụm gen và vai trò sinh học của chúng
Tại nghiên cứu này, chúng tôi sử dụng RStudio để thực hiện xác định được sự thay đổi mức độ biểu hiện gen giữa các nhóm:
- Nhóm 5 ngày tuổi: so sánh giữa nhóm CONT và LUN, giữa nhóm CONT và LON, và giữa nhóm LUN và LON
- Nhóm 10 ngày tuổi: so sánh giữa nhóm CONT và LUN, giữa nhóm CONT và LON, và giữa nhóm LUN và LON
- Nhóm 21 ngày tuổi: so sánh giữa nhóm CONT và LUN, giữa nhóm CONT và LON, và giữa nhóm LUN và LON
- Nhóm 56 ngày tuổi: so sánh giữa nhóm CONT và LUN, giữa nhóm CONT và LON, và giữa nhóm LUN và LON
- Nhóm 112 ngày tuổi: so sánh giữa nhóm CONT và LUN, giữa nhóm CONT
và LON, và giữa nhóm LUN và LON
- Nhóm CONT: so sánh giữa 112 ngày tuổi, 56 ngày tuổi, 21 ngày tuổi, 10 ngày tuổi với 5 ngày tuổi
- Nhóm LUN: so sánh giữa 112 ngày tuổi, 56 ngày tuổi, 21 ngày tuổi, 10 ngày tuổi với 5 ngày tuổi
- Nhóm LON: so sánh giữa 112 ngày tuổi, 56 ngày tuổi, 21 ngày tuổi, 10 ngày tuổi với 5 ngày tuổi
Các phép kiểm định phù hợp (student T-test hoặc Mann-Whitney U test) đã được sử dụng để đánh giá sự biểu hiện gen giữa các nhóm với giá trị p-value Sau đó, kiểm định Stewamini-Hochberg đã được sử dụng để hiệu chỉnh giá trị p-value thu được từ các kiểm định thống kê đã dùng Giá trị p-value hiệu chỉnh <0.05 được coi