1. Trang chủ
  2. » Giáo Dục - Đào Tạo

Ứng dụng sác xuất thống kê trong hỗ trợ phân loại bệnh ung thư máu

7 97 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Bài viết này sẽ giới thiệu phương pháp ứng dụng xác suất thống kê đánh giá sự khác biệt giữa các biểu hiện gen của từng trường hợp khác nhau trong bệnh ung thư máu nói chung.

LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA Ứng dụng sác xuất thống kê hỗ trợ phân loại bệnh ung thư máu Application of probability statistics for classification of leukemia cancer Đỗ Văn Đỉnh, Phan Văn Phùng, Nguyễn Hữu Quảng Email: dodinh75@gmail.com Trường Đại học Sao Đỏ Ngày nhận bài: 16/3/2018 Ngày nhận sửa sau phản biện: 15/7/2018 Ngày chấp nhận đăng: 27/12/2018 Tóm tắt Cùng bệnh ung thư máu có nhiều loại khác bạch cầu lymphơ mãn tính, bạch cầu dịng tủy mãn tính, bạch cầu lymphơ cấp tính bạch cầu dịng tủy cấp tính với biểu gen bệnh khác dẫn đến điều trị khác Cùng với kết xét nghiệm sinh thiết việc phân tích liệu biểu gen bệnh thu thập góp phần hỗ trợ bác sĩ chẩn đốn xác bệnh đưa phác đồ điều trị phù hợp cho loại bệnh Bài báo giới thiệu phương pháp ứng dụng xác suất thống kê đánh giá khác biệt biểu gen trường hợp khác bệnh ung thư máu nói chung Đây phương pháp đơn giản hiệu góp phần nâng cao hiệu điều trị bệnh Từ khóa: Ung thư máu; thống kê; AML; ALL Abstract In a process of treatment, we have to evaluate the effectiveness of cancer treatment In leukemia cancer, we have four types such as chronic lymphocytic leukemia, chronic myeloid leukemia, acute lymphocytic leukemia and acute myeloid leukemia with different gene expression of the disease lead to different treatment Along with the results of the tests and biopsies, the analysis of the gene expression data of disease will help doctors to diagnose the disease exactly and can provide a treatment regimen There are many methods to evaluate the difference in group data This article will introduce a statistical probabilistic approach that assesses the difference between the different present of the same type of leukemia, which contributes to the treatment of the disease more effectively Keywords: Leukemia cancer; statistics; AML; ALL GIỚI THIỆU Sự thay đổi đột biến phần ADN gen biểu bệnh Nhưng khó khăn để tiến hành xét nghiệm để phát đột biến xảy gen lớn xuất nhiều vùng nơi mà đột biến xảy Cho tới chưa có nhà khoa học nguyên nhân gây bệnh ung thư máu, song nghi vấn tập trung số nguyên nhân như: Nhiễm phóng xạ, nhiễm mơi trường, yếu tố gen di truyền,… Bệnh ung thư máu [1] phân thành bốn loại bệnh (1) bạch cầu lymphơ mãn tính (CLL): tế bào lymphơ bị ảnh Người phản biện: GS.TSKH Thân Ngọc Hoàn PGS TS Nguyễn Long Giang hưởng thường tiến triển chậm Tuổi thường mắc bệnh 55 tuổi Hầu không gặp trẻ em; (2) Bệnh bạch cầu dòng tủy mãn tính (CML): tế bào dịng tủy bị ảnh hưởng giai đoạn đầu thường tiến triển chậm, phần lớn gặp người lớn; (3) Bệnh bạch cầu lymphô cấp tính (ALL): thể phát triển ác tính tế bào dịng lymphơ tiến triển nhanh, thường gặp trẻ em, người lớn bị mắc; (4) Bệnh bạch cầu dịng tủy cấp tính (AML): tế bào dịng tủy bị ảnh hưởng tiến triển nhanh, xảy người lớn trẻ em Hiện phương pháp điều trị ung thư máu áp dụng nước: hóa trị, liệu pháp sinh học trị liệu, ghép tủy/cấy tế bào gốc, hóa trị xạ trị, uống thuốc Các bác sĩ kết hợp hai phương pháp điều trị trở lên Xác định rõ loại bệnh giúp xác định phác đồ điều trị hiệu Bài báo sử Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(63).2018 NGHIÊN CỨU KHOA HỌC dụng phương pháp thống kê T-test để phân loại hai số bốn loại biểu thường gặp bệnh ung thư máu [2] Bộ sở liệu sử dụng nghiên cứu bệnh ung thư máu thu thập từ thí nghiệm microarray Có nhiều phương pháp phân tích gen microarray phương pháp phân tích đại mang lại hiệu cao với khả lai hàng chục nghìn lỗ gen cho kết chục hàng nghìn gen lúc Cùng với T-test, phân tích liệu nhanh Việc sử dụng sở liệu gen để phát đường dẫn truyền tín hiệu tế bào gen sinh ung mang lại hiểu biết ung thư chế sinh ung Với hiểu biết này, hệ thống sở logic cho liệu pháp điều trị hình thành, là liệu pháp nhắm trúng đích Đây trọng tâm nghiên cứu bệnh ung thư hy vọng cho điều trị ung thư tương lai PHƯƠNG PHÁP NGHIÊN CỨU 2.1 Công nghệ microarray sở liệu gen Microarray kính silicon, hay màng nylon mang ma trận hai chiều gen Công nghệ ADN microarray công cụ sử dụng để xác định xem ADN từ cá nhân cụ thể chứa đột biến gen BRCA1 BRCA2 ung thư vú ADN microarray (thông thường biết đến với tên gọi ADN chip hay chip sinh học) tập hợp điểm ADN siêu nhỏ gắn giá thể rắn Các nhà khoa học sử dụng ADN microarray để đo cách đồng thời mức độ biểu lượng lớn gen vùng đa gen hệ gen Mỗi điểm ADN chứa hàng picomoles (10-12 moles) trình tự gen đặc hiệu, biết đến mẫu dị (probes reporters hay oligos) Chúng đoạn ngắn gen yếu tố ADN khác, sử dụng để lai với ADNc ARNc (hay ARN anti-sense) (được gọi đích) điều kiện nghiêm ngặt Sự lai mẫu dò – đích thường phát định lượng chất đánh dấu huỳnh quang (fluorophorelabeled), bạc (silver-labeled) phát quang phản ứng hóa học (chemiluminescencelabeled) để xác định mức độ lặp lại trình tự acid nucleic đích Một số cơng ty sản xuất microarray sử dụng phương pháp tương tự người sử dụng để làm cho vi mạch máy tính Một gen chip microarray có kích thước nhỏ minh họa hình Đây loại chip sử dụng phân tích khác biệt bệnh ung thư máu thử nghiệm kết phần thực nghiệm báo Hình Gen chip Affymetrix [8] Trên bề mặt, chip chứa hàng ngàn ngắn, tổng hợp, trình tự ADN sợi đơn, thêm đến gen bình thường, biến thể (đột biến) gen tìm thấy cộng đồng người [7] Khi tiến hành thí nghiệm lai gen chip ta thu sở liệu gen cần phân tích loại bệnh hay bệnh số bệnh nhân Bản chất liệu thơ từ thí nghiệm microarray ảnh lưu dạng file ảnh TIFF Những ảnh phải đánh giá phần mềm phân tích ảnh để xác định lỗ liên quan đến thành phần mảng phép đo cường độ huỳnh quang lỗ kênh cường độ Một số đánh giá khác giá trị trung bình, điểm trung tâm, độ lệch tiêu chuẩn cường độ điểm ảnh đỏ xanh… thu nhận từ phần mềm chuyên biệt sử dụng cho phân tích ảnh Hình Ba mức xử lý liệu thí nghiệm microarray Để nhận ma trận biểu diễn giá trị đo mức biểu gen cuối cùng, tất đánh giá chất lượng liên quan đến gen mảng mảng giống phải kết hợp với ma trận tổng phải bình thường hóa để mảng khác so sánh với minh họa hình [9] Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(63).2018 LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA 2.2 Phương pháp T-test Như giới thiệu, ung thư máu có nhiều loại phạm vi báo này, ta xét hai loại ung thư máu AML ALL Câu hỏi đặt liệu loại gen biểu ung thư máu hai loại ung thư máu khác có biểu khác biệt khơng? Và liệu dựa vào biểu gen ta phân tách loại ung thư máu không? Kết ta mong muốn rút có khác biệt hay không biểu gen gen bệnh nhân hai loại bệnh Để thực phân loại hai liệu, báo sử dụng phương pháp thống kê T-test [4] Một T-test kiểm tra thống kê mà thí nghiệm đặt giả thuyết (hay H 0), có nghĩa người thí nghiệm giả định khơng có khác biệt đáng kể hai nhóm Trong nhiều trường hợp khơng muốn biết nhóm cho có khác biệt, khác biệt xảy ngẫu nhiên khác biệt thực Khi phải tính tốn thêm giá trị p - xác suất xảy ngẫu nhiên Các giá trị nhỏ giá trị p, có nhiều giá trị khác có ý nghĩa hai nhóm [4] Để thực đánh giá T-test, ta phải thực bước sau: dạng so sánh với liệu khác Giá trị t thực kiểm định t, cho phép tính khả hai nhóm khác cách có ý nghĩa thống kê t= µ1 − µ2 (2) s đó: t giá trị thống kê; s độ lệch chuẩn; µi giá trị trung bình liệu nhóm Quan sát cơng thức ta nhận thấy giá trị t tỉ số tín hiệu nhiễu, giá trị t lớn có ý nghĩa thống kê - Bước thứ xác định bậc tự mẫu: Khi dùng giá trị thống kê t, bậc tự xác định dựa kích cỡ mẫu Cộng số quan sát nhóm sau trừ hai Ví dụ với df = bậc tự có quan sát nhóm thứ quan sát nhóm thứ hai - Bước cuối dùng bảng t để đánh giá mức ý nghĩa. Bảng giá trị thống kê t (hình 3) và bậc tự - Xác định giả thuyết: Giả thuyết tuyên bố số liệu thực nghiệm khác biệt xuất tổng thể Mọi thực nghiệm có giả thuyết khơng giả thuyết nghịch Nói cách tổng quát, ta so sánh hai nhóm để thấy liệu chúng giống hay khác [5] - Chọn mức ý nghĩa nhằm xác định độ khác biệt để xem có ý nghĩa liệu: Mức ý nghĩa (còn gọi alpha) ngưỡng mà bạn chọn để định ý nghĩa Nếu giá trị p nhỏ hay mức ý nghĩa cho trước, số liệu coi có ý nghĩa thống kê [10] - Xác định công thức độ lệch chuẩn Độ lệch chuẩn đo lường mức phân tán liệu Đây thơng tin tính đồng điểm liệu mẫu s= ∑(x i − µ) (1) N −1 đó: s độ lệch chuẩn; xi đại diện giá trị; µ giá trị trung bình liệu nhóm; N tổng số quan sát - Sau tính giá trị thống kê t liệu Giá trị thống kê t cho phép chuyển liệu thành Hình Ví dụ bảng phân bố Tìm dịng chứa bậc tự liệu giá trị p tương ứng với giá trị thống kê t mà bạn có Cộng số quan sát nhóm sau trừ hai Cuối ta dùng bảng t để đánh giá mức ý nghĩa 2.3 Ứng dụng T-test phân tích hai mẫu Để chạy T-test Matlab phải xác định Nếu biến có sẵn danh sách (từ Excel, từ ví dụ) lấy cách cắt dán hàm - File Word: copy liệu vào Matlab thiết lập vào biến - File Text: sử dụng câu lệnh Matlab (dữ liệu file Matlab folder): load filename.txt - File Excel: sử dụng xlsread(filename) câu lệnh num = Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(63).2018 NGHIÊN CỨU KHOA HỌC Theo lý thuyết thiết lập T-test giá trị giả định (định nghĩa “H” Matlab) Giá trị giả định khơng có nghĩa khơng có khác biệt nhóm Nếu viết H = ttest (a, [giá trị giả định]) ấn trả về, Matlab trả giá trị 1; nghĩa giá trị giả định không xác khác biệt hai nhóm; nghĩa giá trị giả định xác: khơng có khác biệt đáng kể Đối với mẫu không loại ta sử dụng T-test mẫu KẾT QUẢ THỰC NGHIỆM 3.1 Cơ sở liệu Hai sở liệu bệnh ung thư máu sử dụng lấy từ sở liệu lưu sở St.Jude Children’s Research Hospital Hai số liệu 44 bệnh nhân mắc bệnh bạch cầu cấp dịng lymphơ (ALL) 44 bệnh nhân mắc bạch cầu cấp dòng tủy (AML), mẫu 88 bệnh nhân lấy thời điểm chẩn đoán thu chip Affymetrix Hgu6800 Kết thu mức biểu 12627 gen Bộ số liệu ALL minh họa hình Và số liệu AML minh họa hình [3] Hình Trích bệnh nhân (cột C đến J) 30 gen số liệu bệnh nhân ALL Hình Trích bệnh nhân (cột C đến J) 30 gen số liệu bệnh nhân AML Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(63).2018 LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA Hai số liệu bao gồm: - Cột thứ Probe set, hố gen đầu dò, lỗ (hay giếng gắn sẵn giá microarray) Có tất 12627 lỗ gen ứng với 12627 gen khác nhau; - Cột thứ hai gen gắn đầu dò microarray; - Cột thứ ba trở biểu gen ứng với gen bệnh nhân mã hóa thành số Với 44 cột tương ứng với 44 bệnh nhân khác Cả hai số liệu thể số lượng gen gen hố gen giống Tất gen số liệu tất gen phát mẫu xét nghiệm, bao gồm gen biểu ung thư máu gen không biểu ung thư máu Ta thực phân tích số gen có biểu ung thư máu, 12627 gen số liệu, ta tìm chọn khoảng 40 gen để thực nghiên cứu phân tích số liệu Ung thư máu có nhiều loại phạm vi báo này, ta xét hai loại ung thư máu AML ALL Câu hỏi đặt liệu loại gen biểu ung thư máu hai loại ung thư máu khác chúng có biểu khác biệt khơng? Và liệu dựa vào biểu gen ta phân tách loại ung thư máu khơng? ta có nhóm gồm bệnh nhân A, B, C nhóm gồm bệnh nhân X, Y, Z hai nhóm độc lập Nhưng hai nhóm có chung bệnh nhân hai nhóm khơng độc lập - Biến so sánh phải tuân theo phân phối chuẩn Gaussian - Phương sai hai nhóm gần - Các đối tượng phải chọn ngẫu nhiên Kiểm định T hai mẫu để trả lời câu hỏi hai mẫu có luật phân phối, hay cụ thể hai mẫu có thật có trị số trung bình hay khơng Do đó, nhiệm vụ phân tích số liệu để xác định có hay khơng khác biệt biểu gen hai bệnh ung thư khác hay không Kết luận rút có ý nghĩa lâm sàng chẩn đốn bệnh đưa khuyến cáo cho bác sĩ trình chữa bệnh cho bệnh nhân Để đơn giản dễ dàng thao tác, nhóm tác giả thực xây dựng giao diện người dùng với sở liệu tích hợp gen ung thư máu chung Điều giúp dễ dàng thực phân tích đánh giá kết phân tích xử lý sở liệu Trong giao diện có ba phần chính: GENE, DATA, RESULT Kết ta mong muốn rút có khác biệt hay khơng biểu gen gen bệnh nhân hai loại bệnh 3.2 Kết Áp dụng lý thuyết thống kê vào hai số liệu ung thư máu, kiểm định T-test hai nhóm [5] định nghĩa công thức sau: t= x1 − x2 (3)  s12 s22   +   n1 n2  đó: x1 x2 trung bình hai nhóm; s1 s2 độ lệch chuẩn hai nhóm; n1 n2 số lượng mẫu hai nhóm Trước thực phương pháp kiểm định T ta phải tiến hành kiểm tra số liệu yêu cầu đáp ứng điều kiện hay giả định sau: - Hai nhóm so sánh phải hồn tồn độc lập Khi nói đến độc lập nói đến hai nhóm khơng có tương quan đến Độc lập có nghĩa khơng có liên hệ với Ví dụ Hình Giao diện kiểm tra biểu gen bệnh ung thư máu Từ sở liệu nhận mô tả phần ta lựa chọn số gen đưa vào chương trình Các gen biểu ung thư máu sàng lọc từ 12627 gen gen sau đây: - Gene Mouse interleukin (IL-2); - Gene Human metallothionein-I-A; - Gene Homo sapiens BRCA1-associated protein (BRAP2); - Gene Human homeobox protein Cdx2; - Gene Human class I homeoprotein (HOXA9); - Gene H.sapiens MTCP1 gene; - Gene Homo sapiens Notch3 (NOTCH3); Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(63).2018 NGHIÊN CỨU KHOA HỌC - Gene Human aryl hydrocarbon receptor nuclear translocator (ARNT) Hình Thơng tin gen hiển thị Sau chọn gen chuyển sang phần DATA, ta cần chọn Begin End (vị trí gen ta chọn sở liệu) tương ứng gen thông tin hiển thị phần gen, sau ấn vào nút check, chương trình xử lý làm việc kết hiển thị phần RESULT Hình Thao tác chọn vị trí gen sở liệu Hình Kết việc chạy chương trình kiểm tra biểu gen Mouse interleukin (IL-2) gen bệnh ung thư máu Khi đưa vào kiểm tra, kết cho thấy gen Mouse interleukin (IL-2) hiển thị khơng có khác biệt biểu gen hai bệnh có nghĩa gen khơng có tác dụng để phân tách hai bệnh AML ALL gen gen biểu ung thư máu Nhưng thử nghiệm với gen Gene Human metallothionein-I-A, kết cho là: “Có khác biệt biểu gen hai bệnh” “Có ý nghĩa chẩn đốn bệnh” Có nghĩa biểu gen có khác biệt hai bệnh AML ALL, kết giúp bác sĩ sàng lọc hai bệnh ung thư máu giúp bác sĩ có định đắn liệu pháp điều trị bệnh, cần điều trị vào gen biểu khác hai loại bệnh mang lại hiệu cao điều trị vào tất gen biểu ung thư máu Những gen mang lại kết có khác biệt là: - Gene Human class I homeoprotein (HOXA9); - Gene Human metallothionein-I-A; - Gene Homo sapiens Notch3 (NOTCH3) Một số gen biểu cho bệnh ung thư máu như: Mouse interleukin (IL-2) gene, Human metallothionein-I-A gene (I-A), Human class I homeoprotein (HOXA9) mRNA, Homo sapiens Notch3 (NOTCH3) mRNA… Những gen biểu bệnh ung thư máu, với loại ung thư máu khác có biểu gen khác Với gen khác kết phân tích cho kết “khác biệt” có nghĩa gen phân tích có khả phân tách hai loại bệnh AML ALL, kết “không khác biệt” có nghĩa gen phân tích khơng có khả phân tách hai loại bệnh trên, dùng để phân tách loại bệnh khác ung thư máu Với trường hợp kết khác biệt, kết cho bác sĩ khuyến nghị loại gen dùng để chữa trị bệnh, với trường hợp kết “khơng khác biệt” cho bác sĩ khuyến nghị bệnh nhân khơng mắc AML ALL mà dùng thêm xét nghiệm khác để kết luận bệnh ung thư máu xác bệnh nhân Hình 11 Kết phân tích khơng có khác biệt biểu gen hai bệnh Hình 10 Kết phân tích có khác biệt biểu gen hai bệnh Vậy, khơng phải tất 12627 gen có biểu mà biểu số gen định Đây gen đặc trưng có ung thư máu 10 Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(63).2018 LIÊN NGÀNH ĐIỆN - ĐIỆN TỬ - TỰ ĐỘNG HÓA Cũng nhờ dựa vào việc phân tích gen có biểu hay khơng có biểu ta phân biệt hai nhóm ung thư máu khác AML ALL Kết góp phần hỗ trợ cho bác sĩ việc chẩn đoán xác loại bệnh ung thư máu riêng biệt từ có phác đồ điều trị đắn cho bệnh nhân KẾT LUẬN Bài báo đưa hướng nghiên cứu xây dựng chương trình xử lý phân tích liệu đánh giá phân loại bệnh ung thư máu giao diện người dùng giúp đỡ bác sĩ việc phân loại bệnh ung thư máu Chương trình xây dựng thực phần mềm Matlab Kết chương trình phân loại bệnh ung thư máu đưa khuyến nghị cho bác sĩ việc chẩn đốn xác loại bệnh ung thư máu riêng biệt từ có phác đồ điều trị đắn cho bệnh nhân Đặc biệt, kết nghiên cứu bước khởi đầu cho việc chữa trị ung thư phương pháp liệu pháp gen, áp dụng cho nhiều bệnh viện miền Tổ quốc đưa việc chữa trị ung thư nước ta lên bước phát triển mới, nâng cao chất lượng sống cho nhân dân [2] Henrik R Wulff, Bjorn Andersen, Preben Brandenhoff, Flemming Buttler (1987) Statistics in Medicine [3] T Golub, D Slonim, P Tamayo, et al (1999) Molecular classification of cancer: Class discovery and class [1] Bộ Y tế (2015) Hướng dẫn chẩn đoán điều trị số bệnh lý huyết học 22/4/2015 by gene expression Bioinformatics & Computational Biology, 286 (1999), 531–537 [4] J Clerk Maxwell (1892) A Treatise on Electricity and Magnetism, 3rd ed., vol Oxford: Clarendon, pp.68–73 [5] John M Cimbala (2014) Hypothesis Testing Penn State University [6] John M Cimbala (2010) Two Samples Hypothesis Testing [7] Microarray Bioinformatics Dov Stekel, Cambridge University, 2003 [8] https://c1.staticflickr.com/3/2527/3764113525_ d86f0edaa6_b.jpg [9] Brazma, A., et al (2001) Minimum information about toward TÀI LIỆU THAM KHẢO prediction a microarray experiment (MIAME) - standards for microarray data Nature Genetics, Vol 29: p 365-371 [10] http://www.stat.yale.edu/Courses/1997-98/101/ sigtest.htm Tạp chí Nghiên cứu khoa học - Đại học Sao Đỏ, ISSN 1859-4190 Số 4(63).2018 11 ... xét hai loại ung thư máu AML ALL Câu hỏi đặt liệu loại gen biểu ung thư máu hai loại ung thư máu khác chúng có biểu khác biệt không? Và liệu dựa vào biểu gen ta phân tách loại ung thư máu khơng?... pháp T-test Như giới thiệu, ung thư máu có nhiều loại phạm vi báo này, ta xét hai loại ung thư máu AML ALL Câu hỏi đặt liệu loại gen biểu ung thư máu hai loại ung thư máu khác có biểu khác biệt...NGHIÊN CỨU KHOA HỌC dụng phương pháp thống kê T-test để phân loại hai số bốn loại biểu thư? ??ng gặp bệnh ung thư máu [2] Bộ sở liệu sử dụng nghiên cứu bệnh ung thư máu thu thập từ thí nghiệm

Ngày đăng: 26/10/2020, 09:50

Xem thêm:

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w