CHƯƠNG 2. ỨNG DỤNG MẠNG PHỨC HỢP ĐỂ KHAI PHÁ DỮ LIỆU
2.3. Ứng dụng mô hình để khai phá dữ liệu khám nghiệm ung thƣ
2.3.3. Kết quả đầu ra và phân tích kết quả
Xác định đƣợc 49 module với các thông tin của từng module nhƣ sau:
Bảng 2.4 Thông tin về 49 module Stt Module ID Số ƣợng node
1. 0 286
2. 1 311
3. 2 310
4. 3 196
5. 4 268
6. 5 269
7. 6 324
8. 7 163
9. 8 236
10. 9 113
11. 10 270
12. 11 136
13. 12 102
14. 13 81
15. 14 240
16. 15 116
17. 16 237
18. 17 294
19. 18 219
20. 19 91
21. 20 162
22. 21 73
23. 22 99
24. 23 65
75
25. 24 102
26. 25 107
27. 26 111
28. 27 97
29. 28 35
30. 29 54
31. 30 89
32. 31 39
33. 32 45
34. 33 36
35. 34 42
36. 35 19
37. 36 19
38. 37 19
39. 38 21
40. 39 30
41. 40 168
42. 41 24
43. 42 7
44. 43 42
45. 44 39
46. 45 52
47. 46 29
48. 47 22
49. 48 6
Mỗi module chứa các đối tượng tương tự về các thuộc tính. Phân tích thông tin đƣợc trích xuất từ mỗi module sẽ thu đƣợc quy luật ung thƣ, kết quả cụ thể nhƣ sau:
76
- Đầu tiên, phân loại dữ liệu xét nghiệm tầm soát ung thƣ theo giới tính của những người được chẩn đoán mắc bệnh ung thư. Phần lớn số người bị ảnh hưởng bởi ung thư là nữ (ung thư vú) ở Hà Nội so với nam (ung thư tuyến tiền liệt) (Hình 2.13). Về tỷ lệ ung thƣ, tuy nhiên, ở nữ là 36% và ở nam là 34,6% trong số 100 trường hợp từ mỗi giới tính được chỉ định thực hiện các sinh thiết
và thăm khám. Kết quả này thể hiện nguy cơ ung thƣ ở phụ nữ cao hơn nam giới, đồng thời nghiên cứu cũng đƣa ra khuyến cáo phụ nữ nên thực hiện các biện pháp phòng ngừa bổ sung để giảm thiểu rủi ro của họ, nhƣ có kế hoạch thăm khám phụ khoa định kỳ sau tuổi 40, cải thiện điều kiện môi trường làm việc, thói quen ăn uống, dung nạp nhiều trái cây tươi và rau quả, tập luyện thường xuyên.
- Thứ hai, khảo sát dữ liệu xét nghiệm tầm soát ung thƣ theo dòng họ. Kết quả cho thấy một số dòng họ nhƣ: Nguyễn, Trần, Phạm, Lê lần lƣợt là các dòng
họ dân tộc Kinh có số người ung thư cao nhất, kết quả này tỷ lệ thuận với số lƣợng dân số trên bản đồ dân số Việt Nam. Điều này có nghĩa là hai nguồn dữ liệu khác nhau nhất quán với nhau, làm tăng chất lƣợng của dữ liệu xét nghiệm tầm soát ung thƣ. Các dòng họ phổ biến nhất là các dòng họ của dân tộc Kinh
(chiếm 95% dân số), tỷ lệ thuận với số người mắc bệnh ung thư và các bệnh khác cao hơn. Các dòng họ thuộc các dân tộc thiểu số có số mắc ung thƣ thấp hơn, đặc điểm ở các dòng họ thuộc các dân tộc thiểu số thường sống ở các vùng núi, nơi không khí trong lành hơn và quy mô dân số nhỏ. Kết quả cho thấy rằng
mặc dù số ca ung thƣ theo các dòng họ có sự khác nhau khá xa, nhƣng tỷ lệ ung thư trên 100 người được chỉ định sinh thiết lại khá gần nhau và xấp xỉ 32%. Điều này có nghĩa là không có sự khác biệt đáng kể về tỷ lệ ung thƣ giữa các dòng họ. Kết quả này cũng chỉ ra rằng yếu tố ung thƣ liên quan đến di truyền, điều này đã được chứng minh trong các nghiên cứu trước đây [110].
- Thứ ba, khảo sát dữ liệu xét nghiệm tầm soát ung thƣ theo Tuổi (Hình 2.14). Độ tuổi thấp nhất bị ảnh hưởng bởi ung thư là 0 tuổi, trong khi bệnh nhân cao tuổi nhất là 99. Đặc biệt, độ tuổi có số ca mắc nhiều nhất ở nhóm tuổi 60,
77
tức là từ 45–60 tuổi. Đây là nhóm tuổi có mật độ dân số cao và độ tuổi cũng cao nhất trong nhóm tuổi lao động (18-60), nhóm tuổi này đƣợc cho là quan trọng nhất. Nhƣng cũng đồng nghĩa có nguy cơ ung thƣ cao nhất trong nhóm tuổi lao động, do hệ miễn dịch suy giảm, sức khoẻ kém dần theo thời gian, cường độ lao động cao, thói quen bia rƣợu, sinh hoạt thiếu khoa học đƣợc tích luỹ qua nhiều năm. Kết quả nghiên cứu đƣa ra khuyến cáo với nhóm tuổi này cần nâng cao sức
đề kháng và khả năng miễn dịch đối với tế bào khối u, cần điều chỉnh và thay đổi thói quen ăn uống theo hướng lành mạnh, bổ sung dinh dưỡng khoa học phù hợp với độ tuổi có thể giúp phòng ngừa.
Hình 2.13. Biểu đồ kết quả khảo sát ung thƣ theo giới tính
Hình 2.14. Biểu đồ kết quả khảo sát số ca mắc ung thƣ theo độ tuổi
78
- Thứ tư, khảo sát dữ liệu theo trường Địa chỉ cư trú. Các tỉnh có số ca mắc ung thƣ cao đƣợc ghi nhận là những tỉnh có dân số đông. Mặc dù không có nhiều trường hợp đến khám nhưng tỉnh Điện Biên có tỷ lệ ung thư cao nhất trên
100 người đến khám và được chỉ định sinh thiết, là 35,59%. Điều này có thể do nguyên nhân khai thác tài nguyên không đƣợc quản lý tốt và gây ô nhiễm nguồn nước sinh hoạt. Các tỉnh ở đồng bằng sông Hồng như Hà Nội, Bắc Ninh, Hưng Yên, Hải Dương, Hải Phòng và Quảng Ninh cũng có tỷ lệ mắc ung thư cao hơn vùng còn lại là trung du miền núi phía Bắc. Ở khía cạnh này, có thể đƣợc giải thích do các tỉnh, thành phố đồng bằng có mật độ các khu công nghiệp cao, nguy
cơ ô nhiễm nguồn nước sinh hoạt và môi trường sống bị ảnh hưởng, dân cư đông đúc, thiếu cây xanh, tình trạng ô nhiễm không khí phổ biến do mật độ giao thông và khí thải công nghiệp, sử dụng thuốc bảo vệ thực vật thiếu kiểm soát. Bên cạnh đó, nghiên cứu cũng chỉ ra nguy cơ các bệnh truyền nhiễm cũng phổ biến hơn các tỉnh vùng cao. Kết quả nghiên cứu đƣa ra khuyến cáo cần có quy hoạch nghiêm túc việc cấp phép hình thành các khu công nghiệp, kiểm soát chặt chẽ việc xả thải của các khu công nghiệp, khai thác khoáng sản cần đi vào chuyên nghiệp và quản lý chặt chẽ về công tác môi trường, cải thiện nguồn nước sinh hoạt và chất lƣợng không khí, giảm và sử dụng có khoa học việc sử dụng thuốc bảo vệ thực vật, hoá chất trong sản xuất nông nghiệp bằng các giải pháp hữu cơ.
- Thứ năm, khảo sát ung thƣ theo loại ung thƣ - Top (Hình 2.15). Ung thƣ
vú (C50,9) và ung thƣ cổ tử cung-tử cung (C53,9) đƣợc phát hiện là phổ biến nhất (Hình 2.15). Điều này có thể là do sự thay đổi nội tiết tố ở phụ nữ sau sinh
và cấu trúc cơ quan sinh sản phức tạp của nữ giới, dẫn đến nguy cơ ung thƣ cao
ở phụ nữ ở các nhóm ung thƣ nhƣ tuyến giáp, vú, cổ tử cung và buồng trứng. Tiếp theo là nhóm ung thƣ C16,9 (dạ dày) và C34,9 (phổi). Những bệnh ung thƣ này một phần do nguyên nhân ô nhiễm môi trường sống và làm việc, thói quen tiêu thụ quá nhiều đồ uống có cồn và hít phải khói thuốc lá. Kết quả này khuyến cáo phải nâng cao nhận thức của mọi người về việc cung ứng và tiêu thụ thực
79
phẩm an toàn và giảm thiểu thói quen tiêu thụ nhiều đồ uống có cồn và thuốc lá, tăng cường trong công tác bảo hộ lao động, vệ sinh môi trường sống, đặc biệt quan tâm đến nguồn nước sinh hoạt và không khí.
Hình 2.15. Biểu đồ khảo sát tỷ lệ ung thƣ theo oại ung thƣ
Hình 2.16. Biểu đồ khảo sát một số loại ung thƣ phổ biến
Tổng hợp lại chúng ta có đƣợc các kết luận nhƣ sau:
- Nữ có nguy cơ mắc ung thƣ cao hơn Nam. Một số loại ung thƣ phổ biến
ở nữ nhƣ tuyến giáp, vú, cổ tử cung và buồng trứng nhƣ.
- Các dòng họ phổ biến hơn, đồng nghĩa có số ca mắc cao hơn. Tuy nhiên,
tỷ lệ ung thƣ theo dòng họ không có sự khác biệt lớn giữa các dòng họ trên tổng
số 100 trường hợp ở mỗi dòng họ được chỉ định sinh thiết khi thăm khám. Kết
80
quả cho thấy dòng họ Mai có tỷ lệ cao nhất (34,26%), trong khi tỷ lệ này của dòng họ Trương và họ Hà thấp nhất (29,88%).
- Tỷ lệ mắc bệnh ung thƣ diễn ra ở mọi lứa tuổi, phổ biến nhất là sau 44 tuổi.
- Tỉnh Điện Biên có tỷ lệ mắc bệnh ung thƣ cao hơn các tỉnh khác, khoảng 33,5–36%. Các tỉnh khác ở mức 31–33% trên tổng số 100 người được chỉ định sinh thiết khi thăm khám. Tỉnh có số ca mắc ung thƣ cao nhất là Hà Nội.
- Ung thƣ C37,9 (thận) có tỷ lệ cao nhất (41,57%). Tiếp theo là C48.0 (phúc mạc) (38,23%), và C17,9 (ruột, đại tràng, trực tràng) (37,73%). Thấp nhất
là C54,9 (khối u ác tính cổ tử cung) (26,8%). Nhìn chung, các loại ung thƣ dao động trên 30% trên tổng số 100 người bệnh ở mỗi loại được chỉ định sinh thiết sau kết quả thăm khám ban đầu. Các bệnh ung thƣ phổ biến ở cả nam và nữ bao gồm ung thƣ tuyến giáp, hạch bạch huyết, vòm họng, thực quản, dạ dày, phế quản và phổi. Phụ nữ có nguy có mắc cao hơn nam giới ở một số loại ung thƣ nhƣ tuyến giáp, hạch bạch huyết và vòm họng. Ngƣợc lại, nam có tỷ lệ mắc cao hơn nữ ở một số bệnh ung thƣ gồm: thực quản, dạ dày, phế quản và phổi.
- Trong tổng số 190 loại ung thƣ đƣợc tìm thấy trong bộ dữ liệu, 16 loại ung thƣ phổ biến đã đƣợc phát hiện, chiếm 75% tổng số bệnh ung thƣ đƣợc ghi nhận, gồm: ung thƣ vú, tử cung, buồng trứng, gan, dạ dày, thực quản, ruột, thận.