dựBáOthờigiansốngsótcủabệnhnhânung
th vúdicănbằngmạngnơronvàcâyhồiquy -
một tiếpcậnmới
Trịnh Quốc Anh
2
, Bernard Assenlain
1
, Thu Hoàng
2
1
Institut Curie, Paris, France,
2
Université René Descartes, Paris, France
Chúng tôi đã phân tích số liệu thuđợc từ 1477 bệnhnhân nữ trên 18 tuổi bị ung th
vú biểu mô có dicănđợc điều trị bằng nhiều liệu pháp khác nhau tại Viện Curie, Paris
(Pháp) từ năm 1977 đến 1998 để nghiên cứu khả năng sốngsótvà sử dụng câyhồiquy
và mô hình mạng nơ ron trong đó có 15 nơ ron tiếpnhận thông tin từ 14 yếu tố đợc
chọn và có yếu tố thờigian để xác định nguy cơ tử vong thevooooôo thờigiancủabệnh
nhân. Việc kết hợp hai phơng pháp thống kê để nghiên cứu thờigiansốngsótcủabệnh
nhân cho kết quả tốt hơn mô hình Cox và cho thấy mối liên quan tiềm ẩn giữa các yếu tố
tiên lợng bệnh.
I. Đặt vấn đề
Nghiên cứu về sự sốngsót (survival
analysis) là một nghiên cứu quan trọng
trong điều trị bệnh, nhất là đối với những
bệnh hiểm nghèo vì nó giúp ngời thầy
thuốc có đợc những cải tiến hợp lý trong
quá trình điều trị bệnh nhằm kéo dài thời
gian sốngcủabệnh nhân. Ung th vú từ
lâu nay đã đợc xem là mộtcănbệnh
điển hình cần nghiên cứu sốngsótvà
ngày càng đợc quan tâm nhiều hơn, thể
hiện qua số lợng các công trình nghiên
cứu không ngừng tăng lên. Thống kê trên
toàn thế giới của National Library of
Medicine (Mỹ) theo chủ đề "Surival
analysis"và "breast cancer" cho thấy từ
năm 1998 đến năm 2001 số bài báo đã
tăng lên hơn 1,5 lần, từ 262 đến 418 bài.
Khó khăn lớn thờng gặp trong nghiên
cứu sốngsót là việc mất thông tin về
bệnh nhân trong quá trình theo dõi điều trị
bởi các nguyên nhân khách quan không
mong muốn; ví dụbệnhnhân bị tai nạn
giao thông hay chuyển chỗ ở. Một điều trị
có tỷ lệ mất thông tin cao sẽ gây ra sai
lệch lớn về ớc đoán thờigiansốngsót
của bệnhnhânvà do đó đánh giá sai hiệu
quả của điều trị.
Các nghiên cứu về sự sốngsót thờng
sử dụng mô hình hồiquycủa Cox (1) để
ớc lợng nguy cơ tử vong củabệnhnhân
(hazard) và từ đó dựbáothờigiansống
sót. Tuy nhiên, mô hình này khó thể hiện
đợc sự tác động qua lại tự nhiên giữa
các yếu tố nguy cơ củabệnh (risk factors)
và do vậy không đánh giá đợc chính xác
khả năng sốngsótcủabệnh nhân.
Với mục đích ứng dụng toán học và tin
học vào nghiên cứu sự sốngsótcủabệnh
nhân ung th vú biểu mô di căn, chúng tôi
tiến hành nghiên cứu này nằm giải quyết
các mục tiêu sau đây:
- Phân tích mối liên quan đơn biến và
đa biến giữa một số yếu tố với thờigian
sống sótcủabệnhnhânung th vú biểu
mô di căn.
- Mô tả mối liên quan tiềm ẩn giữa một
số yếu tố với sự sốngsótbằngmạng nơ
ron.
- Xây dựng câyhồiquydựbáothời
gian sốngsótcủabệnh nhân.
82
II. Đối tợng và phơng pháp
nghiên cứu
1. Số liệu:
Các số liệu đợcthu thập từ 1477
bệnh nhân nữ trên 18 tuổi bị ung th vú
biểu mô có dicănđợc điều trị tại Viện
Curie, Paris (Pháp) từ năm 1977 - 1998,
loại trừ các bệnhnhân sau:
- Bệnhnhân có số lợng bạch cầu đạt
dới 1,5 x 10
9
/L hay có số lợng tiểu cầu
dới 100 x 10
9
/L; trừ khi hiện tợng ức
chế tuỷ xơng là do chính tuỷ xơng.
- Bệnhnhân có nồng độ bilirubin cao
hơn ít nhất 1,5 lần nồng độ bình thờng,
có tiền sử bị suy tim ứ huyết, chỉ có dicăn
ở não là bằng chứng có ung th lan toả.
Viện Curie đã sử dụng 8 thử nghiệm
khác nhau của hoá trị liệu cơ bản có
anthrracyclin để điều trị bệnhnhân bị ung
th vú biểu mô [7]. Các bệnhnhânđợc
đánh giá trớc khi đợc điều trị dựa trên
các kiểm tra kỹ lỡng về lâm sàng nh đo
các tổn thơng có thể sờ thấy đợc, đếm
các tế bào máu, thăm dò chức năng gan,
định lợng nồng độ các điện giải và canxi,
chụp X quang phổi, xơng. Trớc mỗi đợt
điều trị, các thông số của từng bệnhnhân
lại đợc cập nhật nhằm phát hiện các
triệu chứng mới hoặc triệu chứng bệnh
nhân lên đòi hỏi phải điều chỉnh liều. Các
tạng có thể bị dicănđợc chụp cắt lớp và
chụp X quang vào các tháng thứ 4, 8, 12,
18.
Hiệu quả của các thử nghiệm điều trị
đợc đánh giá theo các tiêu chuẩn của tổ
chức chống ung th quốc tế, nh:
- Điều trị đợc coi là có đáp ứng toàn
phần nếu các dicăn đã đợc phát hiện
không còn nữa và là có đáp ứngmột phần
nếu tích số của hai kích thớc dài nhất
vuông góc nhau của tổn thơng đo đợc
giảm đi ít nhất 50%.
- Nếu kích thớc khối dicăn đo đợc
(trừ ở xơng) giảm dới 50% thì cho là
ung th ổn định, còn nếu kích thớc đo
đợc tăng lên trên 25% hoặc xuất hiện
tổn thơng mới thì cho là có ung th tiến
triển.
- Thờigianbệnh tiến triển đợc tính từ
lúc bệnhnhânđợc chọn ngẫu nhiên tới
lúc có ung th tiến triển hoặc tới ngày
theo dõi cuối cùng. Thờigiansốngsót là
thời gian từ lúc đợc chọn ngẫu nhiên cho
đến lúc chết hoặc đến ngày cuối cùng
đợc theo dõi. Nếu chết trớc khi đợc
đánh giá đáp ứng thì đợc coi là ung th
tiến triển.
2. Điều trị ban đầu gồm có 900 ngời
đợc phẫu thuật (chiếm 63% tổng số
bệnh nhân) trong đó 281 ngời đợc cắt
bỏ tuyến vú, 619 ngời đợc cắt bỏ tuyến
vú và bóc phần ngực (lumpectomy). có
364 (25%) bệnhnhân không đợc mổ và
đợc điều trị bảo tồn bằng xạ trị hay điều
trị ngắn ngày. Tổng cộng có 115 (78%)
bệnh nhân dùng chiếu xạ nh là một điều
trị chính hay là một bổ trợ của điều trị. Có
166 (12%) bệnhnhân không đợc điều trị
tại chỗ vì có dicăn sớm. Số bệnhnhân
đợc hoá trị liệu trớc là 446 (31%). Bệnh
nhân đợc lựa chọn theo trị liệu trớc dựa
trên đánh giá của thầy thuốc về nguy cơ
tái phát. Hoá trị liệu trớc bao gồm kết
hợp 5 - FU, foxorubicin,
cyclophosphamide ở 165 (39,4%) bệnh
nhân; CMF (cyclophosphamide,
methotrexate, 5-FU) ở 92 ngời (21,9%);
cyclophosphamide, melphalan,
methotrexate ở 98 ngời (23,4%). Có 64
bệnh nhânđợc điều trị bằng phối hợp
thuốc khác không có anthracycline
(15,3%) và 27 bệnhnhânđợc dùng hóa
trị liệu không theo kiểu đặc hiệu nào. Có
78 bệnhnhân cha dùng hoá trị liệu bổ
sung đã đ
ợc dùng tamoxifen.
3. Các yếu tố chính ảnh hởng đến
sự sốngsót
Trên số liệu ung th kể trên, chúng tôi
chọn ra 14 yếu tố có ảnh hởng quan
83
trọng đến khả năng sốngsótcủabệnh
nhân ung th vúdi căn. Các yếu tố này
(xem bảng 1) đợc số hoá theo các trị số
rời rạc trừ nồng độ LHD (trùng với kết quả
của Pierga et al. [7]:
- Các đặc điểm củabệnh nhân: tuổi
trên/dới 50, có/ không mãn kinh
(menopause) chỉ số Karnovsky trên/dới
60
- 10 thông số củabệnhbao gồm: thời
gian từ lúc chẩn đoán ung th đầu tới lúc
có dicăn kí hiệu là DFI (disease free
interval) trong/ngoài khoảng 6 - 24 tháng,
có/không dùng xạ trị hoặc hoá trị trớc,
kích thớc của hạch lớn/nhỏ (nodal
involvement), cơ quan dicăn (ở phổi,
màng phổi, gan, xơng, da) và số vị trí di
căn.
- Nồng độ LDH (lactic dehydrogenase)
Khả năng sốngsótcủabệnhnhân
đợc đo bằngthờigiansống sót. Đối với
một yếu tố có trị số rời rạc, kiểm định toàn
cục Wald đợc áp dụng để kiểm tra ảnh
hởng của các trị số khác nhau này lên
khả năng sốngsótcủabệnhnhân là có ý
nghĩa thống kê hay không và hệ số nguy
cơ tơng đối (Relative Risk - RR) là tỷ số
so sánh nguy cơ tử vong củabệnhnhân
khi nhận các giá trị rời rạc khác nhau đó.
4. Phơng pháp xây dựng mạng nơ
ron vàcâyhồiquy
Chúng tôi sử dụng mô hình mạng nơ
ron gồm 15 nơ ron tiếpnhận thông tin từ
14 yếu tố đã đợc chọn (bảng 1) và có
thêm yếu tố thờigian t để xác định nguy
cơ tử vong theo thờigiancủabệnhnhân
[9]
III. Kết quả và bàn luận
1. Phân tích mối liên quan đơn biến
theo mô hình của Cox [1]
Các kết quả phân tích đợc trình bày ở
bảng 1.
Bảng 1: Phân tích đơn biến khả năng sốngsót trên 1477 bệnhnhân bị ung th vúdi
căn
Các yếu tố
(tên viết tắt)
Số quan
sát
Tỷ lệ %
Thời giansống
sót (tính theo
trung vị)
Hệ số nguy cơ
tơng đối (với
khoảng tin cậy
95)
P
Tuổi theo năm lúc chẩn đoán ung th vúdicăn (age)
< 50 625 42% 26 1,00
> 50 852 58% 23 1,12 (1,06-1,19) <,001
Mãn kinh (meno)
Không 761 52% 26 1,00
Có 707 48% 22 1,28 (1,15-1,43) <,001
Chỉ số Karnovsky (kar)
< 60 247 17% 26 1,00
> 60 1185 83% 11 2,11 (1,79 - 2,49) <,001
84
Hoá trị liệu bổ sung (chem)
Không 992 67% 26 1,00
Có 485 33% 20 1,39 (1,24 - 1,56) <,001
Xạ trị (irr)
Không 317 21% 26 1,00
Có 1160 79% 23 1,16 (1,01 - 1,32) ,029
Khoảng thờigian từ lúc chẩn đoán đến lúc có dicăn (dfi) 32 (0-289)
> 24 tháng
hoặc < 6
tháng
1118 76% 27 1,00 <,001
Từ > 6 tháng
đến < 24
tháng
359 24% 16 1,85 (1,61 - 2,13) <,001
Mức độ xâm lấn của hạch (nodes)
N = 0 582 39% 29 1,00 ,68
N = 1a 181 12% 26 1,02 (0,93 - 1,11) <,001
N = 1b 481 33% 20 1,14 (1,09 - 1,19) ,28
N = 2 51 3% 17 1,05 (0,96 - 1,15) ,21
N = 3 49 3% 16 1,05 (0,97 - 1,14) <,001
Số vị trí bị dicăn (nbs)
1 522 35% 30 1,00
2 410 28% 24 1,19 (1,12 - 1,27) <,001
>3 542 37% 18 1,12 (1,08 - 1,17) <,001
Di căn vào da (ski)
Không 1127 76% 24 1,00 <,001
Có 350 24% 22 0,88 (0,93 - 1,06) <,001
Di căn vào xơng (os)
Không 687 47% 24 1,00
Có 790 53%) 24 0,99 (0,93 - 1,06) 0,78
Di căn vào màng phổi (plev)
Không 1148 78% 25 1,00
Có 329 22% 19 1,11 (1,04 - 1,19) 0,003
Di căn vào phổi (lun)
Không 1126 76% 26 1,00
Có 351 24% 18 1,10 (1,03 - 1,18) 0,006
Di căn vào gan (liver)
Không 982 66% 28 1,00
Có 495 34% 17 1,36 (1,28 - 1,44) <,001
Nồng độ LDH, UI/l (ldh)
Giá trị liên tục 24 <,001
85
Trung vị củathờigiansốngsót là 24
tháng kể từ ngày đợc chọn ngẫu nhiên cho
điều trị cơ bản. Thờigian theo dõi trung
bình là 155 tháng. Khoảng thờigian thông
thờng để có ung th tiến triển là sau 12
tháng. Độ tuổi bị tái phát ung th thờng
gặp là 53 tuổi (trong khoảng 23 - 79);
khoảng thờigian trung bình từ lúc chuẩn bị
ung th đầu tới lúc tái phát ung th là 32
tháng. Có 24% (351) bệnhnhân bị ung th
di căn ở phổi và trong số này có 150 bệnh
nhân (11%) bị dicăn ở 2 chỗ.
2. Phân tích mối liên quan đa biến
(bảng 2)
Các kết quả trình bày trong bảng 2
chứng tỏ có mối liên quan rõ rệt (qua giá trị
p - value) giữa cơ quan bị dicănvà số
lợng dicăn nên khả năng sốngsótcủa
bệnh nhân. Thật vậy, nếu chỉ có một cơ
quan bị dicăn thì hệ số nguy cơ (RR) chỉ
phụ thuộc vào cơ quan đó vàdicăn vào
gan là yếu tố có ý nghĩa ảnh hởng đến khả
năng sốngcủabệnhnhân (RR = 1,76; p =
0,02). Trờng hợp có 2 nơi bị dicăn thì hệ
số nguy cơ còn cao hơn nữa nếu có một vị
trí bị dicăn là gan (RR = 2,58 p < 0,001 đối
lập với RR = 1,65; p = 0,028). Với trờng
hợp có 3 nơi bị di căn, ta cũng thuđợc kết
quả khác biệt tơng tự khi có 1 dicăn ở gan
(RR = 3,43; p < 0,001) và khi không có di
căn nào ở gan (RR = 1,7; p = 0,02).
Bảng 2: Tác động củamối quan hệ vị trí - số lợng lên khả năng sốngsótcủa
bệnh nhânung th vúdicăn
Vị trí dicăn
Số
quan
sát
Tỷ lệ
%
Thời gian
sống sót
(tính theo
trung vị)
Hệ số nguy cơ
tơng đối (với
khoảng tin cậy
95)
P
< 0,01
Chỉ có dicăn ở da 30 2% 30.5 1,00 ,02
Chỉ có dicăn ở gan 93 7% 25 1,76 (1,09 - 2,85) ,17
Chỉ có dicăn ở phổi 79 6% 25 1,42 (0,86 - 2,33) ,98
Chỉ có dicăn ở màng
phổi
48 3% 51 0,99 (0,61 - 1,63) ,10
Chỉ có dicăn ở xơng 207 15% 30 1,45 (0,93 - 2,28) ,028
Di căn ở 2 nơi, không bị ở
gan
260 18% 28 1,65 (1,06 - 2,59) <,001
Di căn ở 2 nơi, có dicăn ở
gan
150 11% 17 2,58 (1,62 - 4,11) ,02
Di căn ở > 3 nơi, không bị
ở gan
290 21% 23 1,71 (1,09 - 2,69) <,001
Di căn ở > 3 nơi, có di
căn ở gan
252 18% 13 3,43 (2,16 - 5,43)
86
TCNCYH 24 (4) 2003
Kiểm định toàn cục Wald với p < 0,001 chỉ
ra rằng quan hệ bậc 2 vị trí - số lợng củadi
căn là có ý nghĩa trong sự sốngsótcủabệnh
nhân. Các nghiên cứu khác của chúng tôi cũng
chứng minh rằng còn có nhiều mối quan hệ
khác giữa các yếu tố bệnh (trong bảng 1) ảnh
hởng lên khả năng sốngsótcủabệnh nhân.
Nh vậy, quan hệ vị trí - số lợng củadicăn
ảnh hởng rất rõ đến nguy cơ tử vong của
bệnh nhânung th vú biểu mô di căn. Ngoài
ra, Cutler et al [2] còn nêu lên tầm quan trọng
của vị trí bị dicăn đầu tiên đối với tiên lợng
bệnh. Nhiều tác giả khác đã khẳng định rằng di
căn ở gan, ở tạng và ở não ít có giá trị tiên
lợng vàdicăn ở xơng có giá trị tiên lợng
hơn [6, 11]. Trong phân tích của chúng tôi thì
nồng độ LDH là một yếu tố tiên lợng chính.
Thông số này không đợc nói đến nhiều trong
các nghiên cứu trớc đây về tiên lợng ung th
vú nhng ý nghĩa lâm sàng của nó đã đợc đề
cập [10].
3. Mạng nơ ron vàcâyhồiquy trong
nghiên cứu về sự sốngsót
Các kết quả thống kê trên (bảng 1, 2) cho
thấy rằng, khả năng sốngsótcủabệnhnhân
ung th vúdicăn phụ thuộc vào rất nhiều yếu
tố và nhất là vào các quan hệ phức tạp khác
nhau của những yếu tố này. Ngoài ra cũng
phải kể đến mối tơng tác giữa một yếu tố với
một quan hệ để tạo thành một quan hệ mới
cấp cao hơn. Các phơng pháp thống kê
thờng sử dụng hiện nay trong nghiên cứu
sống sót nh mô hình của Cox, mô hình hồi
quy logistic [8] đều không có khả năng tự tìm
kiếm và phát hiện các tơng tác giữa các yếu
tố và chúng ta thờng phải dùng các mô hình
đó cùng với các quan hệ định trớc đợc lựa
chọn theo chủ quan của các thầy thuốc. Cách
làm này không thể đánh giá đợc toàn diện về
ăn bệnh nhất là với thời gian, khi giá trị của các
yếu tố không thể đa ra đợc kịp thời những
cải tiến điều trị theo sự phát triển củabệnh hay
tìm ra đợcmột phơng pháp điều trị mới hiệu
quả nếu họ vẫn bị ràng buộc bởi những mô
hình cứng nhắc, chủ quan. Mộtmạng nơ ron
nhân tạo có thể khắc phục đợc các nhợc
điểm này.
Mô hình mạng nơ ron nhân tạo (artificial
neural network model) lần đầu đợc đa ra bởi
Mc Culloch và Pitts vào năm 1943 dựa trên ý
tởng củamộtmạng nơ ron sinh học: một nơ
ron thần kinh nhận các tín hiệu điện kích thích,
biến đổi và truyền chúng cho các nơ ron kế
cận để cuối cùng cơ thể cảm nhậnđợc kích
thích và có phản ứng phù hợp. Mô hình nơ ron
McCulloch và Pitts (hình 1) mô tả mối quan hệ
giữa p kích thích tố x
1
, x
p
có độ mạnh yếu
tơng ứng là w
1
, ,w
p
với đáp ứng y của nơ ron.
Hình 1: mô hình nơ ron của McCulloch và
Pitts (1943) với hàm kích hoạt bậc thang
Nh vậy, nếu xem đáp ứng y là thông tin đi
ra (kết quả xử lý thông tin) của nơ ron thì y
cũng là tổ hợp của tất cả các thông tin và quan
hệ của p kích thích đầu vào x
1
, , x
p
. Nếu coi p
đầu vào này là p yếu tố bệnhvà đầu ra y là
khả năng sốngsótcủabệnhnhân thì các
thông số củamạng nơ ron w
1
, w
2
cho ta biết
mức độ ảnh hởng của các yếu tố bệnhvà
quan hệ giữa chúng đối với sự sốngsótcủa
bệnh nhân. Ví dụ đơn giản này cho thấy rằng,
mạng nơ ron hoàn toàn có thể mô tả đợc
quan hệ phức tạp giữa các yếu tố bệnh (đầu
vào x) với khả năng sốngsótcủabệnhnhân
(đầu ra y) [3].
Để việc đánh giá thống kê đợc chính xác,
chúng tôi đã loại bỏ 269 bệnhnhân không có
đầy đủ các giá trị quan sát trên 14 yếu tố đã
nêu và còn lại 1028j bệnhnhân có ung th vú
di căn. Mạng nơ ron đợc học bằng phơng
pháp học Bayes (Bayesian learning) nhằm thu
đợc tất cả các thông tin cần thiết từ mọibệnh
nhân, kể cả các bệnhnhân bị mất theo dõi
trong quá trình điều trị hay bị chết vì nguyên
nhân khác (censored cases). Để kiểm tra độ
chính xác củamạng nơ ron trong việc dựbáo
thời giansống sót, chúng tôi chia ngẫu nhiên
số bệnhnhân thành 2 tập: tập học (training
set) gồm 608 bệnhnhân dùng cho việc xác
87
TCNCYH 24 (4) 2003
định mạng nơ ron và tập thử (test set) gồm 600
bệnh nhân còn lại đợc dùng để kiểm nghiệm
kết quả dự đoán. Để đánh giá sự chính xác của
dự báo, chúng tôi sử dụng chỉ số c - index của
Harrell đo tỷ lệ dựbáo đúng với kết quả quan
sát [4]. Các kết quả thuđợc chứng tỏ rằng mô
hình dạng nơ ron (0,664
< c-index < 0,690) cho
kết quả dựbáothờigiansốngsót chính xác
hơn so với kết quả của mô hình Cox (0,657 <
c-index < 0,659) [5]
Mặt khác, để giúp thầy thuốc có thể xác
định đợc nguy cơ của từng bệnhnhân ngay từ
lúc điều trị ban đầu, chúng tôi đã xây dựng cây
hồi quydự đoán thờigiansốngsót dựa trên
các kết quả thuđợc từ mô hình mạng nơ ron
(hình 2)
Dựa trên câyhồiquy (hình 2) chúng tôi xây
dựng 3 nhóm tiên đoán phân loại bệnh nhân.
Nhóm bệnhnhân có thờigiansốngsót dài hơn
cả (A) gồm những bệnhnhân không có dicăn ở
gan, nồng độ LDH < 322 U/l, chỉ số Karnovsky >
60, không điều trị hoá trị liệu trớc và có thờigian
DFI rất ngắn hoặc rất dài. Nhóm có nguy cơ cao
nhất (C) là những bệnhnhân bị ung th dicăn ở
gan, có nồng độ LDH >313 U/l hoặc ít hơn 313
U/l nhng có hơn 2 điểm bị di căn, thờigian DFI
ngắn hoặc dài. Những bệnhnhân còn lại thuộc
nhóm B. Khả năng sốngsótcủa 3 nhóm này trên
tập kiểm định 600 bệnhnhânđợc mô tả bằng
đờng cong xác suất Kaplan Meier (hình 3) với
thời giansốngsót trung bình của nhóm nguy cơ
thấp (A) là 44 tháng, của nhóm nguy cơ cao (C)
là 15 tháng vàcủa nhóm còn lại (B) là 23 tháng.
Ta cũng thuđợc kết quả thờigiansốngsót
tơng tự trên tập học 608 bệnhnhân ban đầu: 45
tháng với nhóm A, 13 tháng với nhóm C và 23
tháng đối với nhóm B.
V. Kết luận
- Quan hệ vị trí - số lợng củadicăn ảnh
hởng rất rõ đến nguy cơ tử vong củabệnh
nhân bị ung th vú biểu mô di căn.
- Mạng nơ ron dựbáo khả năng sốngsót tốt
hơn mô hình Cox nhờ khả năng tổ hợp đợc
các quan hệ tiềm ẩn giữa các yếu tố nhng nó
lại không thể hiện đợc tờng minh các quan
hệ này.
- Mô hình câyhồi qui sử dụng các kết quả thu
đợc từ mạng nơ ron cũng chỉ thể hiện đợc
phần nào các tơng tác có ý nghiã.
Chúng tôi hiện đang sử dụng một số mô
hình phân tích khác nh Randon Forest,
Support Vector Machine để so sánh với mô
hình mạng nơ ron.
Bài viết tuy sử dụng các nghiên cứu và số
liệu tại viện Curie (Pháp) nhng hy vọng sẽ giới
thiệu đợcmộttiếpcậnmới về nghiên cứu
sống sót ở Việt Nam trong nỗ lực nhằm đa
các ứng dụng của Toán học và Tin học vào lĩnh
vực Y tế cụ thể là điều trị bệnhnhânung th
vú.
Tài liệu tham khảo
1. Cox DR. Regression model and life
tables (with discussion) J.Royal Statistical
Soiety B 1972; 34; 187 - 220.
2. Cutler SJ, Ardyce JA, Taylor SG III
Classification of patients with disseminate cancer
of the breast. Cancer 1969; 24: 861 - 9.
3. Farragi D, Simon R. A neural network
model for survival data. Statistics in Medecine
1995; 14; 73 - 82.
4. Harrell EF, Lee KL, and Mark đặc biệt.
Multivarite prognostic models: Issues in
Developing Models, Evaluating Assumptions
and Adequacy, and Measuring and Reducing
Errors, Statistic in Medecine 15 (1996) 361 -
387.
5. Hoang T, Trinh QA, Asselain B.
Construction and validation of a prognostic
model for metastatic breast cancer using
Bayesian neural network and regression tree.
Intelligent data Analysis in Medecine and
Pharmacology 2002, Workshop Notes, 37 - 43,
www.cs.uu.nl/~lucas/in damap
2002/indamap2002-proc.pdf.
6. Hortobagyi JY, Smith TL, Legha SS,
Swenerton KD, Gehan EA, Yap HY et al.
Multivariate analysis of prognostic factors in
88
TCNCYH 24 (4) 2003
metastatic breast cancer. J. Clin. Oncol 1983;
1: 776 - 86.
7. Pierga JY, Asselain B, Jouve M, et al.
Effect of Adjuvant Chemotherapy on Outome in
Patients with Metastatic Breast Carcinoma
Treated with Firstline Doxorubicin Containing
Chemotherapy. Cancer 2001: 91: 1079 -89.
8. Sargent DJ. Comparison of artificial
neural net work with other statistical
approaches: results from medical data sets.
Cancer 2001: 91 (8 Supp) piii: 1636 - 42.
9. Trinh QA, Hoang T, Asselain B. Neural
Network Models for Survival Analysis using
Bayesian Learning or Backpropagation. In:
Vidal T, Liberatore P, eds. STAIRS 2002 -
Starting Artificial Intelligence Researchers
Symposium. Amsterdam: IOS Press, 2002; pp
167 - 177.
10. Yamamoto N, Watanabe, T, Katsumata
N, et al. Construction and validation of a
practical pognostic index for patients with
metastatic breast cancer, J. Clin. Oncol 1998 ;
16: 2401 - 8.
11. Zinser JW, Hortobagyi GN, Buzdar AU,
et al Clinical course or breast cancer patiens
with lever metastases. J. Clin. Oncol. 1987; 5:
773 -82.
Summary
Survival data of metastasis breast cancer
prognosis by neural net works and regression tree
- a new approach
In this paper, we expose a new approach to metastasis breast cancer prognosis based on a
combination of two statistical learning methods, i.e. neural net works and regression tree, applied
to survival data. The two methods allow for interactions among prognostic factors such as the
number and the sites of the metastases.
89
. dự BáO thời gian sống sót của bệnh nhân ung th vú di căn bằng mạng nơron và cây hồi quy - một tiếp cận mới Trịnh Quốc Anh 2 , Bernard Assenlain 1 ,. biến và đa biến giữa một số yếu tố với thời gian sống sót của bệnh nhân ung th vú biểu mô di căn. - Mô tả mối liên quan tiềm ẩn giữa một số yếu tố với sự sống sót bằng mạng nơ ron. - Xây dựng. cơ quan bị di căn và số lợng di căn nên khả năng sống sót của bệnh nhân. Thật vậy, nếu chỉ có một cơ quan bị di căn thì hệ số nguy cơ (RR) chỉ phụ thuộc vào cơ quan đó và di căn vào gan là