Bài soạn ONE – CLASS SUPPOR VECTOR MACHINES (SVMS) WITH A CONFORMAL KERNEL

MƠN MƠ HÌNH TÍNH TỐN VÀ MƠ PHỎNG TRƯỜNG ĐẠI HỌCTháng năm 2011 TP HCM TP HCM, BÁCH KHOA KHOA KHOA HỌC ỨNG DỤNG BỘ MƠN TỐN ỨNG DỤNG MƠN HỌC : MƠ HÌNH TỐN VÀ MƠ PHỎNG TIỂU LUẬN MATHEMATICAL MODEL AND SIMULATION ONE – CLASS SUPPOR VECTOR MACHINES (SVMs) WITH A CONFORMAL KERNEL ̉ MỘT NGHIÊN CỨU TRONG XƯ LÝ LỚP MẤT CÂN BẰNG A CASE STUDY IN HANDLING CLASS IMBALANCE TIỂU LUẬN ̃ GVHD : TS NGUYÊN VĂN MINH MẪN PHƯƠNG PHÁP ONE – CLASS SUPPOR VECTOR MACHINES VỚI MỘT HẠT NHÂN HV : TRẦN MINH THẾ – MSHV : 90924006 BẢO GIÁC ONE – CLASS SUPPOR VECTOR MACHINES (SVMS) WITH A CONFORMAL KERNEL ̉ MỘT NGHIÊN CỨU TRONG VIỆC XƯ LÝ LỚP MẤT CÂN BẰNG A CASE STUDY IN HANDLING CLASS IMBALANCE HỌC VIÊN : TRẦN MINH THẾ - MSHV : 90924006 TP HCM, Tháng năm 2011 HỌC VIÊN : TRẦN MINH THẾ - MSHV : 90924006 MƠN MƠ HÌNH TÍNH TỐN VÀ MƠ PHỎNG MỤC LỤC Tóm tắt Vấn đề cân liệu (The Imbalanced Data Problem) ̉ ̣ ̉ Sư dung hạt nhân bao giác (Conformal Kernels) One-Class SVMs 2.1 Phương pháp One-Class Classification 2.2 Phương pháp One-Class Support Vector Machines 2.3 Cải thiên độ xác ( Accuracy Improvement ) Ứng dụng để phát nhiễm trùng bệnh viện (Application to nosocomial infection detection) Thí nghiệm 4.1 Đánh giá chiến lược 4.2 Kết Kết luận công việc tương lai Lời cảm ơn Tài liệu tham khảo HỌC VIÊN : TRẦN MINH THẾ - MSHV : 90924006 MƠN MƠ HÌNH TÍNH TỐN VÀ MƠ PHỎNG TÓM TẮT ̣ Class imbalance vấn đề phổ biến nhiều linh vưc chuẩn đoán y ̃ ̣ hoc phân loại văn Để làm điều này, ngườ i ta dù ng phương pháp one-class SVMs ̉ ́ ̉ Trong bà i báo nà y ,ngườ i ta dù ng phương pháp đê khao sát vân đề ́n 11% ngườ i nhiễm ̣ ̣ ̣ ̣ ̉ chăm sóc sứ c khoe ̉ơ bênh viên, sư phân biêt liên quan đê ̣ ̣ bênh từ 89% ngườ i không nhiễm bênh ́ ̣ ̉ ̉ Kêt qua là , so với các phương pháp sư dung khác thi ̀ phương pháp Oné ̣ ̣ ̣ ̣ ̣ ̣ ̣ ̣ Class SVMs đat đươc đô nhay cao nhât, ghi nhân đươc dữ liêu nhiễm bênh Tuy nhiên giá phải trả suy giảm đặc biệt lúc, dành cho chuyên gia để định tỉ lệ trường hợp false positives, họ sẵn sàng chấp nhận để bảo đảm tất bệnh nhân bị nhiễm trùng MỘT SỐ KÍ HIỆU VÀ HÀM TOÁN HỌC DÙNG TRONG BÀI BÁO + w pháp tuyến ( vector weight ) ̉ ́ + ρ thông số cho trước gồm những điêm nằm bên ngoà i hyperplan giữa gôc và hyperplan ̉ ̉ ̉ ́ ̣ ̣ ̣ ̉ + υ ∈( 0,1) là thông số điều khiên sư chuyên đôi giữa khoang cách cưc đai từ gôc ́ ̣ ̣ ̣ và gồm hầu hêt các dữ liêu đươc tao từ hyperplan ̣ ̣ + xi là vector đinh hướng dữ liêu cho f ( xi ) ≤ là vector (SVs) với α ≠ i ̣ và goi ́ ̣ ̣ ̣ ̉ + Φ( xi ) Φ( x j ) đươc tao từ xi x j K là hà m đôi xứ ng thoa điều kiên Mercer ( ( K ( xi , x j ) = Φ xi ), Φ x j ) + ̉ σ là thông số điều khiên đô rông cua hà m kernel xung quanh ̣ ̣ ̉ ρ = ∑ α i K ( xi , x j ) n với x j cho αi thỏa i =1 HỌC VIÊN : TRẦN MINH THẾ - MSHV : 90924006 ≤α j ≤ υn xi mà phụ MƠN MƠ HÌNH TÍNH TỐN VÀ MƠ PHỎNG + Định nghĩa hàm kernel Định nghĩa: Cho X Y hai tập cho trước Định nghĩa f hàm kernel ánh xa từ X sang Y thỏa điều kiện sau: x1 x2 thuộc X f ( x1 ) = f ( x ) f ( x1 ) f ( x2 ) hai phần từ thuộc Y Công thức f : X  Y ker( f ) = {( x1 , x ) ∈ X × X : f ( x1 ) = f ( x )} ( ( Định lý: Một hàm k : x × x → y viết k ( x, y ) = Φ x ), Φ y ) Φ x ) ánh xạ đặc điểm x → Φ( x ) ∈ F k(x,y) thỏa mãn thuộc tính ( xác định + Hàm Sign : Hàm signum số thực hàm xác định :  − if x <  Sign =  if x =  if x >  + Điều kiện Mercer K ( x, y ) = ∑Φ( x ) i Φ( y ) i với g(x) thỏa mãn i ∫g ( x ) dx hữu hạn ∫ K ( x, y ) g ( x )g ( y )dxdy ≥ Vấn đề cân liệu (The Imbalanced Data Problem) Dữ liệu cân vấn đề quan trọng ứng dụng, mà mục đích để tối đa hóa chấp nhận lớp thiểu số, thông thường trường HỌC VIÊN : TRẦN MINH THẾ - MSHV : 90924006 MƠN MƠ HÌNH TÍNH TỐN VÀ MƠ PHỎNG hợp chuẩn đốn y tế Vấn đề lớp cân tích cực điều tra cịn rộng mở, xử lý theo số cách [14], bao gồm: lấy mẫu lớp thiểu số, tính tốn chi phí phân loại độ nhạy [10] mà gán chi phí cao để khơng phân loại lớp thiểu số, stratifiers lấy mẫu trường hợp đào tạo để cân phân bố lớp học [15] dựa quy luật - phương pháp mà cố gắng để tìm hiểu quy luật tin cậy cao lớp thiểu số [1] Trong báo điều tra cách khác trình quy nạp xu hướng tăng cường độ nhạy (ví dụ, khả nhận dương tính) Cách tiếp cận này, dựa phương pháp one-class support vector machines (SVMs) với hạt nhân bảo giác (conformal kernel), mô tả mục ứng dụng để phát nhiễm trùng bệnh viện thảo luận mục Thí nghiệm tiến hành để đánh giá cách tiếp cận kết mô tả mục Sử dụng hạt nhân bảo giác phương pháp One-Class SVMs ( Using Conformal Kernels in One-Class SVMs ) 2.1 Phương pháp One- Class Classification + Trong phần lớn bà i toán bao gồm phân biệt hai nhiều lớp, ̉ ́ ̣ vấn đề khác xây dựng tốt kiêu one - class hoăc các vân đề mới phát ̣ hiên ̣ ̣ ̣ + Trong phương pháp one-class đươc thưc hiên chuyên trường hợp từ lớp ̣ ̉ đa số không nhìn thấy từ các lớp thiểu số Nó đươc ước tính ̉ơ giao cua ̉ hai lớp giảm thiêu phân loại sai dựa liệu nằm mặt ̣ + Phương pháp one-class đặc biệt thu hút trườ ng hơp lớp đắt tiền ̣ khó khăn để để xây dựng mơ hình Các phương pháp trư c tiếp để phát ̀ u bất thường trường hợp ước tính mật độ tiểu thuyết hay điê liệu, để thiết lập ngưỡng mật độ Tuy nhiên, đơn giản nhiều để mơ hình hỗ trợ phân bố liệu, nghĩa là, để tạo giá trị nhị phân dương vùng khơng gian đầu vào có chứa hầu hết liệu giá trị nhị phân âm nơi khác phần sau mô tả cách tiếp cận Minh họa hình vẽ HỌC VIÊN : TRẦN MINH THẾ - MSHV : 90924006 MƠN MƠ HÌNH TÍNH TỐN VÀ MƠ PHỎNG Hai lớp w1 w2 cho -1 Cho χ = { xi ,1 , , xi ,d } , xi ∈ χ = ℜd Với x i ta có y i = f ( x, w) ∈ { − 1,+1} w pháp tuyến ( vector weight ) Đối với phân loại, hàm f (x) : f : R d → { − 1,+1} Minh họa hình vẽ HỌC VIÊN : TRẦN MINH THẾ - MSHV : 90924006 MƠN MƠ HÌNH TÍNH TỐN VÀ MƠ PHỎNG 2.2 Phương pháp One-Class Support Vector Machines ̣ ̣ ̉ ̉ ̉ Xây dưng ban dưa nền tang cua Structural Risk Minimization (SRM) từ lý ́t thông kê ́ thuyê ̉ ̉ ́ ̣ ̣ ̣ ̉ Phương pháp SVM dù ng cách phân loai đê xư lý các vân đề dưa và o dữ liêu từ chi ̉ ́ ̣ ̣ i là one-class SVM Nó dù ng đê phân loai và xác đinh điều bât ̣ one class và go ̉ ̣ ̉ thườ ng và đê loai chúng khoi những điều bình thườ ng ̣ ̣ SVM đươc xây dưng sau : d ̣ Xét tâp χ = { xi } , i = , , n , xi ∈ℜ giả sử phân phối theo xác suất ̣ ̉ P Chúng ta muốn để biết mẫu thư x phân phối theo P hoăc là không theo P ́ ̣ ̣ ̣ ̣ ̣ ̉ Điều nà y đươc thưc hiên bằng cách xác đinh khu vưc R cua không gian xuât phát ̉ ́t ̉ơ môt điêm thư, ve ̃ từ P nằm bên ngoà i R thi ̀ đươc giới han bơi ̣ ̣ ̣ ̣ ̉ ̉ X vì vây xác suâ υ ∈( 0,1) ̣ ̣ giá tri quy đinh ưu tiên Minh họa hình vẽ HỌC VIÊN : TRẦN MINH THẾ - MSHV : 90924006 MÔN MÔ HÌNH TÍNH TỐN VÀ MƠ PHỎNG ́ ̣ ̉ ̉ Điều nà y đươc giai quyêt bằng hà m mô ta : hàm f(x) dương R âm nơi khác f ( x ) > if x ∈ R and f ( x ) < if x ∈ R (1) ́ Φ:χ →F ̣ Môt hà m phi tuyên ̣ có ánh xa vector x từ không gian X và o không gian Hilbert F ̣ ̣ Trong không gian F ta xây dưng môt hyperplan ̣ ̣ ̉ và đươc xác đinh bơi ( H ( w, ρ) : x, Φ x ) − ρ H ( w, ρ) ( 2) w là weight vector ρ thông số cho trước ́ ́ ̣ ̣ ̣ ̣ ̣ ̣ ̉ Biên đô cưc đai từ gôc đươc xác đinh bằng cách giai bà i toán ưu hóa bâc hai sau : 1 n Minimize w, w − (3) ∑ ξi υn i =1 subject to w, Φ( w) ≥ ρ − ξ ∀ξ i ≥ ( 4) HỌC VIÊN : TRẦN MINH THẾ - MSHV :i 90924006 MÔN MÔ HÌNH TÍNH TỐN VÀ MƠ PHỎNG ρ ̉ ́ ́ biên slack gồm những điêm nằm bên ngoà i hyperplan giữa gôc và hyperplan ̉ ̉ ̉ ́ υ ∈( 0,1) là thông số điều khiên sư chuyên đôi giữa khoang cách cưc đai từ gôc và ̣ ̣ ̣ ̉ ́ ̣ ̣ ̣ gồm hầu hêt các dữ liêu đươc tao từ hyperplan (α1 , α2 , , αn ) ̀ ̣ ̉ Cho gôm n nhân tư Lagrange không âm với các rà ng buôc, ta có bà i toán tương đương sau : α iα j Φ ( xi ) , Φ ( x j ) n subject to ≤ α i ≤ , ∑αi = υn i =1 Maximize Thay w là n ∑φ( x ) i i =1 với ≤ α i ≤ υn (5) (6 ) và hà m tương ứ ng là  n  f ( x j ) = sgn  ∑ α i Φ ( xi ) , Φ ( x j ) − ρ   i=1  (7) xi là vector đinh hướng dữ liêu cho ̣ ̣ là vector (SVs) với α i ≠ f ( xi ) ≤ ̣ và goi ̣ SVs đươc chia là m vector gồm : + Margin SVs f ( xi ) = + Non margin SVs f ( xi ) < Φ( xi ) Φ( x j ) đươc tao từ ̣ ̣ Mercer : ́ x i x j K là hà m đôi xứ ng thoa điều kiên ̣ ̉ K ( xi , x j ) = Φ( xi ), Φ( x j ) (8) ́ ̉ Hà m hyperplan không gian F trơ thà nh hà m phi tuyên không gian X  n  f ( x ) = sgn ∑ α i K ( xi , x ) − ρ   i=1  (9) ρ = ∑ α i K ( xi , x j ) n i =1 HỌC VIÊN : TRẦN MINH THẾ - MSHV : 90924006 MƠN MƠ HÌNH TÍNH TỐN VÀ MÔ PHỎNG 10 với ́ ̣ ̣ ̣ ̣ Có nhiều lưa chon châp nhân đươc cho hà m K ( xi , x j ) ̉ ́ ́ cách phô biên nhât là dù ng one-class SVMs là hà m Gaussian Radial Basic kernel ( RBF) K ( xi , x j ) = exp − xi − x j 2σ (10) ̉ σ là thông số điều khiên đô rông cua hà m kernel xung quanh ̣ ̣ ̉ Khi xi hàm kernel Dữ liệu F Φ( xi ), Φ( x j ) = K ( xi , x j ) = exp = nằm vùng bề mặt trung tâm hypersphere gốc X với bán kính hình vẽ Cuối cùng, định hàm phương trình (9) với ρ = ∑ α i K ( xi , x j ) n ≤α j ≤ với x j cho αi thỏa i =1 υn mà phụ thuộc vào đường biên vùng R không gian đầu vào siêu phẳng cắt xác định trọng lượng SVM kernels độ cao ρ 2.3 Cải thiên độ xác (Accuracy Improvement ) Độ xác phân loại one – class cải thiện theo cách nâng cao việc giải lại vector hỗ trợ vùng biên Một cách để đạt mục tiêu qua phép biến đổi bào giác (conformal transformation) kernel Cách tiếp cận mô tả nội dung binary SYMs classifier [2,3], nguyên tắc ứng dụng đến one-class SVMs Từ việc quan sát điểm hình học ánh xạ liệu nằm bề mặt S F với chiều giống không gian đầu vào X [6] Trong trường hợp hàm RBF kernel, bề mặt liên quan S F xem xét đa tạp Riemannian [5] số liệu Riemannian gây biểu theo dạng đóng điều kiện kernel [6,2,3] Một số liệu Riemannian, gọi tensor, hàm mà dùng để tính tốn khoảng cách đo dọc theo bề mặt S hai điểm nằm Nó xem thừa số phải đặt phía trước dxi X để tính khoảng cách ds thành phần dz F theo định lí Pytago ds = ∑ g ij dxi dx j (11) i, j Khi g ij số liệu tạo ra, bề mặt S parametrized xi Gọi x điểm X z ánh xạ tạo φ F Gọi dx đại diện hữu hạn chuyển Ta có : HỌC VIÊN : TRẦN MINH THẾ - MSHV : 90924006 MƠN MƠ HÌNH TÍNH TỐN VÀ MƠ PHỎNG ds = dz = Φ( x + dx ) − Φ( x ) 11 = K ( x + dx, x + dx ) − K ( x, x + dx ) + K ( x, x )  ∂K ( x, y )   dxi dx j = ∑   i , j  ∂xi ∂y j  y =x Từ phương trình (11) thấy liệu Riemannian S xác định :  ∂K ( x, y )   g ij =   ∂x ∂y  i j  y =x  (12) Lưu y làm để vùng xung quanh x X nhân rộng F qua ánh xạ Φ( x ) Quy tắc ánh xạ bảo giác làm tăng số liệu g ij xung quanh biên làm giảm nơi khác Để làm điều ánh xạ phi tuyến φ thay đổi theo cách g ij ( x) mở rộng quanh biên Điều làm phép biến đổi bảo giác kernel [2,3], ~ K ( x, y ) = c ( x )c ( y ) K ( x, y ) Với c(x) hàm xác định dương Kernel thay đổi thỏa mãn hàm Mercer điều kiện ~ dương [9] Từ phương trình 12 có số liệu Riemannian g ij ~ g ij = c( x ) g ij ( x) + ci ( x )c j ( x) + 2ci ( x )c ( x) K i ( x, x) (14) Với K i ( x, x ) = ∂K ( x, y ) / ∂xi | x =y ci ( x) = ∂c( x) / ∂xi Cho hàm Gaussian RBF kernel thời hạn cuối Mở rộng không gian để giải biên suppport vector c(x) chọn ~ lựa theo liệu g ij có giá trị lớn quanh biên Tuy nhiên, thực hành, khơng biết nơi biên, dự đốn ban đầu thực cách dùng one – class SVMs Một phép biến đổi bảo giác biến đổi c(x) : HỌC VIÊN : TRẦN MINH THẾ - MSHV : 90924006 MƠN MƠ HÌNH TÍNH TỐN VÀ MƠ PHỎNG 12 ^2 = x− xi ^ c( x ) = ∑ α i e 2τ ^ i∈ S V Với ^ SV tập vector hỗ trợ biên, ^ αi số dương biểu đóng góp vector hỗ trợ thứ i, x i vector hỗ trợ thứ i τ thông số bất kỳ; ^ • one-class SVM định hướng trước liệu 3.Ứng dụng để phát nhiễm trùng bệnh viện ( Application to Nosocomial Infection Detection ) Chúng ta kiểm tra hiệu suất của one – class SVMs với conformal kernel lĩnh vực y học, kiểm tra nhiễm trùng bệnh viện Một nhiễm trùng bệnh viện ( từ nosokomeion tiếng Hy Lạp có nghĩa bệnh viện ) lây nhiễm phát triển thời gian nằm bệnh viện, bị nhiễm thời gian ủ bệnh thời điểm nhập viện.Thông thường, bệnh nhân xem nhiễm trùng bệnh viện nhập viện sau 48 Đại học Y Geneve (HUG) thực việc nghiên cứu hàng năm để phát theo dõi nhiễm trùng bệnh viện kể từ năm 1994 [13].Phương pháp họ sau : nhà điều tra thăm viếng lần khám HUG khoảng thời gian xấp xỉ ba tuần Bao gồm tất người khám bệnh vòng 48 thời gian nghiên cứu Bệnh án, kardex, tia X báo cáo vi sinh xem lại thơng tin thêm có qua việc vấn y tá nhà phụ trách vật lí Biến lựa chọn bao gồm đặc điểm nhân học, ngày nhập viện, việc chuẩn đốn lúc nhập viện,tình trạng lúc nhập viện, comorbidities, điểm McCabe, xuất xứ, khu nhập viện, tình trạng, trước phẫu thuật, thời chăm sóc (ICU) tiếp xúc với thuốc kháng sinh, thuốc kháng acid thuốc ức chế miễn dịch thành phần xâm phạm, giá trị thí nghiệm, nhiệt độ, ngày nơi nhiễm bệnh, hoàn thành tiêu chuẩn nhiễm trùng HỌC VIÊN : TRẦN MINH THẾ - MSHV : 90924006 MƠN MƠ HÌNH TÍNH TỐN VÀ MƠ PHỎNG 13 Các liệu kết bao gồm 668 hồ sơ bệnh nhân 83 biến Với giúp đỡ chuyên gia bệnh viện nhiễm trùng bệnh viện, chọn lọc hồ sơ biến khơng thích hợp không cần thiết, giảm liệu cho 683 trường hợp 49 biến Đề tài khó khăn cố hữu liệu (như nhiều ứng dụng chẩn đoán y tế) lớp phân phối lệch cấp cao Trong số 683 bệnh nhân, có 75 (11% tổng số) bị nhiễm bệnh 608 không nhiễm bệnh Hồ sơ thử nghiệm tuyệt vời để đánh giá hiệu oneclass SVMs với hạt nhân bảo giác diện cân liệu (data imbalance) Thí nghiệm 4.1 Đánh giá chiến lược Mục tiêu thử nghiệm đánh giá tác động hạt nhân bảo giác khả one -class SVMs để đối phó với liệu cân (imbalanced datasets) Để tạo phân loại one -class SVMs sử dụng RBF kernel (Eq (10)) thử nghiệm với giá trị khác với thông số υ σ Khái quát lỗi ước tính cách sử dụng - lần qua xác nhận (10 - lần qua xác nhận, có kết số trường hợp xét nghiệm bị nhiễm lần) Các liệu hoàn chỉnh phân chia ngẫu nhiên thành năm tập Trong lần lặp, tập hợp ( bao gồm 20% số mẫu liệu) tổ chức tập kiểm tra, lại bốn tập hợp (80% liệu ) tạo thành tập định hướng Các tập định hướng bao gồm bệnh nhân không bị nhiễm bệnh, tập kiểm tra có hai bệnh nhân bị nhiễm không nhiễm bệnh theo phân loại ban đầu Lỗi ước tính tập thử nghiệm lấy trung bình năm lần lặp lại Các điều sau thực theo ánh xạ bảo giác : Thực one - class SVM với RBF kernel K để có SVs Sau thay đổi K kernel theo Eq.13, 15 ~ Thực one - class SVM với RBF kernel sửa đổi K Áp dụng hai bước (1 2.) biểu diễn tốt đạt Đối với Eq.15 chúng tơi lấy τ = σ / n giá trị tối ưu báo cáo [3] HỌC VIÊN : TRẦN MINH THẾ - MSHV : 90924006 MƠN MƠ HÌNH TÍNH TỐN VÀ MƠ PHỎNG 14 4.2 Kết Bảng tóm tắt kết thực cho one-class SVMs Nó cho thấy kết tốt thu cách phân loại đào tạo sử dụng cấu hình tham số khác trường hợp không bị nhiễm bệnh Ba cột cuối hiển thị kết dựa ba số liệu Độ xác (Accuracy) tỷ lệ phần trăm trường hợp phân loại đúng, nhạy cảm số dương tính tất trường hợp dương tính, đặc thù số âm tính tất trường hợp âm tính Rõ ràng, hai RBF hạt nhân bảo giác, độ nhạy cao đạt σ nhỏ : hệ thống Bảng 1: Biểu diễn one - class SVMs để thiết lập thông số khác sử dụng (1) RBF Gauss kernel (2) hạt nhân bảo giác One – class SVM RBF kernel Conformal kernel υ 0.05 0.05 0.2 0.2 0.05 0.05 0.2 0.2 σ 10 − 0.10 10 −4 0.10 10 −4 0.1 10 −4 0.06 Accuracy % Sensitivity 74.6 75.49 75.69 74.36 75.6 76.65 77.3 76.25 92.6 80.60 79.28 74.67 93.4 82.25 81.1 79.1 %Speccificity 43.73 65.60 68.27 72.27 43.15 64.1 69.7 69.2 Bảng 2: Biểu diễn tốt bốn phương pháp tiếp cận SVM đến class imbalance SVM Classifier Binary with symm.margin Binary with asymm.margin One-class with RBF kernel One-class with conformal kernel Accuracy 89.6% 74.4% 74.6% 75.6% Sensitivity 50.6% 92% 92.6% 93.4% Specificity 94.4% 72.2% 43.73% 43.15% đặt Gaussian có chiều rộng hẹp xung quanh điểm liệu hầu hết trường hợp thử nghiệm nhiễm trùng cách xác công nhận bất thường.Giá nhiều trường hợp khơng bị nhiễm bệnh có nhãn bất thường, suất thấp Giá trị lớn σ RBF kernel yêu cầu để đạt xấp xỉ chặt chẽ cho khu vực R (không bị nhiễm bệnh) Vì thơng số kernel σ quan trọng việc xác định cân bình thường bất thường khơng có rõ ràng lỗi dương việc phân HỌC VIÊN : TRẦN MINH THẾ - MSHV : 90924006 MÔN MƠ HÌNH TÍNH TỐN VÀ MƠ PHỎNG 15 loại one - class, trái với việc xây dựng lớp two class [7].Từ mục tiêu nghiên cứu để xác định trường hợp nhiễm bệnh, giải pháp giữ lại điều mà đạt độ nhạy tối đa Trong nghiên cứu trước liệu bệnh viện [7], chúng tơi điều tra thuật tốn support vector, lợi nhuận bất đối xứng điều chỉnh để nâng cao nhìn nhận trường hợp dương thấp Bảng so sánh biểu diễn phép đo tốt thu trước sau thí nghiệm Nhị phân classical SVMs với biên độ đối xứng, đạt đường sở với độ nhạy đến 50.6% ; với việc sử dụng biên độ bất đối xứng với độ nhạy tăng lên đến 92% Điều tiếp tục cải thiện one class SVMs với RBF kernel (92,6%) với hạt nhân bảo giác (93,4%) Tuy nhiên lưu ý điều có gia tăng độ nhạy với chi phí giảm tương ứng riêng biệt Kết luận công việc tương lai Chúng đề xuất one -clas SVMs với hạt nhân bảo giác để phân loại tiểu thuyết class imbalance Chúng phương pháp đạt độ nhạy cao tất mơ hình SVM trước áp dụng cho vấn đề Tuy nhiên, giá tốn thời hạn thiệt hại cụ thể cao, chuyên gia lĩnh vực phải định công nhận cao giá trị chi phí điều trị trường hợp dương tính sai Từ điểm xm xét này, bất đối xứngmargin SVMs chứng minh thích hợp chỗ chúng trì độ nhạy hợp lý - đặc trưng thương mại – hết Trong tương lai gần, chúng tơi dự định xác nhận mơ hình phân loại thu cách thực song song khảo sát tỷ lệ tiêu chuẩn Tổng quát cảm thấy one-class SVMs với hạt nhân bảo giác phương pháp tiếp cận đầy hứa hẹn cho phát nhiễm trùng bệnh viện trở thành thành phần đáng tin cậy hệ thống kiểm soát lây nhiễm Lời cảm ơn Các tác giả cảm ơn thành viên Bệnh viện Đại học Geneve - GS Một Geissbuhler D Pittet hỗ trợ Drs.H.Sax S Hugonnet cho liệu bị nhiễm trùng bệnh viện Tài liệu tham khảo K.Ali,S.Manganaris, and R.srikant Partial classification using association rules In Proc 3rd International Conference on Knowledge Discovery in Databases and Data Mining 1997 HỌC VIÊN : TRẦN MINH THẾ - MSHV : 90924006 MƠN MƠ HÌNH TÍNH TỐN VÀ MƠ PHỎNG 16 S Amari and S Wu Improving support vector machine classifiers by modifying kernel functions Neural Networks, 12(6) : 783-789,1999 S Amari and S Wu An information-geometrical method for improving the performance of support vector machine classifiers In ICANN99, pages 85-90,1999 C.Bishop.Novelty detection and neural network validation IEEE Proceeding on Vision, Image and Signal Processing, 141(4) : 217 – 222, 1994 W.M.Boothby An introduction to differential manifold and Riemannian geometry Academi Press, Orlando, 1986 C.Burges.Geometry and invariance in kernel based methods In MIT Press, editor, Adv in kernel methods : Support vector learning, 1999 G.Cohen, M Hilario, H Sax, and S.Hugonnet Asymmetrical margin approach to surveillance of nosocomial infections using support vector classification In Intelligent Data Analysis in Medicine and Pharmacology, 2003 C.Cortes and V.Vapnik Support vector networks Machine Learning, 20(3) : 273 – 297, September 1995 N.Cristianini and Taylor J.S An Introduction to Support Vector Machines.Cambridge University Press, 2000 10 P.Domingos A general method for making classifiers cost-sensitive In Proc.5th International Conference on Knowledge Discovery and Data Mining, pages 155164,1999 11 R.Fletcher Practical Methods of Optimization John Wiley and Sons,1987 12 G.G French, A.F Cheng, S.L.Wong, and S.Donnan Repeated prevalence surveys for monitoring effectiveness of hospital infection control Lancet, 2:1021 – 23, 1983 13 S.Harbarth, Ch Ruef, P.Francioli, A Widmer, D.Pittet, and Swiss-Noso Network Nosocomial infections in Swiss university hospitals : a multi – centre survey and review of the published experience Schweiz Med Wochenschr, 129 : 1521 – 28,1999 14 N.Japkowicz The class imbalance problem : A systematic study Intelligent Data Analysis Journal, 6(5), 2002 15 M.Kubat and S.Matwin Addressing the curse of imbalanced data sets : One-sides sampling In Proc of the Fourteeth International Conference on Machine Learning, pages 179 – 186,1997 16 B.Scholkopf, R.C.Williamson, A.J.Smola,J.Shawe-Taylor, and J.Platt.Estimating the support of a high- dimensional distribution In Neural Computation, volume 13, pages 1443- 1471.MIT Press , 1999 HỌC VIÊN : TRẦN MINH THẾ - MSHV : 90924006 MÔN MƠ HÌNH TÍNH TỐN VÀ MƠ PHỎNG 17 17 L.Tarassenko, P.Hayton, N.Cerneaz, and M.Brady.Novelty detection for the identification of masses in mammograms.In Proceedings of the 4th IEE International Conference on Artificial Neural Networks (ICANN’95), pages 442-447,1995 18 V.Vapnik.Statistical Learning Theory.Wiley,1998 HỌC VIÊN : TRẦN MINH THẾ - MSHV : 90924006 ... phương pháp tiếp cận SVM đến class imbalance SVM Classifier Binary with symm.margin Binary with asymm.margin One- class with RBF kernel One- class with conformal kernel Accuracy 89.6% 74.4% 74.6% 75.6%... liệu (The Imbalanced Data Problem) ̉ ̣ ̉ Sư dung hạt nhân bao giác (Conformal Kernels) One- Class SVMs 2.1 Phương pháp One- Class Classification 2.2 Phương pháp One- Class Support Vector Machines 2.3... Asymmetrical margin approach to surveillance of nosocomial infections using support vector classification In Intelligent Data Analysis in Medicine and Pharmacology, 2003 C.Cortes and V.Vapnik Support vector

Định dạng
Số trang	16
Dung lượng	499 KB