Huấn luyện mạng NN và máy vectơ hỗ trợ SVM

Một phần của tài liệu Nghiên cứu, phát triển giải pháp hỗ trợ phát hiện các dấu hiệu tổn thương hình khối trên ảnh chụp Xquang vú (Trang 112)

4.4.2.1. Huấn luyện mạng NN

Kiến trúc mạng NN được sử dụng là mạng MLP 2 lớp. Số đầu vào Ni bằng với số lượng đặc trưng. Với mục đích phân loại một vùng nghi ngờ thành vùng chứa tổn thương hình khối hoặc vùng mô bình thương nên số node trong lớp đầu ra No=1. Số node trong lớp ẩn có thể thay đổi trong khoảng [Ni-1, 2Ni+1] để đảm bảo đạt được hiệu quả phân loại tốt nhất. Hàm kích hoạt dạng sigma ( ) 1/ (1f x  ex) với β=1.

Mạng được huấn luyện theo luật học giảm gradient. Theo đó biến thiên trọng số liên kết ω tại vòng lặp thứ τ được cho bởi

( ) ( ) ) 1 ( E        với ( ) 1 ( )2 2

E   ty là sai số tại đầu ra của mạng, α được gọi là môment, thể hiện độ quán tính được thêm vào nhằm mục đích tăng tốc độ học của mạng, từ đó sẽ giảm thời gian tính toán. Giá trị α nằm trong khoảng 0.10.2 sẽ thỏa mãn được cả yêu cầu về hiệu suất lẫn thời gian tính toán. Tốc độ học η chọn bằng 0,01.

Dữ liệu các vectơ đặc trưng của 2702 vùng nghi ngờ (86 vùng TP-ROI và 2616 vùng FP-ROI) được chia thành 2 phần bằng nhau. Hai phần này lần lượt được dùng để huấn luyện và kiểm tra mạng. Số vectơ đặc trưng của vùng TP-ROI cũng như của vùng FP-ROI là bằng nhau trong 2 phần để đảm bảo mạng NN được huấn luyện và kiểm tra một cách toàn diện và chính xác nhất.

4.4.2.2. Huấn luyện máy vectơ hỗ trợ SVM

Do dữ liệu đặc trưng thường không phải là tuyến tính tách được nên SVM được sử dụng ở đây là SVM phi tuyến. Hàm gốc xuyên tâm RBF (phương trình 4.42) đư ợc dùng để ánh xạ không gian đặc trưng ban đầu về một không gian mới.

Hai thông số C (phương trình 4.39) và γ (phương trình 4.42) ph ải được chọn một cách phù hợp. Việc lựa chọn C sẽ ảnh hưởng đến độ chính xác phân loại. Nếu C quá lớn thì độ chính xác phân loại là rất lớn khi huấn luyện nhưng lại rất bé khi kiểm tra. Nếu C quá nhỏ thì độ chính xác phân loại không thỏa mãn yêu cầu đặt ra. Hệ số γ ảnh hưởng đến phân bố trong không gian đặc trưng mới. Do đó nó sẽ có tác động mạnh hơn tới độ chính xác phân loại so với C. γ quá lớn có thể gây ra quá ăn khớp hay học quá (over-fitting). Ngược lại, γ quá nhỏ không tương xứng thì gây ra dưới ăn khớp (under-fitting).

Để huấn luyện máy vectơ hỗ trợ SVM, tập dữ liệu đặc trưng gồm 2702 vectơ đặc trưng ban đầu được chia thành 10 phần bằng nhau. Với từng lần trong số 10 lần chia, i phần được dùng để kiểm tra mô hình SVM được huấn luyện bởi (10-i) phần còn lại. Tỷ lệ giữa tập huấn luyện và tập kiểm tra sẽ là (10-i):i. Giá trị i thay đổi từ 1 tới 9. Việc thay đổi

giá trị nhằm 2 mục đích. Một là để có thể đánh giá được hiệu quả phân loại ở các mức độ khó khác nhau. Thứ hai là có thể so sánh được với các phương pháp phân loại đã có.

Giá trị C và γ tối ưu được xác định như sau

+ Xét không gian (C,γ) với log2C∈{-5,-3...15}, log2γ∈{-15,-13...3}

+ Thực hiện xác nhận chéo 10 phần trên (10-i) phần dữ liệu để huấn luyện. Xác định cặp giá trị (C,γ) thô tốt nhất

+ Tìm kiếm tinh xung quanh cặp giá trị (C,γ) thô vừa tìm được

+ Xác nhận chéo 10 phần trên (10-i) phần dữ liệu để huấn luyện. Xác định cặp giá trị (C,γ) tinh tốt nhất.

Một phần của tài liệu Nghiên cứu, phát triển giải pháp hỗ trợ phát hiện các dấu hiệu tổn thương hình khối trên ảnh chụp Xquang vú (Trang 112)

Tải bản đầy đủ (PDF)

(139 trang)