Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 40 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
40
Dung lượng
2,3 MB
Nội dung
ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA HOÀNG THỊ MINH HUYỀN PHÂN TÍCH DÁNG ĐI CHỐNG ĐAU SỬ DỤNG MÁY VÉC TƠ HỖ TRỢ Chuyên ngành : Khoa học máy tính Mã số : 8480101 LUẬN VĂN THẠC SĨ KỸ THUẬT Người hướng dẫn khoa học: TS HUỲNH HỮU HƯNG Đà Nẵng - Năm 2018 LỜI CAM ĐOAN Tơi xin cam đoan cơng trình nghiên cứu riêng hướng dẫn trực tiếp TS Huỳnh Hữu Hưng Mọi tham khảo dùng luận văn trích dẫn rõ ràng tên tác giả, tên cơng trình, thời gian, địa điểm cơng bố Mọi chép không hợp lệ, vi phạm quy chế đào tạo, hay gian trá, tơi xin chịu hồn tồn trách nhiệm Tác giả Hoàng Thị Minh Huyền MỤC LỤC TRANG BÌA LỜI CAM ĐOAN MỤC LỤC TRANG TĨM TẮT LUẬN VĂN DANH MỤC CÁC TỪ VIẾT TẮT DANH MỤC CÁC BẢNG DANH MỤC CÁC HÌNH MỞ ĐẦU .1 Lý chọn đề tài Mục tiêu nghiên cứu Đối tượng phạm vi nghiên cứu .2 Phương pháp nghiên cứu .2 Ý nghĩa khoa học thực tiễn đề tài .3 Cấu trúc luận văn .3 CHƯƠNG DÁNG ĐI CHỐNG ĐAU 1.1 CÁC GIAI ĐOẠN TRONG DÁNG ĐI Ở NGƯỜI 1.1.1 Giai đoạn tựa (chống) 1.1.2 Giai đoạn đu đưa 1.2 CÁC THAY ĐỔI DÁNG ĐI TRÊN LÂM SÀNG 1.3 DÁNG ĐI CHỐNG ĐAU 1.3.1 Định nghĩa dáng chống đau 1.3.2 Nguyên nhân 1.3.3 Các triệu chứng dáng chống đau 1.3.4 Cách chẩn đoán bệnh 10 1.4 TỔNG KẾT CHƯƠNG .12 CHƯƠNG TỔNG QUAN VỀ PHÂN TÍCH DÁNG ĐI 13 2.1 PHÂN TÍCH DÁNG ĐI 13 2.1.1 Sử dụng cảm biến .13 2.1.2 Sử dụng liệu thu từ camera 14 2.2 TRÍCH ĐẶC TRƯNG 17 2.2.1 Thuộc tính số 18 2.2.2 Thuộc tính nhị phân 20 2.3 CÁC PHƯƠNG PHÁP PHÂN TÍCH DÁNG ĐI 21 2.3.1 Phương pháp dựa vào đặc trưng 21 2.3.2 Phương pháp dựa vào mơ hình 22 2.4 TỔNG KẾT CHƯƠNG .29 CHƯƠNG PHÂN TÍCH DÁNG ĐI CHỐNG ĐAU SỬ DỤNG MÁY VÉC TƠ HỖ TRỢ 30 3.1 TỔNG QUAN VỀ HỆ THỐNG .30 3.2 XÂY DỰNG DỮ LIỆU 31 3.2.1 Phần mềm thiết kế 3D MakeHuman 31 3.2.2 Phần mềm Blender 32 3.3 TRÍCH ĐẶC TRƯNG HOG 34 3.4 HUẤN LUYỆN 38 3.4.1 Bài toán phân lớp 38 3.4.2 Xây dựng mơ hình phân lớp sử dụng SVM để nhận dạng dáng 39 3.4.3 Phát dáng chống đau .39 3.5 KẾT QUẢ THỰC NGHIỆM 39 3.5.1 Dữ liệu thử nghiệm .39 3.5.2 Quá trình thực nghiệm 41 3.5.3 Kết thử nghiệm 44 3.6 TỔNG KẾT CHƯƠNG .44 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 45 TÀI LIỆU THAM KHẢO 46 QUYẾT Đ NH GIAO ĐỀ TÀI LUẬN VĂN THẠC SĨ (BẢN SAO) BẢN SAO KẾT LUẬN CỦA HỘI ĐỒNG, BẢN SAO NHẬN XÉT CỦA CÁC PHẢN BIỆN TRANG TĨM TẮT LUẬN VĂN PHÂN TÍCH DÁNG ĐI CHỐNG ĐAU SỬ DỤNG MÁY VÉC TƠ HỖ TRỢ Học viên: Hoàng Thị Minh Huyền Chuyên ngành: Khoa học máy tính Mã số: 84800101 Khóa: K34.KMT.QB Trường Đại học Bách khoa - ĐH Đà Nẵng Tóm tắt: Ngày nay, nghiên cứu lĩnh vực thị giác máy tính hỗ trợ nhiều cho công tác y tế, đặc biệt ứng dụng phân tích dáng để chẩn đốn phát bệnh tiềm ẩn liên quan đến khung xương Trong luận văn đề xuất giải pháp phân tích dáng chống đau bệnh nhân bị bệnh xương khớp sử dụng máy véc tơ hỗ trợ Quá trình xử lý bao gồm bước: (1) xây dựng liệu; (2) trích đặc trưng HoG; (3) huấn luyện liệu đặc trưng thu mơ hình liệu phân lớp; (4) tiến hành nhận dạng để đưa kết luận Từ khóa –Thị giác máy tính, phân tích dáng đi, dáng chống đau, đặc trưng HOG, học máy vectơ hỗ trợ GAIT ANTI PAIN ANALYSIS USE SUPPORT VECTOR MACHINE Abstract: Nowaday, researchs in computer vison a lot of support for medical work, especially the gait analysis application to diagnose and detect underlying diseases associated with the skeleton In this essay proposed solutions gait anti pain analysis of osteoarthritis patients use support vecto machine The process consists of steps: (1) building data; (2) selective features HoG; (3) Characteristic data training and obtained stratified data model; (4) Conduct the identification to make conclusions Keywords– Computer vision, gait analysis, antalgic gait, HOG features, support vector machine (SVM) DANH MỤC CÁC TỪ VIẾT TẮT 2D Two Dimension 3D Three Dimension AMI Accumulated Motion Image HOG Histogram of Oriented Gradients LDA Linear Discriminant Analysis MLP Multilinear Principal Components MMH Maximum Marginal Hyperland MII Motion Intensity Image NB Naïve Bayes SVM Support Vector Machine DANH MỤC CÁC BẢNG Bảng 2.1 Tổng hợp đặc trưng dáng nghiên cứu[43] 21 Bảng 2.2 Tỷ lệ phân loại sử dụng liệu từ tính chụp khơng đánh dấu .23 Bảng 3.1 Số khung hình lấy từ nhân vật 40 Bảng 3.2 Kết nhận dạng dáng .44 DANH MỤC CÁC HÌNH Hình 1.1 Chu kỳ dáng gồm giai đoạn .4 Hình 1.2 Mơ tả khung xương chân cho giai đoạn chống Hình 1.3 Mơ tả khung xương chân cho giai đoạn đu đưa Hình 1.4 Chuỗi hình minh họa dáng chống đau Hình 1.5 Khớp bình thường viêm xương khớp 11 Hình 2.1 Hình ảnh thảm cảm biến sàn nhà .13 Hình 2.2 Hình chiếu đặc trưng sử dụng nghiên cứu 14 Hình 2.3 Hệ thống giám sát hành vi té ngã 15 Hình 2.4 Camera Kinect hệ thống máy tính thử nghiệm 15 Hình 2.5 Định vị khơng đánh dấu (markerless) nhiều góc quay khác 16 Hình 2.6 Hình ảnh thu nghiên cứu .17 Hình 2.7 Một ví dụ MII, với dịng chuỗi ảnh đầu vào, chuỗi hình chiếu đối tượng trước sau canh giữa, cuối MII .18 Hình 2.8 Ví dụ ảnh chuyển động tích lũy 19 Hình 2.9 Ví dụ hai đối tượng thực hành động với vẻ bên ngồi khác có thuộc tính đồng 19 Hình 2.10 Các vectơ hướng tương ứng với luồng quang học 20 Hình 2.11 Một số đặc trưng quan hệ hình học .20 Hình 2.12 Đường nét liền hình đường phân chia tập liệu gồm hai thuộc tính.24 Hình 2.13 Một liệu hai chiều phân chia tuyến tính Có vơ hạn đường thẳng phân chia tuyến tính 25 Hình 2.14 Hai siêu phẳng phân chia tuyến tính với biên độ Cái có biên độ lớn phân loại xác 26 Hình 2.15 Minh họa đường biểu diễn H1, H2 support vectors 27 Hình 2.16 Minh họa chức kernel SVM 29 Hình 3.1 Giải pháp đề xuất 31 Hình 3.2 Giao diện cơng cụ MakeHuman 32 Hình 3.3 Giao diện phần mềm Blender 33 Hình 3.4 Dữ liệu dáng chống đau 33 Hình 3.5 Ảnh đầu vào HoG .35 Hình 3.6 Chia khối trích đặc trưng HOG .36 Hình 3.7 Các bước rút trích đặc trưng HOG 37 Hình 3.8 Chuỗi ảnh thể dáng bình thường chống đau 40 Hình 3.9 Giao diện làm việc nhân vật mặc định 41 Hình 3.10 Nhân vật sau chỉnh sửa 41 Hình 3.11 Thêm khung xương cho nhân vật 42 Hình 3.12 Giao diện ban đầu Blender .42 Hình 3.13 Nhân vật import vào Blender .43 Hình 3.14 Minh họa kết nhận dạng 43 MỞ ĐẦU Lý chọn đề tài Các phương pháp sinh trắc học để nhận diện người dựa đặc điểm sinh lý/hành vi đối tượng nhận dạng khn mặt, giọng nói, mống mắt, vân tay, hình dạng tay dáng đi, đóng vai trị ngày quan trọng việc nhận dạng người dựa tính phổ biến độc đáo chúng Y học đại cho rằng: dáng người khỏe mạnh có biểu khác tùy theo tuổi tác, tình trạng sức khỏe Ví dụ tuổi tác, trẻ em thích gấp chạy chầm chậm, niên khỏe mạnh nhanh mạnh mẽ, người già thường chậm với bước nhỏ Tuy nhiên, người mắc số bệnh làm cho dáng thay đổi lớn có tính đặc trưng định Theo chun gia y tế, bệnh xương khớp chiếm tới ⅓ dân số giới Tỉ lệ người 55 tuổi bị bệnh lên tới 80% Tại Việt Nam, có khoảng 7% dân số gặp phải vấn đề xương khớp, tương đương với khoảng triệu người Nếu diễn biến theo tình hình đến năm 2020, số 10 triệu người Tại bệnh viện lớn, ngày có hàng trăm bệnh nhân tới khám tái khám bệnh xương khớp, có tới phân nửa phải nhập viện điều trị.Trước đây, xương khớp chủ yếu gặp người cao tuổi, nhiên nay, có tới 30% người 35 tuổi bị bệnh, tỉ lệ có dấu hiệu gia tăng [18] Bệnh lý xương khớp vấn đề sức khỏe giới quan tâm, quy mơ lớn hệ nghiêm trọng bệnh cộng đồng Bệnh dẫn đến tử vong không biểu nguy kịch bệnh tim mạch, hô hấp, ung thư… tần suất bệnh cao nhất, đồng thời nguyên nhân gây đau, chức vận động giảm chất lượng sống Ngày nay, nghiên cứu lĩnh vực thị giác máy tính hỗ trợ nhiều cho công tác y tế, đặc biệt nghiên cứu phân tích dáng giúp quan sát bệnh nhân phát sớm số bệnh tật Ứng dụng phân tích dáng lĩnh vực y tế triển khai từ sớm để chẩn đoán phát bệnh tiềm ẩn liên quan đến khung xương [16] Trong phương pháp học máy, SVM phương pháp hiệu cho tốn phân lớp liệu Nó cơng cụ đắc lực cho toán xử lý ảnh, phân loại văn bản, phân tích quan điểm SVM thể nhiều ưu điểm, như: tính tốn hiệu tập liệu lớn, tiết kiệm nhớ Một yếu tố làm nên hiệu 17 thường, bước nhỏ vàđúng 95.6%khi mặc váy dài Với trường hợp phía trước máy quay, kết đạt 93.4% Hình 2.6.Hình ảnh thu nghiên cứu So với việc sử dụng cảm biến, việc sử dụng liệu thu từ camera có ưu điểm không vướng thiết bị,độ phân giải camera ngày cao nên chất lượng hình ảnh tốt hơn, thơng thường camera không cần điều kiện đặc biệt cảnh chiếu sáng, giá thành camera khơng cao, lắp cố định địa điểm để quan sát nhiều người, có khả tích hợp vào hệ thống camera giám sát có Ở[32]đưa hướng tiếp cận là: thực việc phân tích dáng tập liệu ảnh thu camera Ý tưởng đưa mơ hình hóa dáng phân tích dựa chu kỳ bước chân.Các bước hướng tiếp cận trình bày phần 2.2 TRÍCH ĐẶC TRƯNG Có nhiều mơ tả thuộc tính khác đề xuất, phân loại thuộc tính theo nhiều cách khác nhau, dựa theo tiêu chí khác như: - Thuộc tính 2D trích từ ảnh 2D; - Thuộc tính 3D thuộc tính 2D có thêm thông tin độ sâu cảnh quay; - Thuộc tính khơng gian thuộc tính quan tâm đến đối tượng khung hình; - Thuộc tính thời gian thuộc tính có quan tâm đến chuyển động đối tượng từ khung hình đến khung hình tiếp theo; - Thuộc tính địa phương thuộc tính xét đến số vùng (patch) đặc biệt khung hình; - Thuộc tính tồn cục xem xét tồn khung hình; 18 Những thuộc tính chia thành 02 nhóm thuộc tính số thuộc tính nhị phân 2.2.1 Thuộc tính số Các đặc trưng biểu diễn dạng giá trị liên tục, phần lớn trích xuất dựa thơng tin hai chiều chuỗi ảnh Có hai nhóm phương pháp mơ tả đặc trưng số: dựa hình dạng dựa vectơ hướng chuyển động Các giải pháp nhóm trích xuất hình chiếu đối tượng chuyển động nhận dạng hành vi dựa việc phân tích liệu thu [11] [25] Nghiên cứu biểu diễn hành động ảnh đơn gọi ảnh cường độ chuyển động (MII) Ảnh tạo cách canh hình chiếu đối tượng ảnh nhị phân (kết phép trừ nền) theo điểm tham chiếu cố định, từ chuyển động thu hẹp vào khu vực có giới hạn Ưu điểm MII đơn giản, độ hiệu mạnh mẽ thực ảnh chứa nhiễu Hình 2.7 Một ví dụ MII, với dịng chuỗi ảnh đầu vào, chuỗi hình chiếu đối tượng trước sau canh giữa, cuối MII Ở [25], nhà nghiên cứu sử dụng ảnh chuyển động tích lũy (AMI) để biểu diễn chuyển động chuỗi ảnh, tính trung bình độ sai lệch cặp ảnh liên tiếp chuỗi Để đảm bảo tính mạnh mẽ đặc trưng, ảnh AMI biến đổi kích thước thành ảnh kích thước N x N ma trận xếp hạng tạo dựa thứ hạng giá trị ảnh Một ví dụ minh họa hai ảnh khác có giá trị ma trận xếp hạng trình bày hình 2.9 19 Hình 2.8 Ví dụ ảnh chuyển động tích lũy Hình 2.9.Ví dụ hai đối tượng thực hành động với vẻ bên khác có thuộc tính đồng Các giải pháp sử dụng vectơ hướng thường ước lượng hướng biến đổi cường độ điểm ảnh hai khung hình liên tiếp (thường gọi luồng quang học), sử dụng thông tin hướng cho việc nhận dạng hành động [1] [9][13] [41] Nghiên cứu tiên phong hướng tiếp cận đề xuất [13] với tập liệu ảnh thu từ khoảng cách xác định Trong [9], tác giả trình bày 20 thuật toán nhận dạng hành động dựa luồng quang học thông tin phần thể Hình 2.10.Các vectơ hướng tương ứng với luồng quang học 2.2.2 Thuộc tính nhị phân Các đặc trưng sử dụng giá trị để thể mối quan hệ hình học điểm định tư người Nghiên cứu [29]giới thiệu tập quan hệ dùng để kiểm tra điểm cụ thể thuộc đối tượng nằm trước hay sau, bên trái hay phải mặt phẳng xác định, tư cong hay thẳng phần thể, liên kết hai điểm đối tượng có tồn hay không Một số quan hệ minh họa hình 2.11, ví dụ góc đùi cẳng chân sử dụng để xác định chân co hay duỗi, giá trị đặc trưng tương ứng (co) góc nêu nhỏ 120°, (duỗi) góc có giá trị từ 120° trở lên[36] Một đặc trưng mô tả hiệu thông tin tư chuyển động đối tượng Hình 2.11.Một số đặc trưng quan hệ hình học 21 2.3 CÁC PHƯƠNG PHÁP PHÂN TÍCH DÁNG ĐI Về bản, có hai phương pháp phân tích dáng đi: dựa vào đặc trưng dựa vào mơ hình 2.3.1 Phương pháp dựa vào đặc trưng Trong phương pháp phân tích dựa vào đặc trưng, đặc trưng trích xuất sử dụng để biểu diễn cho dáng Tùy thuộc vào mục đích phân tích dáng mà đặc trưng khác dáng sử dụng Nghiên cứu [43]đã tổng hợp đặc trưng dáng thường dùng lĩnh vực y tế, thể thao nhận dạng bảng sau: Bảng 2.1 Tổng hợp đặc trưng dáng nghiên cứu[43] Đặc trưng Y học Thể thao Nhận dạng Vận tốc sải chân Chiều dài bước chân Chiều dài sải chân Chiều rộng bước chân Góc bước Nhịp bước Thời gian bước Thời gian dừng lại Góc khớp Tư thể (độ nghiêng, đối xứng) Lực Đà Phản lực Chiều cao tích lũy Giai đoạn dáng 22 Hiện nay, lĩnh vực phân tích dáng phục vụ việc nhận dạng, phân tích hành vi té ngã phân loại, có nhiều đặc trưng khác nhà nghiên cứu sử dụng Trong nghiên cứu dựa vào liệu từ video, hình chiếu đối tượng đặc điểm thường sử dụng Ở [4] hình chiếu nhị phân đối tượng phủ hình chữ nhật để nhận dạng người Trong [39]một phần hình chiếu người sử dụng để nhận dạng dáng Khi nghiên cứu phát hành vi té ngã, tác giả [10]dựa vào đặc trưng thay đổi góc nghiêng người Một người đứng có góc trục dài elip khung bao sàn nhà gần 900 Do đó, khoảng thời gian ngắn cố định, việc góc nghiêng thay đổi gần 900 so với thể ban đầu dấu hiệu hành vi té ngã Cũng nghiên cứu này, tỷ lệ cạnh chiều rộng so với chiều cao khung bao xét đến Tỷ lệ cạnh thấp thể người tư đứng, tỷ lệ cạnh thay đổi thành cao thể hành vi ngã Dựa liệu chuyển động, nhiều tính thể lựa chọn hơn.Trong nghiên cứu [15]các tác giả sử dụng đặc trưng chiều dài thân, chiều dài cánh tay, chiều dài đùi, chiều dài bắp chân, chiều dài chân để nhận dạng dáng Chiều cao thể, chiều dài chân, nhịp bước, chiều rộng xương chậu, vận tốc, chiều rộng bước, chiều dài sải chân, khớp hông khớp gối nhà nghiên cứu khoa học dùng để phân loại giới tính Hàn Quốc[8] Khung xương sử dụng rộng rãi nghiên cứu nhiều đề tài 2.3.2 Phương pháp dựa vào mơ hình Các phương pháp phân tích dáng dựa mơ hình sử dụng mơ hình tốn học để biểu diễn phân tích dáng máy vector hỗ trợ, mơ hình Markov ẩn, mạng nơron… Máy vector hỗ trợ thuật toán học máy tiếng sử dụng để giải toán phân lớp Thuật tốn SVM ban đầu tìm Vladimir N Vapnik dạng chuẩn sử dụng lề mềm tìm Vapnik Corinna Cortes năm 1995, phương pháp phân loại dựa lý thuyết học thống kê hàm hạt nhân[44] SVM áp dụng thành công việc giải vấn đề giới thực nhận dạng văn bản, hình ảnh, chữ viết tay… SVM ban đầu thiết kế cho việc phân loại nhị phân (hai lớp), sau mở rộng để thực việc phân loại đa lớp SVM hai lớp ứng dụng nhiệu việc nhận dạng đối tượng, ảnh chia thành hai lớp, lớp chứa đối tượng lớp đối tượng Nhiều thử nghiệm ứng dụng khác cho thấy SVM phương pháp phân loại có độ xác cao tương đối tổng quát cho tốn nhận dạng Đó lí luận văn lựa chọn phương pháp SVM để huấn luyện nhận dạng 23 liệu Sau luận văn xin đưa số số thông kê để minh họa cho điều khẳng định phương pháp SVM Trong nghiên cứu nhận dạng dáng 3D [6], tác giả trình bày thuật tốn độc lập để nhận dạng dáng người không gian chiều – 3D Bằng cách sử dụng liệu chuyển động thu thuật toán theo dõi chuyển động 3D không dấu để xác định dáng người Nhóm tác giả theo dõi lại độ xác liệu thu từ hệ thống chụp chuyển động dựa điểm đánh dấu Bộ phân lớp SVM sử dụng để phân loại mô tả chuyển động khơng gian Thí nghiệm thực 22 người cách thực 230 chu kỳ bước Bảng 2.2 sau đánh giá hiệu suất thuật toán đề xuất nhận dạng dáng bao gồm Naïve Bayes (NB), cảm ứng đa lớp (MLP_ Multilinear Principal Components) SVM Tỷ lệ phân loại xác đạt SVM 93,5% lần thứ 99,6% lần thứ Bảng 2.2 Tỷ lệ phân loại sử dụng liệu từ tính chụp không đánh dấu [42] Các tác giả [5] sử dụng SVM với mục đích nhận dạng tự động loại dáng hai nhóm người: trẻ tuổi lớn tuổi từ mơ hình dáng tương ứng Nghiên cứu sử dụng hệ thống phân tích chuyển động PEAK-2D để phân tích liệu khoảng cách tối thiểu bàn chân Khi 30 người trẻ tuổi 28 người lớn tuổi tiến hành thử nghiệm liên tục với tốc độ tự chọn 20 phút máy chạy bộ, mẫu dáng trích xuất khoảng cách tối thiểu bàn chân sử dụng để huấn luyện SVM Kết kiểm tra cho biết hiệu suất tổng quát để nhận dạng dáng người trẻ người già phương pháp SVM trung bình 83.3% ( so với kết xác 75.0% ( dùng phương pháp mạng nơron để nhận dạng tập liệu Phần tiếp theo, luận văn trình bày mơ hình phân tích dáng SVM, mơ hình luận văn sử dụng trình huấn luyện nhận dạng Trước tiên luận 24 văn giới thiệu khái niệm bản: siêu phẳng phân chia tuyến tính, support vectors,… a) Các khái niệm - Siêu phẳng phân cách ( Cho trước tập liệu D gồm ( ( | | | | Trong tập huấn luyện tương ứng với nhãn lớp Mỗi nhận { } Phương pháp phân lớp hai giá trị +1 -1 ( SVM tìm đường phân lớp “tốt nhất” để phân chia tập liệu thành lớp tách biệt với Theo [35], phương trình tổng quát đường phân chia biểu diễn dạng sau: W X + b = (2.1) Trong đó: + W: Véc tơ trọng số, { }; + N: Số thuộc tính (hay cịn gọi số chiều liệu); + b: Một đại lượng vô hướng, thường xem độ nghiêng (bias) Đối với trường hợp liệu hai chiều (hai thuộc tính) phương trình biểu diễn đường thẳng phân chia Nếu liệu ba chiều đường phân chia hai tập mặt phẳng phân cách Tổng quát cho liệu n chiều phân cách siêu phẳng Chúng ta sử dụng thuật ngữ “siêu phẳng” (hyperplane) để đến ranh giới định mà muốn tìm kiếm bất chấp số lượng thuộc tính Hình 2.12 Đường nét liền hình đường phân chia tập liệu gồm hai thuộc tính 25 Tuy nhiên thực tế ta tìm vơ số siêu phẳng phân chia tập liệu Và muốn tìm siêu phẳng phân chia cho tốt nhất, có nghĩa có sai sót phân loại bé liệu Hình 2.13.Một liệu hai chiều phân chia tuyến tính Có vơ hạn đường thẳng phân chia tuyến tính Do mục tiêu phương pháp phân loại SVM tìm siêu phẳng phân cách hai lớp cho khoảng cách lề (margin) hai lớp đạt cực đại Siêu phẳng có biên độ lớn (maximum marginal hyperland) chọn siêu phẳng phân chia liệu cách tốt Trong hình bên dưới, ta thấy có hai siêu phẳng phân chia biên độ Trước định nghĩa biên độ (margin), nhìn vào nhìn cách trực quan Cả hai siêu phẳng phân tách tất liệu cho trước Một cách trực quan, siêu phẳng với biên độ lớn xác việc phân loại liệu tương lai so với siêu phẳng có biên độ nhỏ Điều lý giải suốt giai đoạn học hay huấn luyện, SVM tìm siêu phẳng có biên độ lớn nhất, gọi MMH (Maximum Marginal Hyperland) Siêu phẳng có biên độ lớn siêu phẳng có khoảng cách từ tới hai mặt bên (mặt bên song song với siêu phẳng) Khoảng cách thật khoảng cách ngắn từ MMH tới liệu huấn luyện gàn lớp Siêu phẳng có biên độ lớn cho phân loại tốt lớp 26 Hình 2.14.Hai siêu phẳng phân chia tuyến tính với biên độ Cái có biên độ lớn phân loại xác Siêu phẳng phân cách có vai trị quan trọng việc phân lớp, định xem liệu thuộc lớp Để thực phân lớp, SVM cần xác định xem liệu nằm phía siêu phẳng phân cách ( ( (2.2) + D(x) < 0: liệu nằm phía siêu phẳng phân cách; + D(x) = 0: Bộ liệu nằm siêu phẳng phân cách; + D(x) > 0: Bộ liệu nằm phía siêu phẳng phân cách - Support vectors Với liệu huấn luyện có hai thuộc tính A1 A2 : X={x1, x2}, với x1, x2 giá trị thuộc tính A1, A2 W={w1, w2} Phương trình siêu phẳng W X + b = viết lại : w0 +w1 x1 +w2 x2 = (2.3) Trong đó:w0 tương đương với số b phương trình tổng quát siêu phẳng Vì điểm nằm siêu phẳng phân cách thỏa mãn: w0 +w1 x1 +w2 x2> (2.4) Tương tự, điểm nằm siêu phẳng phân cách phải thỏa mãn: w0 +w1 x1 +w2 x2< (2.5) Bằng cách điều chỉnh trọng số w0 ta có: H1: w0 +w1 x1 +w2 x2>= với yi = +1 H2: w0 +w1 x1 +w2 x2