1. Trang chủ
  2. » Luận Văn - Báo Cáo

Nghiên cứu phân lớp dữ liệu dựa trên máy vector hỗ trợ và ứng dụng (tóm tắt luận văn )

67 35 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 67
Dung lượng 1,64 MB

Nội dung

HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - NGUYỄN VĂN ĐỨC NGHIÊN CỨU PHÂN LỚP DỮ LIỆU DỰA TRÊN MÁY VECTOR HỖ TRỢ VÀ ỨNG DỤNG LUẬN VĂN THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) HÀ NỘI - 2017 HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - NGUYỄN VĂN ĐỨC NGHIÊN CỨU PHÂN LỚP DỮ LIỆU DỰA TRÊN MÁY VECTOR HỖ TRỢ VÀ ỨNG DỤNG CHUYÊN NGÀNH : KHOA HỌC MÁY TÍNH MÃ SỐ: 60.48.01.01 LUẬN VĂN THẠC SĨ KỸ THUẬT (Theo định hướng ứng dụng) NGƯỜI HƯỚNG DẪN KHOA HỌC: TS VŨ VĂN THỎA HÀ NỘI - 2017 i LỜI CAM ĐOAN Tôi cam đoan cơng trình nghiên cứu riêng tơi Các số liệu, kết nêu luận văn trung thực chưa công bố cơng trình TÁC GIẢ Nguyễn Văn Đức ii LỜI CẢM ƠN Em xin bày tỏ lịng kính trọng biết ơn sâu sắc đến TS Vũ Văn Thỏa, người thầy trực tiếp hướng dẫn tận tình bảo em suốt thời gian làm luận văn tốt nghiệp Ngoài kiến thức thầy truyền đạt, em học thầy phong cách làm việc khoa học, nghiêm túc đầy trách nhiệm Em xin chân thành cảm ơn toàn thể thầy giáo, giáo Học viện Cơng nghệ Bưu Viễn thơng tận tình bảo em suốt thời gian học tập trường Cuối cùng, em xin gửi lời cảm ơn tới gia đình, bạn bè, đồng nghiệp ln giúp đỡ tạo điều kiện để em hoàn thành tốt luận văn Hà Nội, tháng 06 năm 2017 Học viên Nguyễn Văn Đức iii MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN ii MỤC LỤC iii DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT v DANH MỤC CÁC HÌNH VẼ vi DANH MỤC CÁC BẢNG BIỂU vii MỞ ĐẦU Chương 1: TỔNG QUAN VỀ PHÂN LỚP DỮ LIỆU 1.1 Giới thiệu toán phân lớp liệu vấn đề liên quan 1.1.1 Khái niệm phân lớp liệu toán phân lớp liệu 1.1.2 Quy trình thực phân lớp liệu 1.1.3 Các độ đo đánh giá mơ hình phân lớp liệu 1.2 Tổng quan số phương pháp phân lớp liệu 1.2.1 Phương pháp phân lớp liệu Bayes 1.2.2 Phương pháp định 10 1.2.3 Phương pháp mạng nơ ron nhân tạo 13 1.2.4 Phương pháp sinh luật định theo tiếp cận tập thô 16 1.2.5 Phương pháp SVM 17 1.3 Các ứng dụng phân lớp liệu 17 1.4 Kết luận chương 19 Chương 2: NGHIÊN CỨU CÁC KỸ THUẬT MÁY HỖ TRỢ VECTOR TRONG PHÂN LỚP DỮ LIỆU 20 2.1 Giới thiệu SVM vấn đề liên quan 20 2.2 Kỹ thuật SVM tuyến tính phân lớp nhị phân 24 2.2.1 Kỹ thuật SVM tuyến tính với tập liệu phân tách 24 2.2.2 Kỹ thuật SVM tuyến tính với tập liệu khơng phân tách 28 2.3 Kỹ thuật SVM phi tuyến phân lớp nhị phân 32 2.4 Kỹ thuật SVM phân lớp đa lớp 37 2.4.1 Chiến lược One-against-All (OAA – Chiến lược 1/m) 37 2.4.2 Chiến lược One-against-One (OAO – Chiến lược 1/1) 38 2.5 Kết luận chương 39 Chương - XÂY DỰNG ỨNG DỤNG MÁY HỖ TRỢ VECTOR TRONG BÀI TOÁN THỰC TẾ 40 3.1 Giới thiệu Học viện Y – Dược Học cổ truyền Việt Nam 40 iv 3.2 Đặt toán phân loại kết học tập sinh viên dựa thơng tin đầu vào 41 3.2.1 Đặt tốn 41 3.2.2 Các bước giải toán 42 3.2.3 Thu thập liệu nghiên cứu 42 3.2.4 Tiền xử lý liệu 43 3.3 Thực nghiệm đánh giá kết 44 3.3.1 Công cụ thực nghiệm 44 3.3.2 Chuẩn bị liệu 45 3.3.3 Thực thực nghiệm 46 3.3.4 Kết thực nghiệm 47 3.4 Kết luận chương 55 KẾT LUẬN 56 Kết đạt luận văn 56 Hướng phát triển luận văn: 56 TÀI LIỆU THAM KHẢO 57 Tiếng Việt 57 Tiếng Anh 57 v DANH MỤC CÁC KÝ HIỆU, CÁC CHỮ VIẾT TẮT Từ viết tắt Nghĩa tiếng Anh Nghĩa tiếng Việt ANN Artificial Neural Network Mạng nơ ron nhân tạo CNTT Information Technology Công nghệ thông tin CSDL Data Base Cơ sở liệu FN False Negative Số mẫu âm phân loại sai FP False Positive Số mẫu dương phân loại sai HL Traning Huấn luyện IoT Internet of Things Internet kết nối vạn vật KC Test Kiểm chứng KPDL Data Mining Khai phá liệu OAA One-against-All Chiến lược phân lớp tất OAO One-against-One Chiến lược phân lớp SMO Sequential Minimal Optimization Tối thiểu SVM Support Vector Machines Máy vector hỗ trợ TN True Negative Số mẫu âm phân loại TP True Positive Số mẫu dương phân loại vi DANH MỤC CÁC HÌNH VẼ Hình 1-1 Bài tốn phân lớp liệu [8] Hình 1-2 Ví dụ qui trình thực phân lớp [13] Hình 1-3 Ước lượng độ xác mơ hình phần lớp với phương pháp Holdout [8] Hình 1-4 Mơ hình định 11 Hình 1-5 Cấu trúc nơ ron (Neural) 13 Hình 1-6 Mơ hình mạng nơ ron nhân tạo 14 Hình 1-7 Tiến trình học mạng nơ ron 15 Hình 2-1 Tầm quan trọng biên thuật toán SVM 21 Hình 2-2 Ví dụ biên không tốt [2] 22 Hình 2-3 Ví dụ biên tối ưu [2] 22 Hình 2-4 Siêu phẳng phân tách với vector pháp tuyến w 23 Hình 2-5 Độ rộng biên m 25 Hình 2-6 Trường hợp liệu huấn luyện không phân tách 29 Hình 2-7 Khoảng cách điểm lỗi đến vị trí 30 Hình 2-8 Ảnh hưởng C đến độ rộng biên số lượng biến phụ ξi 30 Hình 2-9 Ánh xạ từ khơng gian chiều sang không gian chiều [6] 33 Hình 2-10 Phân lớp sử dụng chiến lược OAA OAO 37 Hình 3-1 Mơ hình tốn phân loại kết học tập 41 Hình 3-2 Các bước phân loại kết học tập sinh viên 42 Hình 3-3 Giao diện khởi động WEKA 45 Hình 3-4 Thực 1/1 1/m với SMO Classifier 47 vii DANH MỤC CÁC BẢNG BIỂU Bảng 3-1 Qui đổi khu vực tuyển sinh 44 Bảng 3-2 Qui đổi điểm thi 44 Bảng 3-3 Xếp loại học tập sinh viên 44 Bảng 3-4 Bảng kết phân lớp theo chiến lược 1/m 47 Bảng 3-5 Bảng kết phân lớp theo chiến lược 1/1 48 Bảng 3-6 So sánh độ xác thời gian chiến lược phân đa lớp 48 Bảng 3-7 Bảng kết phân lớp theo chiến lược 1/m 49 Bảng 3-8 Bảng kết phân lớp theo chiến lược 1/1 49 Bảng 3-9 So sánh độ xác thời gian chiến lược phân đa lớp theo tổng điểm môn đầu vào 50 Bảng 3-10 Bảng kết phân lớp theo chiến lược 1/m 50 Bảng 3-11 Bảng kết phân lớp theo chiến lược 1/1 51 Bảng 3-12 So sánh độ xác thời gian chiến lược phân đa lớp theo mơn Tốn 51 Bảng 3-13 Bảng kết phân lớp theo chiến lược 1/m 52 Bảng 3-14 Bảng kết phân lớp theo chiến lược 1/1 52 Bảng 3-15 So sánh độ xác thời gian chiến lược phân đa lớp theo Khu vực tuyển sinh 53 Bảng 3-16 Kết sau phân lớp 53 MỞ ĐẦU Trong thời gian gần đây, phát triển mạnh mẽ công nghệ thông tin dịch vụ mạng làm số lượng thông tin trao đổi mạng Internet tăng cách đáng kể Số lượng thông tin lưu trữ kho liệu tăng với tốc độ chóng mặt Đồng thời, tốc độ thay đổi thơng tin nhanh chóng Theo thống kê Broder et al (2003), sau tháng 12 tháng lượng thơng tin lưu trữ, tìm kiếm quản lý lại tăng gấp đơi Hiện nay, lồi người bước vào kỷ nguyên IoT (Internet of Things – Internet kết nối vạn vật) Thông qua internet, người dùng có nhiều hội để tiếp xúc với nguồn thông tin vô lớn Tuy nhiên, với nguồn thơng tin vơ tận đó, người dùng phải đối mặt với tải thông tin Đôi khi, để tìm thơng tin cần thiết, người dùng phí lượng thời gian lớn Với số lượng thông tin đồ sộ vậy, yêu cầu cấp thiết đặt tổ chức, tìm kiếm khai thác thơng tin (dữ liệu) cách hiệu Một giải pháp nghiên cứu để giải vấn đề xây dựng mơ hình tính tốn dựa phương pháp học máy nhằm phân loại, khai thác thông tin cách tự động trích xuất tri thức hữu ích Trong đó, tốn phân lớp (Classification) liệu có ý nghĩa quan trọng Phân lớp liệu việc xếp liệu vào lớp biết trước Ví dụ: Phân lớp sinh viên theo kết học tập, phân lớp loài thực vật,… Bài toán phân lớp liệu thường giải cách sử dụng số kỹ thuật học máy như: Mạng Nơ-ron nhân tạo (Artificial Neural Network), Cây định (Decision tree), Máy vector hỗ trợ (Support Vector Machine),… Trong đó, kỹ thuật máy vector hỗ trợ thường sử dụng phân lớp liệu nhờ ưu điểm xử lý tập liệu kích thước lớn, liệu có nhiều thuộc tính đạt hiệu suất cao Với lý trên, học viên chọn thực đề tài luận văn tốt nghiệp với tiêu đề “NGHIÊN CỨU PHÂN LỚP DỮ LIỆU DỰA TRÊN MÁY VECTOR HỖ TRỢ VÀ ỨNG DỤNG” 44 Bảng 3-1 Qui đổi khu vực tuyển sinh TT Khu vực tuyển sinh Mã hóa KV1 A KV2NT B KV2 C KV3 D - Chuyển đổi điểm thi thành mức bảng 3-2: Bảng 3-2 Qui đổi điểm thi Điểm thi đầu vào Mã hóa >=9 A >=8 B >=7 C =8 Giỏi >=7 Khá >=6 Trung bình >=5 Trung bình TT 3.3 Thực nghiệm đánh giá kết 3.3.1 Công cụ thực nghiệm Công cụ thực nghiêm: Sử dụng phần mềmWeka version 3.7.12 [15] 45 Weka phần mềm miễn phí học máy viết Java, phát triển University of Wekato Weka coi sưu tập thuật toán học máy dùng phân tích khai phá liệu Các thuật tốn xây dựng sẵn việc sử dụng Do Weka thích hợp cho việc thử nghiệm mơ hình mà khơng thời gian để xây dựng chúng Weka có giao diện sử dụng đồ họa trực quan chế độ command line Ngoài thuật toán học máy dự đoán, phân loại, phân cụm, Weka cịn có cơng cụ để trực quan hóa liệu hữu ích q trình nghiên cứu, phân tích Hình 3-3 Giao diện khởi động WEKA Chương trình thực với SMO Classifier thư viện MultiClassClassifier WEKA 3.3.2 Chuẩn bị liệu 46 Danh sách điểm thi đầu vào kết học tập chia thành nhóm tiền xử lý Dữ liệu lựa chọn mẫu HL KC tự động lấy 70% liệu chạy huấn luyện, 30% chạy test 3.3.3 Thực thực nghiệm Để đánh giá xác thời gian xây dựng mơ hình theo chiến lược 1/m 1/1 liệu thử nghiệm theo quy trình sau: Khởi động WEKA Load liệu huấn luyện nhóm thử nghiệm Chọn Classify Load liêu kiểm chứng nhóm thử nghiệm Chọn Classifiers MultiClassClassifier Chọn Classifier có MultiClassClassifier SMO Chọn phương pháp: 1-against-1 hay 1-against-all Start Ghi lại thời gian xây dựng mơ hình bảng phân tích độ xác, bảng ma trận confusion Mỗi phương pháp 1/m 1/1 thực liên tiếp lần nhóm mẫu, lần thực theo quy trình thực từ bước Giá trị thời gian xây dựng mơ hình phương pháp nhóm mẫu lấy giá trị thời gian trung bình lần chạy liên tiếp phương pháp nhóm mẫu thử nghiệm Giao diện thưc phân lớp weka hình 3-4 47 Hình 3-4 Thực 1/1 1/m với SMO Classifier 3.3.4 Kết thực nghiệm Kết thử nghiệm với thuộc tính: Bảng 3-4 Bảng kết phân lớp theo chiến lược 1/m 48 Bảng 3-5 Bảng kết phân lớp theo chiến lược 1/1 Bảng 3-6 So sánh độ xác thời gian chiến lược phân đa lớp theo thuộc tính Độ xác phân lớp Thời gian xây dựng mơ (%) hình (giây) 1/m 78 7,36 1/1 84 3,96 Chiến lược Trên bảng 3-6 nhận thấy với độ xác 1/1 cao 1/m; Thời gian thực theo 1/1 nhanh 1/m khoảng 3,4s 49 Kết thử nghiệm theo tổng điểm mơn (Tốn + Hóa + Sinh): Bảng 3-7 Bảng kết phân lớp theo chiến lược 1/m Bảng 3-8 Bảng kết phân lớp theo chiến lược 1/1 50 Bảng 3-9 So sánh độ xác thời gian chiến lược phân đa lớp theo tổng điểm môn đầu vào Độ xác phân lớp Thời gian xây dựng mơ (%) hình (giây) 1/m 44 4,13 1/1 69 7,25 Chiến lược Trên bảng 3-9 nhận thấy với độ xác 1/1 cao 1/m; Thời gian thực theo 1/1 nhanh 1/m khoảng 3,12s Kết thử nghiệm theo mơn Tốn: Bảng 3-10 Bảng kết phân lớp theo chiến lược 1/m 51 Bảng 3-11 Bảng kết phân lớp theo chiến lược 1/1 Bảng 3-12 So sánh độ xác thời gian chiến lược phân đa lớp theo mơn Tốn Độ xác phân lớp Thời gian xây dựng mơ (%) hình (giây) 1/n 79,4 8,17 1/1 82 5,25 Chiến lược Trên bảng 3-12 nhận thấy độ xác chiến lược 1/1 cao 1/m; Thời gian thực theo 1/1 nhanh 1/m khoảng 2,92 s 52 Kết thử nghiệm theo Khu vực tuyển sinh: Bảng 3-13 Bảng kết phân lớp theo chiến lược 1/m Bảng 3-14 Bảng kết phân lớp theo chiến lược 1/1 53 Bảng 3-15 So sánh độ xác thời gian chiến lược phân đa lớp theo Khu vực tuyển sinh Độ xác phân lớp Thời gian xây dựng mơ (%) hình (giây) 1/m 85 8,65 1/1 85 4,35 Chiến lược Trên bảng 3-15 nhận thấy với độ xác chiến lược 1/1 tương đương với 1/m; Thời gian thực theo 1/1 nhanh 1/m khoảng 4,3s 3.3.5 Phân tích đánh giá kết Các kết thực nghiệm tổng hợp bảng 3-16 Bảng 3-16 Kết sau phân lớp Phân lớp theo TT Tổng thuộc tính Tổng điểm môn thi vào Theo khu vực tuyển sinh Theo điểm mơn tốn Phân lớp theo chiến lược 1/m (%) 78 Phân lớp theo chiến lược 1/1 (%) 84 44 69 85 85 79,4 82 Ghi Nhận xét Với kết trình bày bảng từ 3-4 đến bảng 3-16 rút số nhận xét sau: Kết phân lớp từ bảng 3-6 dúng lên đến 78% 84% số Precision, Recall tốt Trong bảng kết phân lớp tỷ lệ cao, kết phân lớp để dự báo khả thi 54 Trong bảng 3-9 phân loại theo tổng điểm môn đầu vào (Tốn + Hóa + Sinh) ta nhận thấy phân lớp theo chiến lược 1/m tỷ lệ đạt 44% Nếu phân lớp theo chiến lược 1/1 tỷ lệ đạt 69% Rút kết luận kết học tập sinh viên có phụ thuộc vào tổng điểm môn đầu vào Trong bảng 3-12 phân loại theo điểm thi đầu vào mơn Tốn: Tỷ lệ phân lớp theo hai chiến lược 1/m 1/1 79,4% 82% Đây tỷ lệ phân lớp cao Rút kết luận kết học tập sinh viên phụ thuộc nhiều vào điểm thi đầu vào mơn tốn Những sinh viên có điểm thi mơn tốn cao có kết học tập cao Trong bảng 3-5 phân lớp theo Khu vực tuyển sinh Kết phân lớp theo hai chiến lược 1/m 1/1 tương đương nhau, 85% tỷ lệ tốt Rút kết luận thí sinh khu vực 2, khu vực có điểm ưu tiên thấp (tức điểm thi đầu vào cao) có kết học tập tốt Từ kết chạy thử nghiệm ta thấy: Kết học tập sinh viên phụ thuộc vào điểm thi đầu vào, khu vực tuyển sinh điểm thi môn toán Khuyến nghị Trên sở kết thực nghiệm, luận văn đề xuất số khuyến nghị sau nhằm nâng cao chất lượng đầu sinh viên Học viện Y- Dược Học cổ truyền Việt Nam: Xây dựng phương án tuyển sinh tổ hợp mơn Tốn, Hóa, Sinh lấy ưu tiên điểm thi mơn Tốn (có thể nhân hệ số mơn 2) Theo nghiên cứu luận văn kết học tập sinh viên có phụ thuộc vào khu vực tuyển sinh nên chọn phương án ưu tiên mơn tốn có hệ số cao hơn, sinh viên có điểm thi mơn tốn cao dễ trúng tuyển Khi tỷ lệ thí sinh có điểm ưu tiên khu vực mà có điểm tổng điểm mơn thấp khó trúng tuyển Vì tăng hệ số điểm thi mơn tốn, tăng giá trị điểm thi thực thí sinh lên cịn điểm ưu tiên theo khu vực nguyên, điều hạn chế bớt thí thuộc khu vực có điểm cộng ưu tiên cao 55 3.4 Kết luận chương Trong chương luận văn sử dụng kỹ thuật SVM cho toán phân loại kết học tập sinh viên Học viện Y- Dược Học cổ truyền Việt Nam Trên sở thông tin tuyển sinh đầu vào kết học tập sinh viên, luận văn tiến hành thực nghiệm với việc sử dụng SVM Kết thực nghiệm thu sử dụng phần mềm WEKA phân tích đánh giá cho thấy phù hợp với lý thuyết nghiên cứu Trong luận văn đề xuất số khuyến nghị việc xây dựng phương án tuyển sinh Học viện Y- Dược Học cổ truyền Việt Nam nhằm nâng cao chất lượng đào tạo 56 KẾT LUẬN Kết đạt luận văn Luận văn đạt kết sau: Khảo sát tốn phân lớp liêu phương pháp giải chúng Đồng thời luận văn nghiên cứu độ đo đánh giá mơ hình phân lớp ứng dụng toán phân lớp liệu lĩnh vực khoa học, kỹ thuật đời sống xã hội Nghiên cứu kỹ thuật SVM giải toán phân lớp nhị phân chiến lược giải toán phân lớp đa lớp Sử dung SVM giải toán phân loại kết học tập sinh viên Học viện Y - Dược Học cổ truyền Việt Nam Về luận văn hoàn thành mục tiêu đề đề tài nghiên cứu Hướng phát triển luận văn: Tuy đạt số kết nêu trên, luận văn số hạn chế điều kiện mặt thời gian trình độ học viên Vì vậy, hướng nghiên cứu học viên là: - Nghiên cứu thêm thuật tốn học máy khác để ứng dụng cho nhiều toán phân lớp liệu đa dạng thực tế, - Mở rộng thêm thuộc tính có liên quan đến kết học tập sinh viên học chuyên ngành Y học cổ truyền yếu tố gia đình có nghề gia truyền, sở thích sinh viên, cho toán phân loại kết học tập sinh viên Học viện Y - Dược Học cổ truyền Việt Nam - Phát triển toán phân loại dự báo cho ngành học khác để hỗ trợ trình đào tạo trường đại học khác 57 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Nguyễn Thị Thảo, Nguyễn Thị Huyền, Đoàn thị Thu Hà, Trần Thị Thu Huyền, Nguyễn Thị Thủy (2011) – ”Phương pháp phân lớp sử dụng máy véc tơ hỗ trợ ứng dụng tin sinh học” – Tạp chi Khoa học Phát triển, T 9, Số 6, T 1021-1031 [2] Nguyễn Anh Tuấn (2015) – ”Ứng dụng máy véc tơ hỗ trợ phân loại bệnh dựa xét nghiệm hóa nghiệm” - Luận văn thạc sĩ kỹ thuật, Học viện Cơng nghệ Bưu Viễn thơng Tiếng Anh [3] S Abe (2005) – “Support Vector Machine for Pattern Recognition” – Springer [4] E L Allwein, R E Schapire, and Y Singer (2001) – “Reducing multiclass to binary: A unifying approach for margin classifiers” - The Journal of Machine Learning Research, V.1, pp 113–141 [5] Tapan Bagchi, Rahul Samant, Milan Joshi (2013) – “SVM Classifiers Built Using Imperfect Training Data” - International Conference on Mathematical Techniques In Engineering Applications, ICMTEA 2013-BM-003 [6] Christopher J.C Burges (2000) – “A Tutorial on Support Vector Machines for Pattern Recognition” – Kluwer Academic Publishers, Boston [7] C Cortes and V N Vapnik (1995) – “Support Vector Networks” - Machine Learning, V 20, No 3, pp 273-297 [8] Jiawei Han, Micheline Kamber (2011) – “Data mining: Concepts and Techniques” -3nd Edition, Morgan Kaufman Publishers [9] C.W Hsu and C.J Lin (2002) – “A Comparison of Methods for Multiclass Support Vector Machines” - IEEE Tran on Neural Networks, V 13, No 2, pp 415-425 [10] H Lei and V Govindaraju (2005) – “Half-against-half Multi-class Support Vector Machines” - Springer Berlin Heidelberg, pp 156-164 58 [11] J Milgram, M Cheriet and R Sabourin (2006) – ““One Against One” or “One Against All”: Which One is Better for Handwriting Recognition with SVMs?” - In Tenth International Workshop on Frontiers in Handwriting Recognition Suvisoft [12] R Rifkin and A Klautau (2004) – “In defence of one-vs-all classification” Journal of Machine Learning Research, V 5, pp 101-141 Trang WEB [13] https://vi.wikipedia.org/wiki/H%E1%BB%8Dc_m%C3%A1y [14] https://en.wikipedia.org/wiki/Precision_and_recal [15] https://sourceforge.net/projects/weka/ ... toán phân lớp liệu, phương pháp phân lớp liệu ứng dụng phân lớp liệu 1.1 Giới thiệu toán phân lớp liệu vấn đề liên quan 1.1.1 Khái niệm phân lớp liệu toán phân lớp liệu Phân lớp (classification)... đề “NGHIÊN CỨU PHÂN LỚP DỮ LIỆU DỰA TRÊN MÁY VECTOR HỖ TRỢ VÀ ỨNG DỤNG” 2 Mục tiêu luận văn nghiên cứu kỹ thuật SVM để giải toán phân lớp liệu nói chung ứng dụng cho tốn phân loại kết học tập... Chương 2: Nghiên cứu kỹ thuật máy hỗ trợ vector phân lớp liệu Nội dung chương nghiên cứu chi tiết kỹ thuật SVM ứng dụng cho toán phân lớp liệu Chương 3: Xây dựng ứng dụng máy hỗ trợ vector tốn

Ngày đăng: 03/06/2021, 21:25

Nguồn tham khảo

Tài liệu tham khảo Loại Chi tiết
[1] Nguyễn Thị Thảo, Nguyễn Thị Huyền, Đoàn thị Thu Hà, Trần Thị Thu Huyền, Nguyễn Thị Thủy (2011) – ”Phương pháp phân lớp sử dụng máy véc tơ hỗ trợ ứng dụng trong tin sinh học” – Tạp chi Khoa học và Phát triển, T. 9, Số 6, T. 1021-1031 Sách, tạp chí
Tiêu đề: Phương pháp phân lớp sử dụng máy véc tơ hỗ trợ ứng dụng trong tin sinh học
[2] Nguyễn Anh Tuấn (2015) – ”Ứng dụng máy véc tơ hỗ trợ trong phân loại bệnh dựa trên xét nghiệm hóa nghiệm” - Luận văn thạc sĩ kỹ thuật, Học viện Công nghệ Bưu chính Viễn thông.Tiếng Anh Sách, tạp chí
Tiêu đề: Ứng dụng máy véc tơ hỗ trợ trong phân loại bệnh dựa trên xét nghiệm hóa nghiệm
[3] S. Abe (2005) – “Support Vector Machine for Pattern Recognition” – Springer Sách, tạp chí
Tiêu đề: Support Vector Machine for Pattern Recognition
[4] E. L. Allwein, R. E. Schapire, and Y. Singer (2001) – “Reducing multiclass to binary: A unifying approach for margin classifiers” - The Journal of Machine Learning Research, V.1, pp. 113–141 Sách, tạp chí
Tiêu đề: Reducing multiclass to binary: A unifying approach for margin classifiers
[5] Tapan Bagchi, Rahul Samant, Milan Joshi (2013) – “SVM Classifiers Built Using Imperfect Training Data” - International Conference on Mathematical Techniques In Engineering Applications, ICMTEA 2013-BM-003 Sách, tạp chí
Tiêu đề: SVM Classifiers Built Using Imperfect Training Data
[6] Christopher J.C. Burges (2000) – “A Tutorial on Support Vector Machines for Pattern Recognition” – Kluwer Academic Publishers, Boston Sách, tạp chí
Tiêu đề: A Tutorial on Support Vector Machines for Pattern Recognition
[7] C. Cortes and V. N. Vapnik (1995) – “Support Vector Networks” - Machine Learning, V. 20, No. 3, pp. 273-297 Sách, tạp chí
Tiêu đề: Support Vector Networks
[8] Jiawei Han, Micheline Kamber (2011) – “Data mining: Concepts and Techniques” -3nd Edition, Morgan Kaufman Publishers Sách, tạp chí
Tiêu đề: Data mining: Concepts and Techniques
[9] C.W. Hsu and C.J. Lin (2002) – “A Comparison of Methods for Multiclass Support Vector Machines” - IEEE Tran. on Neural Networks, V. 13, No. 2, pp. 415-425 Sách, tạp chí
Tiêu đề: A Comparison of Methods for Multiclass Support Vector Machines
[10] H. Lei and V. Govindaraju (2005) – “Half-against-half Multi-class Support Vector Machines” - Springer Berlin Heidelberg, pp. 156-164 Sách, tạp chí
Tiêu đề: Half-against-half Multi-class Support Vector Machines
[11] J. Milgram, M. Cheriet and R. Sabourin (2006) – ““One Against One” or “One Against All”: Which One is Better for Handwriting Recognition with SVMs?” - In Tenth International Workshop on Frontiers in Handwriting Recognition. Suvisoft Sách, tạp chí
Tiêu đề: ““One Against One” or “One Against All”: Which One is Better for Handwriting Recognition with SVMs
[12] R. Rifkin and A. Klautau (2004) – “In defence of one-vs-all classification” - Journal of Machine Learning Research, V. 5, pp. 101-141.Trang WEB Sách, tạp chí
Tiêu đề: In defence of one-vs-all classification

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w