Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 13 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
13
Dung lượng
1,16 MB
Nội dung
TRƯỜNG ĐẠI HỌC ĐIỆN LỰC KHOA CÔNG NGHỆ THÔNG TIN BÁO CÁO CHUYÊN ĐỀ HỌC PHẦN MÔN NHẬP MÔN HỌC MÁY ĐỀ TI: ỨNG DỤNG THUẬT TOÁN NAVIES NAYES ĐỂ CHUẨN ĐOÁN BỆNH TIỂU ĐƯỜNG Sinh viên thực : NGUYỄN VIỆT HONG Giảng viên hướng dẫn : VŨ VĂN ĐỊNH Ngành : CÔNG NGHỆ THÔNG TIN Chuyên ngành : CƠNG NGHỆ PHẦN MỀM Lớp : D15CNPM7 Khóa : 2020-2025 Hà Nội, tháng năm 2023 PHIẾU CHẤM ĐIỂM Sinh viên thực hiện: Họ tên Nội dung thực Điểm Chữ ký Giảng Viên Chấm: Họ tên Giảng viên 1: Giảng viên 2: Chữ ký Ghi LỜI CẢM ƠN Trong lời báo cáo “ Nhập môn học máy”, chúng em muốn gửi lời cảm ơn biết chân thành tới tất người hỗ trợ, giúp đỡ chúng em kiến thức tinh thần trình thực báo cáo Em xin chân thành gửi lời cảm ơn tới thầy cô giáo Trường Đại học Điện Lực nói chung thầy giáo Khoa Cơng nghệ thơng tin nói riêng tận tình giảng dạy, truyền đạt cho em kiến thức kinh nghiệm quý báu suốt trình học tập Đặc biệt, em xin gửi lời cảm ơn đến Giáo viên hướng dẫn Vũ Văn Định, giảng viên Khoa Công nghệ thông tin - Trường Đại học Điện Lực Thầy tận tình theo sát giúp đỡ, trực tiếp bảo, hướng dẫn suốt trình nghiên cứu học tập chúng em Trong thời gian học tập với thầy, nhóm em khơng tiếp thu thêm nhiều kiến thức bổ ích mà cịn học tập tinh thần làm việc, thái độ nghiên cứu khoa học nghiêm túc, hiệu Đây điều cần thiết cho chúng em trình học tập cơng tác sau Do thời gian thực có hạn kiến thức nhiều hạn chế nên làm em chắn khơng tránh khỏi thiếu sót định Em mong nhận ý kiến đóng góp thầy giáo bạn để em có thêm kinh nghiệm tiếp tục hồn thiện đồ án Em xin chân thành cảm ơn! LỜI MỞ ĐẦU Công nghệ ngày phổ biến không phủ nhận tầm quan trọng hiệu mà đem lại cho sống Bất kỳ lĩnh vực nào, góp mặt trí tuệ nhân tạo giúp người làm việc hồn thành tốt cơng việc Và gần đây, thuật ngữ “machine learning” nhiều người quan tâm.Thay phải code phần mềm với cách thức thủ công theo hướng dẫn cụ thể nhằm hồn thành nhiệm vụ đề máy tự “học hỏi” cách sử dụng lượng lớn liệu thuật tốn cho phép thực tác vụ Đây lĩnh vực khoa học không mới, cho thấy lĩnh vực trí tuệ nhân tạo ngày phát triển tiến xa tương lai Đồng thời, thời điểm xem lĩnh vực “nóng” dành nhiều mối quan tâm để phát triển cách mạnh mẽ, bùng nổ Hiện nay, việc quan tâm machine learning ngày tăng lên nhờ có machine learning giúp gia tăng dung lượng lưu trữ loại liệu sẵn, việc xử lý tính tốn có chi phí thấp hiệu nhiều Những điều hiểu thực tự động, nhanh chóng để tạo mơ hình cho phép phân tích liệu có quy mơ lớn phức tạp đồng thời đưa kết cách nhanh xác Chính hiệu cơng việc lợi ích vượt bậc mà đem lại cho khiến machine learning ngày trọng quan tâm nhiều hơn.Vì chúng em chọn đề tài:” ỨNG DỤNG THUẬT TOÁN NAVIES NAYES ĐỂ CHUẨN ĐOÁN BỆNH TIỂU ĐƯỜNG” CHƯƠNG 1: TỔNG QUAN VỀ HỌC MÁY 1.1 Khái niệm học máy Học máy ( Machine learning ) có khởi nguồn từ lĩnh vực trí tuệ nhân tạo (AI) Đây giải pháp có khả khiến ứng dụng, phần mềm trở nên thông minh mà không cần thực mã hóa Thơng qua liệu đầu vào, Machine learning dự đốn giá trị đầu Nhiệm vụ học máy tập trung phát triển chương trình máy tính truy cập liệu sử dụng chúng để tự học Mục tiêu hoạt động giúp máy tính tự hoạt động mà không cần hỗ trợ người Học máy xem phần quan trọng thuộc lĩnh vực khoa học liệu Chúng sử dụng phương pháp thống kê, thuật toán để phân loại, dự đốn khám phá thơng tin quan trọng liệu Nhờ chuỗi thông tin này, người dùng nhanh chóng đưa định hoạt động kinh doanh Vì vậy, Machine learning giải pháp lý tưởng giúp doanh nghiệp tác động đến số tăng trưởng doanh thu 1.2 Lịch sử hình thành học máy Machine learning thuật ngữ đặt Arthur Samuel vào năm 1959 Samuel IBMer người Mỹ kiêm nhà tiên phong lĩnh vực trí tuệ nhân tạo máy tính chơi game Năm 1960, thuật ngữ học máy phổ biến thông qua sách Nilsson, nội dung đề cập đến việc phân loại máy học Machine learning đại bao gồm hai mục tiêu chính: phân loại liệu thơng qua mơ hình phát triển đưa dự đốn kết tương lai dựa mơ hình 1.3 Vì học máy lại quan trọng ? Học máy nhánh nghiêm cứu quan trọng trí tuệ nhân tạo với nhiều ứng dụng thành công thực tế Hiện nay, học máy lĩnh vực phát triển mạnh trí tuệ nhân tạo Có số lý giải thích cho cần thiết phát triển học máy: Tăng khả nhận dạng Tăng khả thích nghi Ứng dụng trí tuệ nhân tạo người tạo 1.4 Các ứng dụng học máy Nhiều hoạt động hàng ngày trợ giúp thuật toán machine learning, bao gồm: -Công nghiệp: Học máy sử dụng để tối ưu hóa quy trình sản xuất, dự đốn thời tiết, phân tích liệu từ thiết bị lắp đặt nhà máy -Tài chính: Học máy sử dụng để dự đoán giá cổ phiếu, phát gian lận tín dụng, phân tích tín dụng, đưa lời khuyên đầu tư, kiểm tra rủi ro tín dụng -Y học: Học máy sử dụng để phát ung thư, dự đoán bệnh trước, hỗ trợ cho việc lập kế hoạch điều trị, tối ưu hóa sản xuất thuốc -Marketing: Học máy sử dụng để phân tích liệu khách hàng, phát triển hồ sơ khách hàng, xác định giá chiến lược giảm giá -Giao thông: Học máy sử dụng để phát tai nạn, dự đốn lưu lượng giao thơng, phân tích liệu thang máy hệ thống tàu điện ngầm -Giải trí: Học máy sử dụng để giúp hệ thống gợi ý sản phẩm, phân tích liệu khách hàng để đưa sản phẩm phù hợp, đề xuất nhạc cụ thể cho nhu cầu giải trí khách hàng 1.5 Một số giải pháp học máy Recommandé pour toi Suite du document ci-dessous 16 UCSP Module 12 - asdasd Society and Culture (with Family Planning) Humanities Art Appreciation 100% (1) Câu 151 - 179 - Câu 151 - 179 mơn kế tốn tài doanh nghiệp Quản lý tài 100% (1) Học máy giải pháp ứng dụng thơng qua loại thuật tốn để phân tích dự đốn Dựa thuật tốn này, học máy chia làm bốn loại: Machine learning giám sát, Machine learning không giám sát, Machine learning bán giám sát Machine learning tăng cường 1.5.1 Machine learning giám sát Machine learning giám sát sử dụng tập liệu gắn nhãn để phân loạidữ liệu dự đốn kết xác Phương pháp điều chỉnh trọng lượng liệu đưa vào mơ hình chúng lắp cách thích hợp Giải pháp Machine learning có giám sát giúp doanh nghiệp xử lý vấn đề thực quy mô lớn, việc phân loại thư rác thư mục riêng Những thuật toán sử dụng học máy giám sát là: mạng nơ-ron, hồi quy tuyến tính, hồi quy logistic, máy vectơ hỗ trợ,… 1.5.2 Machine learning không giám sát Phương pháp sử dụng thuật toán Machine learning để phân tích tập liệu khơng gắn nhãn Những thuật tốn có khả phát nhóm liệu ẩn mà khơng cần hỗ trợ người Đây giải pháp lý tưởng để: phân tích liệu, phân khúc khách hàng, nhận dạng hình ảnh, chiến lược bán chéo, … Bên cạnh đó, Machine learning khơng giám sát cịn giảm số lượng tính mơ hình dựa việc giảm kích thước Chúng có hai cách tiếp cận phổ biến là: phân tích thành phần phân tích giá trị đơn lẻ Một số thuật toán khác phương pháp là: phân cụm k-mean, phân cụm xác suất, mạng nơron,… 1.5.3 Machine learning bán giám sát Đây kết hợp hài hòa học máy giám sát không giám sát Machine learning bán giám sát sử dụng liệu gắn nhãn không gắn nhãn để đào tạo Phương pháp giúp giải vấn đề khơng có đủ liệu gắn nhãn để đào tạo thuật toán học máy giám sát 1.5.4 Machine learning tăng cường Machine learning tăng cường phương pháp học tập dựa tương tác với mơi trường Chúng có khả thực mục tiêu định lái xe chơi trò chơi với đối thủ Phương pháp sử dụng để đào tạo máy tính hồnthành quy trình gồm nhiều bước 1.6 Học máy phù hợp với ngôn ngữ nào? Ngơn ngữ lập trình tốt cơng nghệ đại machine learning là: JavaScript, Python, Julia, R, Java Trong đó, Python ngơn ngữ lập trình sử dụng phổ biến thiết lập giải pháp học máy Lượng người dùng sử dụng ngôn ngữ ngày tăng CHƯƠNG 2.1 Giới thiệu Hồi quy tuyến tính la phương pháp thống kê để hồi quy liệu với biến phụ thuộc có giá trị liên tục biến độc lập có hai giá trị liên tục giá trị phân loại Hồi quy tuyến tính hai dạng lớn học có giám sát (supervised learning) dựa tập liệu mẫu Nói cách khác "Hồi quy tuyến tính" phương pháp để dự đoán biến phụ thuộc (Y) dựa giá trị biến độc lập (X) Nó sử dụng cho trường hợp muốn dự đoán số lượng liên tục Ví dụ, dự đốn giao thơng cửa hàng bán lẻ, dự đoán thời gian người dùng dừng lại trang số trang truy cập vào website v.v 2.2 Phân tích tốn học 2.2.1 Dạng Linear Regression Hồi quy tuyến tính có phương trình đạng : F(x) = w0 + w1x1 + w2x2 + … + wnxn (1) Trong đó, w1, w2, wn, w0 số, w0 gọi bias hay sai số Mối quan hệ y f(x) bên mối quan hệ tuyến tính (linear) Bài tốn làm toán thuộc loại regression Bài tốn tìm hệ số tối ưu { w1, w2, wn, w0 } gọi tốn Linear Regression (Hồi quy tuyến tính) Trong phương trình (1) đặt w = [w0, w1, w2, wn]T vecter (cột) hệ số cần phải tối ưu = [1, x1, x2, xn] (đọc x bar tiếng Anh) vector (hàng) liệu đầu vào mở rộng Số đầu thêm vào để phép tính đơn giản thuận tiện cho việc tính tốn Khi đó, phương trình (1) viết lại dạng: y ( vecter hàng) 2.2.2 Hàm mát Máy học từ giá trị trung bình hàm mát Đây phương pháp đánh giá độ hiệu thuật tốn liệu cho trước Nếu kết dự đoán chênh lệch nhiều so với kết thực tế, hàm mát số lớn Điều tương tự xảy với tất cặp (x i, yi), i = 1, 2, 3, …, N với N số lượng liệu quan sát Để hàm mát nhỏ tổng sai số nhỏ tương đương với việc tìm w để hàm số sau đạt giá trị nhỏ nhất: J(w) = (2) Hàm số J(w) gọi hàm mát (loss function) tốn Linear Regression Chúng ta ln mong muốn mát (sai số) nhỏ nhất, điều đồng nghĩa với việc tìm vector hệ số w cho giá trị hàm mát nhỏ tốt Trước tìm lời giải, đơn giản hóa phép tốn phương trình hàm mát (2) Đặt vector cột chứa tất output training data; = ma trận liệu đầu vào (mở rộng) mà hàng điểm liệu 2.2.3 Tìm nghiệm mơ hình hồi quy tuyến tính Để tìm nghiệm cho toán tối ưu thường giải phương trình đạo hàm J(w) = Đạo hàm theo w hàm mát là: Phương trình đạo hàm tương đương với: Đặt b ( ) ta có : A.W = b (với I ma trận đơn vị) nghiệm mơ hình hồi quy tuyến tính Trên thực tế A không khả nghịch nên ta dùng ma trận giả nghịch đảo nên ta có W = hay W = Đây nghiệm tổng quát hồi quy tuyến tính 2.2.4 Mức độ lỗi mơ hình hồi quy tuyến tính Ta có cơng thức tính mức độ lỗi mơ sau : MSE = Với mức độ lỗi mơ hình cho ta biết mức độ học mơ hình