1. Trang chủ
  2. » Giáo Dục - Đào Tạo

(Tiểu luận) đề tài bài toán phân loại hoa irisdựa vào thuật toán cây quyết định

42 10 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 42
Dung lượng 6,72 MB

Nội dung

Một trong những thuật toán thường dùng trong ML đó là thuật toán Cây quyết định Decision TreeỨng dụng của thuật toán này thường được sử dụng trong nghiên cứu hoạt động , đặc biệt là tron

BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC THƯƠNG MẠI KHOA HỆ THỐNG THÔNG TIN KINH TẾ VÀ THƯƠNG MẠI ĐIỆN TỬ  BÁO CÁO THẢO LUẬN HỌC PHẦN: LẬP TRÌNH VỚI PYTHON ĐỀ TÀI: BÀI TỐN PHÂN LOẠI HOA IRIS DỰA VÀO THUẬT TOÁN CÂY QUYẾT ĐỊNH Giảng viên hướng dẫn: ThS Đỗ Thị Thanh Tâm Nhóm thực hiện: Nhóm Lớp học phần: 231_INFO4511_01 Hà Nội, ngày 28 tháng 11 năm 2023 DANH SÁCH THÀNH VIÊN NHÓM STT Họ tên MSV Nhiệm vụ Lý thuyết Nguyễn Thị Nhung Huyền (Nhóm trưởng) 23D190020 dịnh Viết code, mơ tả tốn Triệu Phúc Hương Nguyễn Trung Kiên Hồn thành tốt nhiệm vụ Tích cực tham gia xây dựng thảo luận Lý thuyết Hồn thành tốt Machine nhiệm vụ 23D190021 Learning Tích cực tham gia thuyết xây dựng thảo trình luận Mô tả Đánh giá 23D190022 liệu Iris thuyết trình Hồn thành tốt nhiệm vụ Tích cực tham gia xây dựng thảo luận Hoàn thành tốt Lê Thị Lan 23D190023 Làm file nhiệm vụ báo cáo Tích cực tham gia word xây dựng thảo luận Hoàn thành tốt Đinh Thị Mai Linh 23D190024 Làm powerpoint nhiệm vụ Tích cực tham gia xây dựng thảo luận CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập-Tự do-Hạnh phúc Điểm Hà Nội, ngày 18 tháng 11 năm 2023 BIÊN BẢN HỌP NHÓM (LẦN 1) I THỜI GIAN-ĐỊA ĐIỂM Thời gian: 21h, ngày 18/11/2023 Địa điểm: Cuộc họp online Google Meet II THÀNH PHẦN THAM DỰ (5/5) Nguyễn Thị Nhung Huyền (Nhóm trưởng), Triệu Phúc Hương, Nguyễn Trung Kiên, Lê Thị Lan, Đinh Thị Mai Linh III NỘI DUNG CUỘC HỌP Nhóm trưởng đề xuất phương án phân chia cơng việc theo nguyện vọng, thành viên tán thành Các ý kiến thống theo yêu cầu đề thảo luận, chốt nhiệm vụ cụ thể thành viên Cả nhóm thảo luận vấn đề câu hỏi mà thành viên phụ trách Nhóm trưởng thống thời gian làm đặt hạn làm lần IV KẾT LUẬN CUỘC HỌP Các thành viên tham gia đầy đủ tích cực thảo luận bàn bạc vấn đề giao Cuộc họp diễn suôn sẻ kết thúc vào 23 ngày 18 tháng 11 năm 2023 Thư ký Nhóm trưởng (Ký, ghi rõ họ tên) (Ký, ghi rõ họ tên) Lan Huyền Lê Thị Lan Nguyễn Thị Nhung Huyền CỘNG HÒA XÃ HỘI CHỦ NGHĨA VIỆT NAM Độc lập-Tự do-Hạnh phúc Hà Nội, ngày 30 tháng 11 năm 2023 BIÊN BẢN HỌP NHÓM (LẦN 2) I THỜI GIAN-ĐỊA ĐIỂM Thời gian: 14h30, ngày 30/11/2023 Địa điểm: Thư viện tòa P trường Đại học Thương Mại II THÀNH PHẦN THAM DỰ (5/5) Nguyễn Thị Nhung Huyền (Nhóm trưởng), Triệu Phúc Hương, Nguyễn Trung Kiên, Lê Thị Lan, Đinh Thị Mai Linh III NỘI DUNG CUỘC HỌP Nhóm trưởng thiếu sót thảo luận, đưa hướng giải vấn đề Các thành viên cho ý kiến tiến hành hoàn thiện thảo luận Thuyết trình thử chuẩn bị quay video thuyết trình thức IV KẾT LUẬN CUỘC HỌP Các thành viên tham gia đầy đủ, tích cực đóng góp ý kiến cho thảo luận nhóm Cuộc họp diễn suôn sẻ kết thúc vào 23h30 ngày 30 tháng 11 năm 2023 Thư ký Nhóm trưởng (Ký, ghi rõ họ tên) (Ký, ghi rõ họ tên) Lan Huyền Lê Thị Lan Nguyễn Thị Nhung Huyền MỤC LỤC MỞ ĐẦU CHƯƠNG CƠ SỞ LÝ THUYẾT 1.1 Machine Learning .9 1.1.1 Định nghĩa 1.1.2 Một số phương thức Machine Learning .9 1.2 Bài toán phân lớp liệu 11 CHƯƠNG THUẬT TOÁN CÂY QUYẾT ĐỊNH .13 2.1 Giới thiệu chung .13 2.2 Khái niệm định 13 2.3 Các kiểu định 14 2.4 Ví dụ kinh điển .14 2.5 Các tiêu chí phân tách .17 Gini impurity 17 Entropy .17 2.6 Các bước dựng 18 2.7 Một số thuật toán dựng .18 2.8 Ưu, nhược điểm thuật toán .18 CHƯƠNG 3: BỘ DỮ LIỆU IRIS VÀ MƠ TẢ BÀI TỐN 20 3.1 Bộ liệu Iris flower dataset 20 3.1.1 Giới thiệu 20 3.1.2 Sử dụng tập liệu 21 3.1.3 Tập liệu 22 3.2 Mơ tả tốn 30 KẾT LUẬN 38 TÀI LIỆU THAM KHẢO 39 MỞ ĐẦU Đặt vấn đề Những năm gần đây, AI lên chứng cách mạng cơng nghiệp lần thứ tư Trí tuệ nhân tạo định nghĩa nghành khoa học máy tính liên quan đến việc tự động hóa hành vi thơng minh Trí tuệ nhân tạo phận khoa học máy tính phải đặt nguyên lý lý thuyết vững chắc, có khả ứng dụng lĩnh vực Ở thời điểm tại, thuật ngữ thường dùng để nói đến máy tính có mục đích khơng định ngành khoa học nghiên cứu lý thuyết ứng dụng trí tuệ nhân tạo Theo đà phát triển công nghệ, ứng dụng trí tuệ nhân tạo ln xu hướng công nghệ tương lai mà hãng công nghệ tồn giới đua sáng tạo, tảng cốt lõi cuốc cách mạng công nghệ 4.0 ML (Machine Learning) lĩnh vực trí tuệ nhân tạo, sinh từ khả nhận diện mẫu từ lý thuyết máy tính học mà khơng cần phải lập trình để xử lý nhiệm vụ cụ thể Hầu hết nghành công nghiệp làm việc với hàm lượng lớn liệu nhận tầm quan trọng công nghệ ML Những nhìn sáng suốt từ nguồn liệu – chủ yếu dạng thời gian thực – giúp tổ chức vận hành hiệu tạo lợi cạnh tranh so với đối thủ Các ứng dụng ML quen thuộc với người: xe tự hành Google Tesla, hệ thống tự tag khuôn mặt Facebook, hệ thống gợi ý sản phẩm Amazon, hệ thống gợi ý phim Netflix…, vài ứng dụng trí tuệ nhân tạo cụ thể ML Document continues below Discover more from: sở lập trình INFO2311 Trường Đại học… 49 documents Go to course sở liệu quản lý 61 bán hàng sở lập trình 93% (27) Gtrinh OOP - abc 165 sở lập trình 100% (1) Bài tập lập trình hướng đối tượng vớ… sở lập trình 100% (1) Bai tap ve so khoi, viet chuong trinh… sở lập trình None tập python thực hành sở lập trình None Bài tập Cơ sở lập trình sở lập trình None Hình Mối quan hệ AI.Machine Learning Deep Learning Xu hướng phát triển công nghệ thông tin ngày tăng, song song với lượng liệu sinh ngày lớn Vì nhu cầu để xử lý liệu lớn hơn, ML góp phần giải vấn đề Một thuật tốn thường dùng ML thuật tốn Cây định (Decision Tree) Ứng dụng thuật toán thường sử dụng nghiên cứu hoạt động , đặc biệt phân tích định , để giúp xác định chiến lược có nhiều khả đạt mục tiêu Mục đích nghiên cứu  Nghiên cứu, tìm hiểu lý thuyết thuật tốn Cây định (Decision Tree)  Đánh giá thuật toán Phạm vi đối tượng nghiên cứu  Phạm vi nghiên cứu: Thử nghiệm Iris flower dataset  Đối tượng nghiên cứu: Thuật toán Cây định Iris flower dataset Nội dung thực  Tìm hiểu thuật tốn Cây định (Decision Tree)  Tìm hiểu liệu Iris  Sử dụng liệu đánh giá Cấu trúc báo cáo  Mở đầu  Chương 1: Cơ sở lý thuyết  Chương 2: Thuật toán Cây định (Decision Tree)  Chương 3: Bộ liệu Iris Mô tả toán  Chương 4: Kết luận CHƯƠNG CƠ SỞ LÝ THUYẾT 1.1 Machine Learning 1.1.1 Định nghĩa  Là lĩnh vực trí tuệ nhân tạo liên qua đến việc nghiên cứu xây dựng kĩ thuật cho phép hệ thống học tự động từ liệu để giải vấn đề cụ thể Ví dụ máy học cách phân loại thư điện tử có phải thư rác hay không tự động xếp vào thư mục tương ứng  Machine Learning có liên quan đến thống kê hai lĩnh vực nghiên cứu việc phân tích liệu, khác với thống kê, học máy tập trung vào phức tạp giải thuật việc thực thi tính tốn  Machine Learning có áp dụng rộng rãi bao gồm máy truy tìm liệu, máy phân tích thị trường chứng khốn, nhận dạng tiếng nói chữ viết… 1.1.2 Một số phương thức Machine Learning  Học có giám sát: Thuật toán dự đoán đầu liệu (new input) dựa cặp (input, outcome) biết từ trước Cặp liệu gọi (data, label), tức (dữ liệu, nhãn) Supervised learning nhóm phổ biến thuật tốn Machine Learning - Học có giám sát chia thành hai loại chính: + Classification (phân lớp): Là q trình phân lớp đối tượng liệu vào hay nhiều lớp cho trước nhờ mơ hình phân lớp (model) Mơ hình xây dựng dựa tập liệu xây dựng trước có gán nhãn (hay gọi tập huấn luyện) Quá trình phân lớp trình gán nhãn cho đối tượng liệu

Ngày đăng: 30/01/2024, 05:11

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w