(TIỂU LUẬN) CHỦ đề phân tích giá nhà ở

21 18 0
(TIỂU LUẬN) CHỦ đề phân tích giá nhà ở

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

PHÂN HIỆU ĐẠI HỌC THỦY LỢI KHOA : CÔNG NGHỆ THƠNG TIN CHỦ ĐỀ: Phân Tích Giá Nhà Ở Mơn: Dữ liệu lớn – Big Data Giảng viên: Nguyễn Thanh Bình Lớp: S21-60TH1 Thành viên nhóm: Nguyễn Yến Linh Lê Văn Kiên Bùi Tiến Dũng Nội dung : Mơ tả tốn Các thuật toán áp dụng Đánh giá Kết luận Mơ tả tốn • Mục đích dùng thuật tốn để nhận diện logo xe • Dự báo xác hang xe cung cấp liệu • Các phân tích đa chiều đưa giả thuyết sàng lọc yếu tố/dữ liệu bị “nhiễu” để xác định thông số thực quan trọng File liệu: Nguồn Số lượng mẫu Dữ liệu Tập liệu Được lấy từ trang cung cấp liệu https://www.kaggle.com/datasets/ meowmeowmeowmeowmeow/gtsrb-german-trafficsign?select=Train 50000 hình ảnh Đã xử lý làm Có 43 lớp File liệu Các thuật tốn áp dụng Decision Tree Random Forest Mơi trường lập trình: Kaggle Ngơn ngữ lập trình: Python Các thư viện sử dụng: Sơ lược Học máy - Machine learning Thuật toán Bayes (Nalve Bayes) Cây định (Decision Tree) Phân lớp (Classification) Rừng ngẫu nhiên (Random forest) Giám sát (Supervised) Không giám sát (Unsupervised) Hồi quy (Regression) Học máy – Machine learning Tăng cường (Reinforcement) Cây định (Decision Tree) Bán giám sát (Semi –Supervised) Thuật toán định ID3 _ Cây định (Decision Tree) phân cấp có cấu trúc dùng để phân lớp đối tượng dựa vào dãy luật Cây định mơ hình supervised learning Classification (Phân lớp) Regression (Hồi quy) 10 Triển khai thuật toán Biểu đồ hệ số tương quan thuộc tính 11 Load data Tiến hành xây dựng định 12 Vẽ định 13 Biểu đồ thể thuộc tính 14 Giới thiệu thuật toán Random forest _ Rừng ngẫu nhiên (Random Forest) tạo khu rừng cách chọn thuộc tính cách ngẫu nhiên _ Nó thuật tốn sử dụng nhiều nhất, tính đơn giản thực tế 15 Triển khai thuật toán 16 Biểu đồ thể thuộc tính 17 Đánh giá kết Decision Tree • Thuật tốn dễ hiểu • Xử lý phân lớp hồi quy • Đạt tỉ lệ xác cao: 90% Random Forest • Thuật toán phức tạp • Xử lý phân lớp hồi quy • Đạt tỉ lệ xác cao: 80% 18 Kết Luận Nhóm em có số kết  Tìm hiểu khai phá liệu, cách triển khai, cài đặt, khái niệm, ưu nhược điểm thuật toán Decision Tree, Random Forest hỗ trợ phân loại giá nhà đất  Sử dụng liệu mơi trường lập trình Kaggle Notebook, ngôn ngữ Python thư viện mà ngơn ngữ Python cung cấp để triển khai thuật tốn cách thuận lợi Vẽ biểu đồ thể cách trực quan  So sánh kết tỷ lệ train test để lựa chọn tỷ lệ đánh giá mơ hình tốt 19 TÀI LIỆU THAM KHẢO ❏ https://ichi.pro/vi/huong-dan-don-gian-ve-thuat-toan-adaboost -trong-hoc-may-ky-thuat-lap-rap-72385685189703 (truy cập 6/10/2021) ❏ https://benh.edu.vn/adaboost-la-gi/?fbclid=IwAR3FNZRzFQp ocL48w6hCLNkqE7pyiSuQvBgf7lJpdhkxhGsUcLjiLX5xQNo (truy cập 6/10/2021) ❏https://filegi.com/tech-term/adaboost-10317/ (truy cập 6/10/2021) ❏ https://helpex.vn/article/thuat-toan-adaboost-cho-may-hoc-5c 664949ae03f60128765c2e (truy cập 6/10/2021) 20 Thank you! 21 ... Mơ tả tốn Các thuật tốn áp dụng Đánh giá Kết luận Mơ tả tốn • Mục đích dùng thuật tốn để nhận diện logo xe • Dự báo xác hang xe cung cấp liệu • Các phân tích đa chiều đưa giả thuyết sàng lọc... Thuật toán Bayes (Nalve Bayes) Cây định (Decision Tree) Phân lớp (Classification) Rừng ngẫu nhiên (Random forest) Giám sát (Supervised) Không giám sát (Unsupervised) Hồi quy (Regression) Học máy... (Reinforcement) Cây định (Decision Tree) Bán giám sát (Semi –Supervised) Thuật toán định ID3 _ Cây định (Decision Tree) phân cấp có cấu trúc dùng để phân lớp đối tượng dựa vào dãy luật Cây định

Ngày đăng: 06/12/2022, 15:25

Hình ảnh liên quan

Số lượng mẫu 50000 hình ảnh - (TIỂU LUẬN) CHỦ đề phân tích giá nhà ở

l.

ượng mẫu 50000 hình ảnh Xem tại trang 5 của tài liệu.
File dữ liệu: - (TIỂU LUẬN) CHỦ đề phân tích giá nhà ở

ile.

dữ liệu: Xem tại trang 5 của tài liệu.
Thuật toán cây quyết định ID3 - (TIỂU LUẬN) CHỦ đề phân tích giá nhà ở

hu.

ật toán cây quyết định ID3 Xem tại trang 10 của tài liệu.
_ Cây quyết định (Decision Tree) là một cây phân cấp có cấu trúc được dùng để phân lớp các đối tượng dựa vào dãy các luật. - (TIỂU LUẬN) CHỦ đề phân tích giá nhà ở

y.

quyết định (Decision Tree) là một cây phân cấp có cấu trúc được dùng để phân lớp các đối tượng dựa vào dãy các luật Xem tại trang 10 của tài liệu.
 So sánh kết quả tỷ lệ train và test để lựa chọn tỷ lệ đánh giá mơ hình tốt nhất. - (TIỂU LUẬN) CHỦ đề phân tích giá nhà ở

o.

sánh kết quả tỷ lệ train và test để lựa chọn tỷ lệ đánh giá mơ hình tốt nhất Xem tại trang 19 của tài liệu.

Tài liệu cùng người dùng

Tài liệu liên quan