HỒ CHÍ MINH TRƯỜNG CÔNG NGHỆ VÀ THIẾT KẾ KHOA CÔNG NGHỆ THÔNG TIN KINH DOANH BỘ MÔN CÔNG NGHỆ THÔNG TIN BÁO CÁO ĐỒ ÁN HỌC PHẦN KHOA HỌC DỮ LIỆU Đề tài: Ứng dụng khoa học dữ liệu vào dự
Trang 1ĐẠI HỌC KINH TẾ TP HỒ CHÍ MINH TRƯỜNG CÔNG NGHỆ VÀ THIẾT KẾ KHOA CÔNG NGHỆ THÔNG TIN KINH DOANH
BỘ MÔN CÔNG NGHỆ THÔNG TIN
BÁO CÁO ĐỒ ÁN HỌC PHẦN
KHOA HỌC DỮ LIỆU
Đề tài: Ứng dụng khoa học dữ liệu vào dự báo giá
nhà ở
GVHD: TS.GVC Nguyễn Quốc Hùng
Nhóm thực hiện: 3
TP Hồ Chí Minh, Tháng 9/2024
Trang 2MỤC LỤC
Chương 1: GIỚI THIỆU VỀ KHOA HỌC DỮ LIỆU VÀ GIỚI THIỆU ĐỀ TÀI 8
Chương 2: TỔNG QUAN VỀ CHƯƠNG TRÌNH SỬ DỤNG VÀ CÁC PHƯƠNG PHÁP SỬ
Chương 3: ỨNG DỤNG PHƯƠNG PHÁP VÀO BÀI TOÁN THỰC TẾ 10
2
Báo cáo đồ án học phần Khoa học dữ liệu (DS)
Trang 3DANH MỤC HÌNH ẢNH.
Trang 4DANH MỤC BẢNG BIỂU.
4
Báo cáo đồ án học phần Khoa học dữ liệu (DS)
Trang 5DANH MỤC TỪ VIẾT TẮT.
Trang 6Lời mở đầu.
6
Báo cáo đồ án học phần Khoa học dữ liệu (DS)
Trang 7BẢNG PHÂN CÔNG CÁC THÀNH VIÊN
hoàn thành
1 Trần Phạm Vân Anh
(Trưởng nhóm)
Mô tả tính năng phần mềm Orange
Phân lớp dữ liệu
Dự báo dữ liệu Thống kê mô tả dữ liệu Kết luận và hướng phát triển
100%
2 Huỳnh Thị Việt Trâm
Phương pháp thống kê
mô tả
Lý thuyết phân lớp dữ liệu
Thống kê mô tả dữ liệu Phân lớp dữ liệu
100%
dự báo
Lý thuyết phân cụm dữ liệu
Thống kê mô tả dữ liệu
Dự báo dữ liệu
100%
4 Nguyễn Thị Kim Hoa 88234020303
Phương pháp phân tích tối ưu
Lý thuyết phân lớp dữ liệu
100%
Trang 8Thống kê mô tả dữ liệu Phân lớp dữ liệu
Đánh giá kết quả đề tài
dữ liệu
Lý thuyết phân cụm dữ liệu
Thống kê mô tả dữ liệu Phân lớp dữ liệu
100%
8
Báo cáo đồ án học phần Khoa học dữ liệu (DS)
Trang 9Chương 1: GIỚI THIỆU VỀ KHOA HỌC DỮ LIỆU VÀ GIỚI
THIỆU ĐỀ TÀI
Nội dung chương này, mô tả về các kiến thức tổng quan về khoa học dữ liệu và đề tài của nhóm bao gồm:…
1.1 Tổng quan về Khoa học dữ liệu
< Bổ sung nội dung>
1.1.1 Mục lớn cấp 2
< Bổ sung nội dung>
1.1.1.1 Mục lớn cấp 3
< Bổ sung nội dung>
Hình 1.1 Logo công ty ARON
Bảng 2.3 Bảng liệt kê sự kiện phát sinh các quy trình nghiệp vụ
ST
1 Cần tạo bảng giá Khi cần tạo bảng giá mới Khi cần
2
Cần khai báo giá
cho mặt hàng mới
tạo
Khi cần thêm một mặt hàng mới vào hệ thống vào các bảng giá đang được sử dụng Khi cần
3 Cần tạo đơn bán hàng Khi cần tạo đơn bán hàng Khi cần
4 Cần trả hàng Khi cần trả hàng Khi cần
Trang 10Báo cáo đồ án học phần Khoa học dữ liệu (DS)
Trang 11Chương 2: TỔNG QUAN VỀ CHƯƠNG TRÌNH SỬ DỤNG VÀ
CÁC PHƯƠNG PHÁP SỬ DỤNG
Nội dung chương này, trình bày về tổng quan về chương trình sử dụng và các phương pháp sử dụng đến đề tài bao gồm:…
< Cấu trúc mục, tiểu mục, hình ảnh, bảng biểu như Chương 1>
Ví dụ về trích dẫn tài liệu tham khảo
-Đề xuất định hướng đầu tư hạ tầng ảo hóa và ứng dụng điện toán đám mây trong ngành Tài
nguyên và Môi trường Ngoài ra, công nghệ ảo hóa được tổng hợp trong nghiên cứu “Ứng
dụng công nghệ ảo hóa trong việc tối ứu hóa cơ sở hạ tầng công nghệ thông tin” của (Hồ
Văn Ngọc, 2017) đã trình bày một số ứng dụng về công nghệ ảo hóa như ảo hóa Server, ảo hóa hạ tầng mạng, ảo hóa desktop, ảo hóa các ứng dụng, ảo hóa hệ thống lưu trữ, công nghệ
ảo hóa điện toán đám mây Từ đó đưa ra giải pháp và mô hình ứng dụng phù hợp cơ sở hạ tầng công nghệ thông tin dựa trên công nghệ ảo hóa (Vmwave Vsphere)
Trên thế giới, một số công nghệ ảo hóa hệ thống tính toán được áp dụng ở nhiều nơi trên thế giới như nghiên cứu của (Bhanage và cộng sự, 2011) về việc đánh giá thử nghiệm công nghệ ảo hóa OpenVZ (Open Virtuozzo) từ góc độ triển khai nhận xét rằng OpenVZ là một hệ thống công nghệ ảo hóa hoạt động dựa trên nhân Linux OpenVZ cho phép một máy chủ vật lý để chạy nhiều trường hợp hệ điều hành riêng biệt, được gọi là container, máy chủ riêng ảo (VPSS), hoặc môi trường ảo (VES)
Tổng quan về chương trình sử dụng và các phương pháp sử dụng Ví dụ như phần mềm Orange, thuật toán SVM, Tree, Logistic Regression, K-Means, …
Trang 12Chương 3: ỨNG DỤNG PHƯƠNG PHÁP VÀO BÀI TOÁN
THỰC TẾ
Nội dung chương này, trình bày tất cả vấn đề về ứng dụng phương pháp lựa chọn vào bài toán thực tế gồm:…
< Cấu trúc mục, tiểu mục, hình ảnh, bảng biểu như Chương 1>
12
Báo cáo đồ án học phần Khoa học dữ liệu (DS)
Trang 13Chương 4: ĐÁNH GIÁ KẾT QUẢ CỦA MÔ HÌNH
Nội dung chương này, trình bày các vấn đề đánh giá kết quả của mô hình bao gồm các nội dung:…
< Cấu trúc mục, tiểu mục, hình ảnh, bảng biểu như Chương 1>
Trang 14KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN
14
Báo cáo đồ án học phần Khoa học dữ liệu (DS)
Trang 15TÀI LIỆU THAM KHẢO
Bhanage, G., Seskar, I., Zhang, Y., Raychaudhuri, D., & Jain, S (2011) Experimental Evaluation of
OpenVZ from a Testbed Deployment Perspective, Berlin, Heidelberg
Hồ Văn Ngọc (2017) Ứng dụng công nghệ ảo hóa trong việc tối ưu hóa cơ sở hạ tầng công
nghệ thông tin Tạp chí Khoa học trường Đại học Văn Hiến, 5(5), 112–118.
Jin, Y., Wen, Y., & Chen, Q (2012) Energy efficiency and server virtualization in data
centers: An empirical investigation Paper presented at the 2012 Proceedings IEEE
INFOCOM Workshops doi: 10.1109/INFCOMW.2012.6193474
Khattar, R K., Murphy, M S., Tarella, G J., & Nystrom, K E (1999) Introduction to
Storage Area Network, SAN California: IBM Corporation, International Technical
Support Organization