1. Trang chủ
  2. » Luận Văn - Báo Cáo

Tiểu luận môn học deep learning trong khoa học dữ liệu dự Đoán phân lớp

40 0 0
Tài liệu được quét OCR, nội dung có thể không chính xác
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Tiểu Luận Môn Học Deep Learning Trong Khoa Học Dữ Liệu Dự Đoán Phân Lớp
Tác giả Phạm Văn Tài
Người hướng dẫn ThS. Sử Nhật Hạ
Trường học Trường Đại Học Nguyễn Tất Thành
Chuyên ngành Khoa Học Dữ Liệu
Thể loại tiểu luận
Năm xuất bản 2024
Thành phố Tp.HCM
Định dạng
Số trang 40
Dung lượng 2 MB

Nội dung

H Phương Pháp Nghiên Cứu: Sử dụng công cụ Power BI để phân tích và trực quan hóa dữ liệu từ bảng "foodsale", bao gồm các biểu đồ, bảng điều khién va bao cao... Là một công cụ trực quan h

Trang 1

NGUYEN TAT THANH

TIỂU LUẬN MÔN HỌC CHUYEN DE CHUYEN SAU KHOA HOC DU LIEU 2

TEN DO AN

Giang vién giang day: ThS Su Nhat Ha

Sinh viên thực hiện: Phạm Văn Tài

Chuyên ngành : KHOA HỌC DỮ LIỆU

Môn học : CHUYEN DE CHUYEN SAU KHOA HOC DU LIEU 2

Tp.HCM, ngay thang Nam 2024

Trang 2

NGUYEN TAT THANH

TIEU LUAN MON HOC DEEP LEARNING TRONG KHOA HOC DU LIEU

DU DOAN PHAN LOP

Giang vién giang day: ThS Su Nhat Ha

Sinh viên thực hiện: Phạm Văn Tài

Chuyên ngành : KHOA HỌC DỮ LIỆU

Môn học : CHUYEN DE CHUYEN SAU KHOA HOC DU LIEU 2

Tp.HCM, ngay thang Nam 2024

Trang 3

Tén dé tai: TEN

Giảng viên giảng day: ThS Sử Nhật Hạ

Thời gian thực hiện: 21/02/2024 đến //2024

Nhiệm vụ/nội dung (mô tả chỉ tiết nội dung, yêu cầu, phương pháp ):

Nội dung và yêu cầu đã được thông qua bộ môn

TP.HCM, ngay 28 thang 12 năm 2022

UL

Trang 4

Trong thời đại ngày nay

LOI MO DAU

Trang 5

LỜI CÁM ƠN

Với lòng biết ơn sâu sắc nhất, em xin gửi đến quý Thầy Cô ở Khoa Công Nghệ Thông Tin Trường Đại Học Nguyễn Tất Thành đã truyền đạt vốn kiến thức quý báu của quý thầy cô cho chúng em trong suốt thời gian học tập tại trường Nhờ có những lời hướng dẫn, dạy bảo của thầy cô nên đề tài dự đoán phân lớp lợi nhuận của apple dựa trên giá cô phiếu thành công tốt đẹp

Một lần nữa, em xin chân thành cảm ơn thầy Ths.Hồ Khôi- người đã trực tiếp giúp đỡ, quan tâm, hướng dẫn em hoàn thành tốt sản phẩm và bài báo cáo này trong thời gian qua Bài báo cáo của em còn hạn chế và còn nhiều bỡ ngỡ nên không tránh khỏi những thiếu sót, em rất mong nhận được những ý kiến đóng góp quý báu của quý Thầy đề kiến thức của em trong lĩnh vực này được hoàn thiện hơn đồng thời có điều kiện bô sung, nâng cao

ý thức và trình độ của mình của mình

Em xin chân thành cảm ơn các quý thầy cô rất nhiều!

Sinh viên thực hiện

Trang 6

BM-ChT-

TRUONG DAI HOC NGUYEN TAT THANH

TRUNG TÂM KHẢO THÍ

KY THI KET THUC HỌC PHAN HOC KY I NAM HOC 2022 - 2023

Đề tài tiêu luận/báo cáo của sinh viên:

PHIẾU CHAM THI TIEU LUAN/DO AN

M6n thi: Deep learning trong khoa học đữ liệu Lớp học phân:

Nhóm sinh viên thực hiện:

Giang vién cham thi

Trang 7

Giảng viên giảng dạy

(Ký tên và ghi rõ họ tên)

Trang 8

MỤC LỤC

CHƯƠNG I: GIỚI THIỆU 22-5-2251 E1122E1E711211111211 22212 8.20 E21Exerrrre 1 1.Giới thiệu 46 tab cece ccc ccc cecccscsssesssssessesseseessesscssessessessesseseesssssesessatsesesieseaesesevaeess 1

1.2.Lý do chọn đề tài c5 S211 1121121211211 1211 2n ng HH nen 1

1.3.Mục tiêu đề tài - c1 2111021222121 121g 1n tre 1

1.4 Phuong phap dé tai c.cccccccccccceccscescscessesessesscsessvescssesesecsevsvsecsevecevsvescevsvsesensesesetevees 1

1.5.Đối tượng và phạm vi nghiên cứu s5 tt E1 2E1E1121111 212111 1.211 tre 1

CHƯƠNG 2.ỨNG DỤNG VÀ THUẬTT TOÁN - + E2 2212112112121 eEerrriei 2

2.1Giới thiệu về ngôn ngữ lập trình python 55c SE SE tk Herre 2

2.2 Mô tả thuật toán - ác s1 E1112211 21222 E12 101221 ng ghe 2

CHƯƠNG 3.XÂY DỰNG ỨNG DỰNG NGÔN NGỮ PYTHON -s- se 3

3.1Xây dựng ứng dụng và giải thích 2c 21121111221 15211 1 1115115111115 21111 3 3.2 Tiến hành áp dụng thuật toán và chạy chương trình - 2s EctEEerererrre 3

KẾT LUẬN 2-51 2s 2122112112 2.212 2E 12t tt HH tt tt 21 ru 4

Hạn chế và hướng phát triển . 5 9S E1 E1 1121111 2112111 1E 111tr Hye 4

TÀI LIỆU THAM KHẢO - 5 56 1 E122112112211211212112112121 110121121 5

vill

Trang 9

DANH MỤC HÌNH

Hình I Tỷ lệ doanh thu của Apple theo theo danh mục sản phẩm trong Q4/2022 Hình 2 Câu trúc mạng nơ-ron nhân tạo(RNN)

Hình 3 Quy trình xử lý của mạng nơ ron nhân tạo

Hình 4 Mạng nơ ron hồi quy

Hình 5 Xử lý bên trong mạng nơ ron nhân tạo

Hình 6 Các phép tính toán trên một chuỗi

Hình 7 Bảng xếp hạng ngôn ngữ

Hình § : Guido van Rossum

Hình 9 Ví dụ cây quyết định về việc có nên mua laptop hay không

Hình 10 Ví đụ hồi quy Logistic

Hình I1 Ví dụ hồi quy tuyến tính

Hình 12 Mô hình RNN

Hình 13 Thống kê đoanh số bán hàng

Trang 10

ki HIEU CAC CUM TU VIET TAT

Trang 11

CHƯƠNG T1: GIỚI THIỆU 1.Giới thiệu đề tài

Đề tài này là về việc áp dụng công nghệ phân tích dữ liệu để khám phá và hiểu rõ hơn về hoạt động bán hàng thực phẩm Bằng việc sử dụng Power BI, chung ta sé phan tich dit liệu tir bang "foodsale" de xác định các xu hướng, mẫu số, và yếu tố ảnh hưởng đến doanh

số bán hàng Mục tiêu cuối cùng là tạo ra các báo cáo và biểu đồ trực quan đề hỗ trợ quyết định kinh doanh và tối ưu hóa hiệu suất kinh doanh trong ngành thực phẩm Đây là một

đề tài hấp dẫn và có tính ứng dụng cao, với tiềm năng mang lại những hiểu biết quan trọng và giá trị cho các doanh nghiệp hoạt động trong lĩnh vực này

1.2 Lý do chọn đề tài

Chủ đề về phân tích đữ liệu bán hàng thực phâm là một lựa chọn quan trọng và hấp dẫn vì

nhiều lý do sau:

quan trọng trong nền kinh tế Việc hiểu rõ hơn về hành vi mua sam và xu hướng tiêu dùng trong lĩnh vực này có thê giúp các doanh nghiệp tôi ưu hóa hoạt động kinh doanh của mình

H Thách Thức về Quản Lý Dữ Liệu: Ngành công nghiệp thực phẩm thường xuyên phải đối mặt với lượng dữ liệu lớn từ các giao dịch bán hàng Quản lý và phân tích

dữ liệu một cách hiệu quả là một thách thức đối với các doanh nghiệp trong ngành này

H Tiềm Năng Tối Ưu Hóa Doanh Số: Phân tích đữ liệu bán hàng thực phâm có thể giúp các doanh nghiệp xác định những cơ hội tối ưu hóa doanh số bán hàng, từ việc tôi ưu hóa cung cấp sản phẩm đến việc xác định các chiến lược giá cả và tiếp thị hiệu quả

1.3 Mục tiêu đề tài

Mục tiêu của đồ án bao gôm:

H Phân Tích Xu Hướng: Hiểu rõ hơn về các xu hướng và mẫu số trong doanh số bán hàng thực phẩm theo thời gian, khu vực, loại sản phẩm và các yêu tô khác

H Tối Ưu Hóa Doanh Số: Xác định các yếu tổ ảnh hưởng đến đoanh số bán hàng và

đề xuất các chiến lược tối ưu hóa đề tăng cường hiệu suất kinh doanh

trình bày thông tin một cách đễ hiểu và hấp dẫn

Trang 12

1.4 Phạm vi nghiên cứu

Pham vi của đồ án bao gôm:

H Nguồn Dữ Liệu: Sử dụng bảng dữ liệu "foodsale" chứa thông tin về giao dịch bán hàng thực phẩm

H Phương Pháp Nghiên Cứu: Sử dụng công cụ Power BI để phân tích và trực quan hóa dữ liệu từ bảng "foodsale", bao gồm các biểu đồ, bảng điều khién va bao cao

Trang 13

CHUONG 2: CO SO LY THUYET VA CONG NGHE

2.1 Power BI: Tổng quan

2.1.1 Khái niệm

Power BI viết tắt của Power Business Intelligence là bộ công cụ phân tích thông minh của Microsoft Là một công cụ trực quan hóa dữ liệu và là giải pháp phân tích kinh doanh, giúp chuyển đổi dữ liệu từ các nguồn khác nhau thành bảng điều khiển (Dashboard) và bao cao BI (Power BI Report) Power BI sẽ giúp bạn đưa ra những phân tích đữ liệu và ra

quyết định nhạn chóng thuận loi dé dang

Power BI gồm 3 ứng dụng:

H Power BI Desktop: dùng đề đưa dữ liệu vào và làm báo cáo

H Power BI App: dùng đề xem các báo cáo trên di động

Và ở đây chúng ta chủ yếu là sử dụng Power BI Desktop

Ngoài ra, Power BI giúp bạn kết nối và tập hợp đữ liệu từ nhiều hệ thống phần mềm cũng như đữ liệu riêng lẻ trên các ñles Excel, ñles text và các dạng đữ liệu khác, sau đó biến

đữ liệu này thành thông tin hữu ích cho doanh nghiệp của bạn thông qua việc trực quan hoá đữ liệu giúp các nhà quản lý đưa ra được những quyết định dựa trên sô liệu, giảm bớt

sự cảm tính, tập trung vào những yếu tô dẫn tới thành công của tô chức

Power BI giúp đưa ra quyêết định nhanh chóng Kết nôi, mô hình hóa và sau đó khám phá

dữ liệu của bạn với các báo cáo trực quan mà bạn có thê cộng tác, xuât bản và chia sẻ

3

Trang 14

Power BI tích hợp với các công cụ khác, bao gom Microsoft Excel, do đó bạn có thê tăng tốc nhanh chóng và làm việc liên mạch với các giải pháp hiện có của mình

Khởi tạo: Kết nối với dữ liệu của bạn bất cứ nơi nào Sau đó khám phá dữ liệu của bạn

với hình ảnh tương tác tuyệt đẹp

Hợp tác và chia sẻ: Xuât bản báo cáo và bảng điêu khiến, cộng tác với nhóm của bạn và chia sẻ những hiệu biết bên trong và bên ngoài tô chức của bạn làm việc

Truy cập thông tin ở bắt cứ nơi đâu: Bạn có thể đễ dàng xem thông tin ở cả máy tính và ở

chiệc điện thoại thông mình có cai Power Bi mobile

2.1.3 Ứng dụng thực tế về phân tích kinh doanh với Power BI

Power BI hỗ trợ Dự án Đôi mới Công dân thúc đây sứ mệnh hỗ trợ các thành phố trên khắp thế giới hoạt động tốt hơn với dữ liệu và biến sự minh bạch trở thành một phần của quản trị hàng ngày Nó hỗ trợ Dự án Đổi mới Công dân dạy cho các nhà lãnh đạo cách công nghệ dân sự có thể tích hợp quy trình ra quyết định dựa trên dữ liệu vào công việc hàng ngày tác động đến công dân và thu hút họ tìm hiểu về cộng đồng của họ

H Tương tác trực quan, đễ dàng tích hợp với các phần mềm tin học khác

Power BI mang lai giá trị lớn nhơ # khả năng trực quan hoàn hao va Dashboard điều khién tương tác đem lại cái nhìn toàn cánh về hiệu suất của doanh nghiệp Nhằm hỗ trợ các chuyên gia phân tích, Power BI cung cấp Dashboard miễn phí đề điều hướng “kéo và thả” đữ liệu theo mong muốn, cùng kho thư viện trực quan khống lồ cho phép tạo những báo cáo lớn một cách đơn giản và trích xuất cực nhanh

Power BI có thê cùng lúc trích xuất dữ liệu từ hàng chục file Excel và rất nhiều phan mém khac

Nếu muốn sở hữu những bản báo cáo đẹp mắt, sinh động, bạn hoàn toàn có thê tin tưởng Power BI Nằm trong d}ng sản phẩm doanh nghiệp của hãng Microsoft, Power BI tich hợp chặt chẽ với các sản phẩm lưu trữ thông tin phổ biến khác của Microsoft như Microsoft Excel, Azure và SQL Server cùng các giải pháp quản lý của Microsoft gồm Microsoft Flow (quản lý quy trình) và Microsoft Dynamics (giải pháp ERP)

[L1 Truy cập không giới hạn vào đữ liệu cục bộ và đữ liệu đám mây

oO

Trang 15

Power BI có thể thực hiện data mashup, kết hợp đữ liệu từ nhiều nguồn khác nhau và phântích dữ liệu bán cấu trúc (semi-structured data) Nó giúp người dùng tập trung lưu trữ tất cả thông tin cục bộ và dữ liệu đám mây, nhờ đó, người dùng có thẻ truy cập liền mạch mọi lúc, mọi nơi, không bị giới hạn không gian và thời gian làm việc Bạn cũng có thể sử dụng các liên kết đã được xây dựng trước đề cải thiện khâu nhập liệu từ các giải pháp như Marketo, Salesforce, Google Analytics Power BI cé thê kết nối được với mọi loại hình kho lưu trữ đữ liệu tại chỗ khác nhau như SQL Server, Oracle hoặc Hadoop Đối với kho lưu trữ điện toán đám mây như Google BigQuery hay Azure, Power BI có sẵn các trình kết nối được nhà phát triển xây dựng trướcnhằm tạo nên trải nghiệm đa nhiệm nhất

O Power BI cho phép truy cập báo cáo và dashboards ngay lập tức

Power BI cho phép bạn chia sẻ thông tin đữ liệu và báo cáo với người khác, không bị phụ thuộc vào điều kiện địa lí, thời gian hay thiết bị Hệ thông này cũng có tính linh hoạt vì nó hoạt động với các hệ điều hành hàng đầu — Windows, iOS và Android Khi những người

có quyền truy cập tiến hành chỉnh sửa, cập nhật dữ liệu, hệ thống sẽ thông báo ngay đến

chủ sở hữu đề nhanh chóng phân tích kịp thời

Hình 1: Cho phép truy cập bdo cdo va dashboar cua Power BI

Power BI là hệ thống đa nền tảng, đa thiết bi

LI Tích hợp không giới hạn với ứng dụng của bên thứ ba

Các nhà phát triển Microsoft Power BI dam bao rang hé thong có the được tích hợp trong bắt kỳ hệ sinh thái phần mềm nào Nhờ đó, Power BI có thê kết nối với rất nhiều phần

mềm và công cụ phô biến của bên thứ ba Hiện tại, Microsoft vẫn liên tục nghiên cứu mở

rộng khả năng kết nối của hệ thống này, cho phép người dùng nhập thêm nhiều cơ sở đữ

liệu và nguôn đữ liệu

O Chia sẻ an toàn các báo cáo và phân tích dữ liệu

Người dùng có thể xuất các báo cáo trực quan trực tiếp lên mạng Internet và gửi qua emailcho những người liên quan Dé dam bao an ninh, chúng ta có thê thiết lập giới hạn quyền truy cập vào báo cáo hoặc thiết lập các vùng đữ liệu đặc thù, chỉ cho phép những

5

Trang 16

Minh chỉ có thê xem dữ liệu bán hàng tai chi nhánh của mình, trong khi Giảm độc kinh

doanh có thê xem dữ liệu bán hàng trên toàn quốc

L Khả năng mô hình hóa dữ liệu

Mô hình hóa dữ liệu là một trong những chức năng được sử dụng đề kết nối nhiều nguồn

dữ liệu trong phần mềm Power BI, bằng các mối liên kết nhằm chỉ ra các nguồn dữ liệu

có mối liên hệ với nhau ra sao Nhờ đó, những bản báo cáo giữa các phòng ban sẽ không con roi rac ma mang tinh thong nhất, tông thé

Với chức năng mô hình hóa đữ liệu, bạn có thể tạo các tính toán tùy chỉnh trên những

Dashboard hiện có Kết quả tính toán sẽ được trình bày trực tiếp trong các báo cáo quản trirực quan Tính chất này của Power BI phù hợp với tất cả các lĩnh vực kinh doanh, trong hoạt động vận hành cũng như quản lý hiệu suất nhân viên, kiêm soát dòng tiền có thê áp dụng để xây dựng mọi mẫu báo cáo quản trị trong tất cả doanh nghiệp, phòng ban

O Thém nguồn dữ liệu

Power BI có thê kết nối với hơn 60 giải pháp phổ biến mà ngày nay các công thường sử dụng, ví dụ như Spark, Hadoop, SAP Người dùng không phải mô hình hóa dữ liệu trong

hệ thống nguồn, mà dữ liệu có thê được tích hợp trực tiếp với phần mềm Power BI

H Không đòi hỏi phải có kiến thức lập trình

Đối với những ai thường xuyên phải thực hiện nhiệm vụ phân tích theo yêu cầu cụ thể, Power BI chính là nên tảng giúp bạn làm công việc hàng ngày một cách đơn giản, dễ dàng, thực hiện phân tích, tính toán nhanh, khả năng hiển thị lớn giup tiết kiệm thời gian Khác với nhiều phần mềm quản trị, bạn không cân thiết phải có kiến thức lập trình đề làm VIỆC VỚI công cụ này

Với màn hình trực quan và bộ công cụ đa nhiệm, Power BI không đòi hỏi người dùng

phải có kiên thức lập trình đề phân tích đữ liệu

H' Tài liệu hướng dẫn sử dụng sẵn có:

Hầu hết ngươ 1# ¡ dùng Việt Nam đã quá quen với giao diện của Microsoft, do đó sẽ nhanh chóng làm quen với Power BI mà không mắt quá nhiều thời gian Dé hỗ trợ người dùng tìm ra giải pháp làm việc tốt nhất, ông lớn công nghệ cung cung cấp sẵn rất nhiều bản chỉ dẫn, video, bài viết nhằm tối đa hóa tiềm năng công cụ

H Khá năng tìm kiếm thông minh:

Chức năng tìm kiếm théng minh Q&A cua Power BI la mét trong những tiện ích noi trội,

thường xuyên được nhắc đến nhất Với chức năng này, ngươ !#¡ dùng có thê đưa ra những câu hỏi tự nhiên như khi đang “search” trên các nền tảng tìm kiếm Google, Edge, Cốc Cốc và xem kết quả, biểu đồ liên quan đến truy vấn Tiện ích này cho phép quét cácthông tin an chi trong vai giây, thậm chí có thể chỉ ra được mối tương quan, các trường hợp ngoại lệ hoặc cho thấy xu hướng

Trang 17

2.1.4 Cài đặt Power BI

H Bước l1: Nhân vào Search (biểu tượng kính lúp) ở bên góc trái màn hình máy tính ở thanh taskbar

H Bước 2: Nhập vào mục tìm kiếm là “Microsoft Store” và nhân đề mở ứng dụng lên

H Bước 3: Sau khi nhân vào sẽ mở ra cửa sô của Microsoft Store, trên ô tìm kiêm năm ở vị trí giữa phía trên màn hình, nhân vào tìm kiêm Power BI Desktop

Trang 18

H Bước 4: Nhân vào đề suất hiển thị ra và tải xuống (nhân “Try #ee” sau khi mở nhé!)

2.1.5 Giao diện Power BI

Phần 1: Tab làm việc gồm File, Home, View Modeling va Help: chứa đựng tất cả các chức

năng phô biến nhất của chương trình

Phần 2: Cửa số Fields và Visualizations: Eields chứa danh sách của tất cả các bảng đữ liệu đã

load lên đề xây dựng biêu đồ Visualizations: chứa tất cả các kiểu biểu đồ Phần này nằm bên

phải của giao diện Power BÌ

Trang 19

Phần 3: Lựa chọn giao diện làm việc (Quicklaunch), phan nay nằm bên trái của giao điện

— Report: dùng đề xem và cho xây dựng biêu đồ

Trang 20

— Data: dùng để xem thông tin chỉ tiết bảng dữ liệu (bao gồm các cột, dòng thông tin)

— Relationships: quản lý quan hệ ràng buộc giữa các bảng

10

Ngày đăng: 14/12/2024, 22:43

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN