1. Trang chủ
  2. » Luận Văn - Báo Cáo

(Tiểu Luận) Môn Quản Trị Cơ Sở Dữ Liệu Đề Tài Phân Tích Và Gợi Ý Giá Laptop Cho Người Dùng.pdf

42 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Phân tích và gợi ý giá laptop cho người dùng
Tác giả Nguyễn Thị Như Bình, Nguyễn Thị Giang, Lê Thị Mỹ Linh, Nguyễn Lê Hoàng Như, Trương Thị Kiều Vân
Người hướng dẫn GV. Cao Thị Nhâm
Trường học Trường Đại Học Kinh Tế Đà Nẵng
Chuyên ngành Quản Trị Cơ Sở Dữ Liệu
Thể loại Tiểu Luận
Thành phố Đà Nẵng
Định dạng
Số trang 42
Dung lượng 6,76 MB

Nội dung

Trực quan hóa dữ liệu- Mối quan hệ giữa Company và Price Nhìn vào đồ thị ta có thể thấy: Hãng Dell chiếm số lượng bán ra gần như vượttrội so với các dòng Laptop khác vì nổi tiếng với sự

Trang 1

TRƯỜNG ĐẠI HỌC KINH TẾ ĐÀ NẴNG KHOA THƯƠNG MẠI ĐIỆN TỬ

MÔN: QUẢN TRỊ CƠ SỞ DỮ LIỆU

ĐỀ TÀI:

Phân tích và gợi ý giá laptop cho người dùng

Giảng viên hướng dẫn : GV Cao Thị Nhâm

Nhóm: 5

Sinh viên thực hiện:

1 Nguyễn Thị Như Bình (nhóm trưởng)

2 Nguyễn Thị Giang

3 Lê Thị Mỹ Linh

Trang 2

MỤC LỤC

I MỞ ĐẦU

1 Lý do chọn đề tài

2 Chủ đề và mục đích phân tích

II PHÂN TÍCH DỮ LIỆU

1 Thu thập dữ liệu

2 Quy trình xây dựng cơ sở dữ liệu trên Azure

2.1 Đăng ký Azure

2.2 Tạo database và cấu hình database sử dụng

2.3 Kết nối tới SQL Server

3 Mô tả dữ liệu

4 Tiền xử lý dữ liệu với ngôn ngữ SQL

4.1 Xóa dữ liệu không dùng

4.2 Xử lý dữ liệu null

4.3 Kiểm tra và loại bỏ dữ liệu trùng

4.4 Tách lấy giá trị cần dùng

4.5 Chuyển đổi dữ liệu

4.6 Xóa cột không cần thiết và các ký tự đặc biệt

5 Back up dữ liệu vừa tiền xử lý

6 Trực quan hóa dữ liệu

III XÂY DỰNG MÔ HÌNH GỢI Ý GIÁ

1 Tổng quan về mô hình

1.1 Các mô hình dự báo nghiên cứu

1.2 Chỉ số đánh giá mô hình

1.3 Xử lý dữ liệu trước khi đưa vào mô hình

2 Xây dựng hệ thống gợi ý giá laptop cho người dùng

2.1 Linear Regression

2.2 Random Forest

2.3 Bagging

3 Kết quả và đánh giá

IV HỆ THỐNG ĐỀ XUẤT GIÁ LAPTOP

1 Flask Python

2 Build App

V KẾT LUẬN

Trang 3

I MỞ ĐẦU

1 Lý do chọn đề tài

Nền kinh tế Việt Nam trong những năm thế kỷ 21 đã ngày càng hội nhập vớinền kinh tế thế giới Khi mà Việt Nam đã gia nhập WTO và Việt Nam vàCPTTP vào cuối năm 2019 với hơn 13 hiệp định thương mại tự do FTA, đây lànhững cơ hội thuận lợi cho các doanh nghiệp Việt Nam phát triển đặc biệt là hệthống Doanh nghiệp thương mại của Việt Nam có điều kiện đẩy mạnh pháttriển Song môi trường hội nhập cũng nhiều rủi ro thách thức đối với doanhnghiệp Việt Nam, sự cạnh tranh quyết liệt trong ngành chọn mua tiêu dùng thiết

bị điện tử nói chung và máy tính Laptop nói riêng với nhiều đối thủ là doanhnghiệp nước ngoài với tiềm lực về vốn và kinh nghiệm quản lý sẽ là đối thủcạnh tranh trực tiếp đối với doanh nghiệp trong nước của Việt Nam Do đó màviệc mở rộng phát triển sản phẩm điện tử như Laptop được các doanh nghiệptrong ngành điện tử tiêu dùng tại Việt Nam coi là chìa khóa thành công để nângcao năng lực và mở rộng quy mô Doanh nghiệp nhằm cạnh tranh doanh nghiệpnước ngoài

Là quốc gia đông dân thứ 15 trên thế giới, Việt Nam với dân số hơn 97 triệungười là một thị trường Đông Nam Á nhiều tiềm năng Với tỷ lệ tăng dân sốhằng năm là hơn 1%, là quốc gia đang phát triển với nhu cầu tiêu dùng nóichung và tiêu dùng Laptop nói riêng ở mức cao Đây là cơ hội rất thuận lợi chocác doanh nghiệp điện máy phát triển mở rộng thị trường thu hút khách hàng.Tuy nhiên để thu hút được khách hàng thì các doanh nghiệp điện máy cần quantâm đến quyết định của khách hàng khi chọn mua Laptop Với lý do đó, nhóm

em chọn đề tài “Phân tích và gợi ý giá laptop cho người dùng” để làm báo cáo

2 Chủ đề và mục đích phân tích

- Chủ đề tìm hiểu: “Phân tích và gợi ý giá laptop cho người dùng”

- Mục đích: Cung cấp thông tin hữu ích và khách quan về các sản phẩmlaptop có sẵn trên thị trường, nhằm giúp người tiêu dùng có cái nhìn rõràng và chọn lựa thông tin chính xác khi mua sắm Trong thế giới công

Trang 4

khác nhau Ngoài ra, thông tin về giá cả cũng là yếu tố quan trọng để ngườitiêu dùng có thể lựa chọn sản phẩm phù hợp với ngân sách của mình Mụcđích cuối cùng của việc tìm hiểu này là giúp người dùng tối ưu hóa trảinghiệm sử dụng laptop của họ, đáp ứng được nhu cầu công việc, giải trí, haycác hoạt động khác một cách hiệu quả nhất Bằng cách này, người tiêu dùng

có thể đưa ra quyết định thông minh và hài lòng với sản phẩm mà họ chọn

II PHÂN TÍCH DỮ LIỆU

1 Thu thập dữ liệu

Nhóm lựa chọn trang nhiều trang web để thực hiện thu thập dữ liệu laptop cótrên trang web Sau khi thực hiện quy trình, thì nhóm thu thập được 1303 dòng

dữ liệu (tính tại thời điểm nhóm thực hiện quy trình)

2 Quy trình xây dựng cơ sở dữ liệu trên Azure

2.1 Đăng ký Azure

Bước 1: Truy cập vào liên kết ‘https://azure.microsoft.com/en-us’

Bước 2: Nhập các thông tin cần thiết, tạo tài khoản

Too long to read on your phone? Save

to read later on your computer

Save to a Studylist

Trang 5

2.2 Tạo database và cấu hình database sử dụng

Sau khi đăng ký thành công

Bước 1: Bấm chọn SQL database và chọn Create SQL database

Bước 2: Điền thông tin đầy đủ, chọn resource group Bấm vào Create new để

tạo Server

Trang 7

Bước 3: Sau khi đã tạo server, chọn thiết lập cho DB

Bước 4: Bấm “Review + Create” và sau đó chỉ việc chọn Create ngồi chờ.

Trang 8

Bước 5: Sau khi thấy ‘Your deployment is complete’ bạn bấm Go to resource

để xem Database Server mình vừa tạo ra

Database Server đã được tạo thành công

2.3 Kết nối tới SQL Server

Bước 1: Thêm Client IP và Firewall

Vì lý do bảo mật, chỉ các máy ảo/app service nằm chung resource group/virtualnetwork với database server mới có thể kết nối tới server đó

Do vậy, bạn phải thêm IP của mình vào whitelist để không bị chặn Chỉ cần bấm

“Set server firewall” ở góc trên bên trái, bấm “Add Client IP” sau đó Save là ok

Trang 9

Bước 3: Ta có thể xem table, query, edit dữ liệu một cách dễ dàng trên Azure

Trang 10

3 Mô tả dữ liệu

Index Columns Data type Description

1 F1 Float Số thứ tự của sản phẩm Laptop

2 Company Nvarchar(255) Tên của công ty sản xuất hoặc cung cấp

Nvarchar(255) Thông tin về độ phân giải của màn

hình, bao gồm chiều rộng và chiều caohoặc các thông số khác liên quan đếnchất lượng hình ảnh

Trang 11

6 Cpu Nvarchar(255) Thông tin về bộ xử lý (Central

Processing Unit) của Laptop, bao gồmtên mã, tốc độ, và các đặc điểm kháccủa CPU

7 Ram Nvarchar(255) Dung lượng bộ nhớ RAM (Random

Access Memory) của Laptop, thườngđược đo bằng đơn vị gigabytes (GB)

8 Memory Nvarchar(255) Dung lượng bộ nhớ lưu trữ trong

Laptop, có thể bao gồm ổ đĩa cứng(HDD) hoặc ổ đĩa SSD (Solid StateDrive), và được đo bằng đơn vịgigabytes (GB) hoặc terabytes (TB)

9 Gpu Nvarchar(255) Thông tin về bộ xử lý đồ họa, bao gồm

tên mã, dung lượng bộ nhớ đồ họa, vàcác đặc điểm khác của GPU

10 OpSys Nvarchar(255) Hệ điều hành mà Laptop sử dụng,

chẳng hạn như Windows, macOS,Linux, vv

11 Weight Float Trọng lượng của Laptop, thường được

đo bằng đơn vị kilogram (kg)

12 Price Nvarchar(255) Giá của Laptop, có thể được đưa ra

trong đơn vị tiền tệ cụ thể

Trang 12

4 Tiền xử lý dữ liệu với ngôn ngữ SQL

4.1 Xóa dữ liệu không dùng

Trang 13

- Tách giá trị cột Cpu

- Cập nhật dữ liệu cột 'Memory'

Trang 14

- Tách cột Gpu

4.5 Chuyển đổi dữ liệu

- Đổi giá trị cột Price (VND) về dạng triệu VNĐ

Trang 15

4.6 Xóa cột không cần thiết và các ký tự đặc biệt

5 Back up dữ liệu vừa tiền xử lý

Thực hiện Back up dữ liệu trên SQL server

Bước 1: Đăng nhập Server name Nhấn chuột phải chọn Task → chọn

Export Data-tier Application

Bước 2: Xuất hiện cửa sổ Introduction → Next → Sau đó chọn đường dẫn lưu

file backup →Next → Finish Quá trình sao lưu hoàn tất

Trang 17

6 Trực quan hóa dữ liệu

- Mối quan hệ giữa Company và Price

Nhìn vào đồ thị ta có thể thấy: Hãng Dell chiếm số lượng bán ra gần như vượttrội so với các dòng Laptop khác vì nổi tiếng với sự bền bỉ Còn Razer có giá trịtrung bình các mặt hàng là cao nhất vì đây là hãng laptop hướng đến người dùng

là Game thủ với thiết kế từ mỏng nhẹ nhưng cấu hình tốt cũng như những dòngmáy tính với thiết kế hầm hố nên giá thường sẽ cao hơn mặt bằng chung

Trang 18

Mức giá của các hãng khác nhau đều đặc trưng:

● Hãng Razer đứng đầu với giá cao nhất, lên đến 52 triệu VND

● Hãng Mediacom và Chuwi có giá trung bình thấp hơn, lần lượt là 4 triệuVND và 4.9 triệu VND

● Hàng Verio nằm giữa với mức giá là 3 triệu VND

Nhìn chung, sự chênh lệch giá này có thể phản ánh sự đa dạng về chất lượng,hiệu suất và thương hiệu giữa các hãng sản xuất

- Mối quan hệ giữa TypeName và Price

Trang 19

Qua biểu đồ TypeName và Price, chênh lệch giá giữa các loại máy tính rất đáng

kể Workstation có giá cao nhất (35 triệu), trong khi Netbook có giá thấp nhất(10 triệu), là lựa chọn phổ biến cho máy tính di động giá rẻ Gaming có giá27.213 VND, phản ánh yêu cầu cao về hiệu suất Ultrabook (24 triệu) và 2 in 1Convertible (20 triệu) nằm giữa, linh hoạt cho người dùng đòi hỏi di động vàhiệu suất Biến động lớn về giá thể hiện đa dạng về cấu hình và tính năng, tạonhiều lựa chọn cho người tiêu dùng

Trang 20

Kích thước màn hình ảnh hưởng đáng kể đến giá của máy tính Kích thước lớnnhư 15.4 inch và 18.4 inch có giá cao nhất, lần lượt là 39 triệu và 43 triệuVND Ngược lại, các kích thước nhỏ như 11.6, 10.1, 14.1 và 17.0 inch có giáthấp nhất, đặc biệt là 14.1 inch chỉ 5 triệu VND Sự chênh lệch giá này thể hiện

xu hướng giảm giá với kích thước màn hình giảm

Trang 21

Dữ liệu trực quan về mối quan hệ giữa độ phân giải và giá của các màn hìnhhiển thị cho thấy sự đa dạng trong phân khúc giá của các sản phẩm Độ phângiải cao nhất, 3840x2160, có giá 38 triệu VND, trong khi độ phân giải thấp nhất,1366x768, có giá 8.6 triệu VND Tuy có sự tăng giảm giá theo độ phân giải,nhưng không luôn tuân theo quy luật tuyến tính Ví dụ, màn hình 2880x1800 cógiá cao hơn 3840x2160 với mức 39 triệu VND Ngược lại, màn hình 3200x1800

Trang 22

Dữ liệu trực quan về mối quan hệ giữa loại CPU và giá của các máy tính chothấy sự đa dạng trong mức giá dựa trên CPU CPU có giá cao nhất là Intel Corei7, với mức giá là 25.3412 triệu VND Trái ngược, CPU có giá thấp nhất là IntelCeleron Dual, chỉ 4.9 triệu VND Nhìn chung, có sự tăng giảm giá tùy thuộc vàoloại CPU Các CPU cao cấp như Intel Core i7 và i5 thường có giá cao hơn,trong khi các CPU tầm trung và thấp cấp như Intel Celeron Dual và AMD E-series có giá thấp hơn Điều này phản ánh sự ảnh hưởng quan trọng của CPUđối với giá cả trong thị trường máy tính.

Trang 23

Dữ liệu trực quan về mối quan hệ giữa CPU và giá của máy tính cho thấy sự đadạng đáng kể trong mức giá, tùy thuộc vào tốc độ của CPU CPU có tốc độ caonhất, 3.1 GHz, đi kèm với giá cao nhất là 45.8 triệu VND Ngược lại, CPU cótốc độ thấp nhất, 0.9 GHz, có giá thấp nhất là 10.99 triệu VND Nhìn chung,giữa tốc độ CPU và giá có sự tương quan, với tốc độ cao thường đi kèm với giácao hơn Tuy nhiên, cũng có những ngoại lệ, như CPU 1.5 GHz có giá thấp là4.6 triệu VND Điều này cho thấy tốc độ CPU không phải là yếu tố duy nhấtquyết định giá của máy tính, và còn nhiều yếu tố khác như thương hiệu, hiệusuất và tính năng.

Trang 24

Dữ liệu trực quan về mối quan hệ giữa dung lượng RAM và giá của máy tínhcho thấy sự ảnh hưởng lớn của RAM đối với mức giá RAM có dung lượngcao nhất, 64GB, đi kèm với giá cao nhất là 62.48 triệu VND Ngược lại,RAM có dung lượng thấp nhất, 2GB, có giá thấp nhất là 3.8 triệu VND Nhìnchung, có sự tương quan giữa dung lượng RAM và giá, với dung lượng RAMcao thường đi kèm với giá cao hơn Điều này phản ánh xu hướng người tiêudùng chọn mức RAM phù hợp với nhu cầu sử dụng của họ, và đồng thời ảnhhưởng đáng kể đến giá cả của sản phẩm.

Trang 25

Dữ liệu trực quan về mối quan hệ giữa dung lượng bộ nhớ (Memory) và giá củamáy tính cho thấy ảnh hưởng lớn của bộ nhớ đối với mức giá Bộ nhớ có dunglượng cao nhất, 2000GB (2TB), đi kèm với giá cao nhất là 16.6 triệu VND.Ngược lại, bộ nhớ có dung lượng thấp nhất, 32GB, có giá thấp nhất là 4.17 triệuVND Nhìn chung, có sự tương quan giữa dung lượng bộ nhớ và giá, với dunglượng lớn thường đi kèm với giá cao hơn Điều này phản ánh sự quan trọng của

bộ nhớ đối với giá cả của máy tính và sự lựa chọn của người tiêu dùng dựa trênnhu cầu sử dụng

Trang 26

Dữ liệu trực quan về mối quan hệ giữa dung lượng bộ nhớ SSD và giá của máytính cho thấy ảnh hưởng lớn của SSD đối với mức giá SSD có dung lượng caonhất, 1000GB (1TB), đi kèm với giá cao nhất là 49.37 triệu VND Ngược lại,SSD có dung lượng thấp nhất, 16GB, có giá thấp nhất là 3.5 triệu VND Nhìnchung, có sự tương quan giữa dung lượng bộ nhớ SSD và giá, với dung lượnglớn thường đi kèm với giá cao hơn Điều này phản ánh sự quan trọng của SSDđối với giá cả của máy tính, và người tiêu dùng thường chọn dung lượng SSDdựa trên nhu cầu lưu trữ và hiệu suất mong muốn.

Trang 27

Biểu đồ cho thấy sự ảnh hưởng của Flash Storage đối với mức giá FlashStorage có dung lượng cao nhất, 512GB, đi kèm với giá cao nhất là 19.205 triệuVND Ngược lại, Flash Storage có dung lượng thấp nhất, 32GB, có giá thấpnhất là 4.945 triệu VND Nhìn chung, có sự tương quan giữa dung lượng bộ nhớFlash Storage và giá, với dung lượng lớn thường đi kèm với giá cao hơn Điềunày phản ánh sự quan trọng của Flash Storage đối với giá cả của máy tính và sựlựa chọn của người tiêu dùng dựa trên nhu cầu lưu trữ và hiệu suất.

Trang 28

Dữ liệu về mối quan hệ giữa dung lượng bộ nhớ Hybrid và giá của máy tính chothấy sự đa dạng trong giá cả Bộ nhớ Hybrid có dung lượng cao nhất là 1000GB(1TB), đi kèm với giá là 20.9 triệu VND Ngược lại, dung lượng thấp nhất là0GB, có giá là 17.8281 triệu VND Tổng quan, có thể thấy giá của máy tính với

bộ nhớ Hybrid tăng lên khi dung lượng tăng Điều này phản ánh sự ảnh hưởngcủa dung lượng lưu trữ đối với giá cả, và người tiêu dùng có thể chọn lựa dựatrên nhu cầu lưu trữ cụ thể của họ

Trang 29

- Mối quan hệ giữa Gpu và Price

Dữ liệu về mối quan hệ giữa GPU (Graphics Processing Unit) và giá của máytính cho thấy sự biến động đáng kể về giá cả GPU có giá cao nhất là NvidiaQuadro, lên đến 38.6429 triệu VND Trái ngược, GPU có giá thấp nhất là Intel

HD Graphics, chỉ 1.46 triệu VND Có thể thấy sự chênh lệch đáng kể về giágiữa các loại GPU khác nhau Các GPU cao cấp như Nvidia Quadro có giá cao,trong khi các GPU thông thường như Intel HD Graphics có giá thấp Sự chênhlệch này thể hiện sự ưu tiên của người tiêu dùng đối với hiệu suất đồ họa và cáctính năng đặc biệt của GPU trong máy tính của họ

Trang 30

- Mối quan hệ giữa OpSys và Price

Dữ liệu về mối quan hệ giữa hệ điều hành (OpSys) và giá của máy tính cho thấy

sự đa dạng trong phân khúc giá dựa trên hệ điều hành Hệ điều hành có giá caonhất là macOS, lên đến 27.499 triệu VND, trong khi hệ điều hành có giá thấpnhất là Android, chỉ 6.82 triệu VND Tổng quan, giá của máy tính phụ thuộc lớnvào hệ điều hành đi kèm Hệ điều hành dành cho máy tính cá nhân nhưWindows 10 và Ubuntu Linux thường có giá ổn định, trong khi hệ điều hànhmacOS của Apple có giá cao hơn do đó là hệ điều hành chuyên dụng cho sảnphẩm của họ

Trang 31

III XÂY DỰNG MÔ HÌNH GỢI Ý GIÁ

1 Tổng quan về mô hình

1.1 Các mô hình dự báo nghiên cứu

Trong bài nghiên cứu này, chúng ta sẽ sử dụng ba mô hình để phân tích và gợi ýgiá laptop cho người dùng bao gồm: Linear Regression, Random Forest,Bagging

❖ Linear Regression

Linear Regression là một thuật toán học có giám sát (supervised learning) trongMachine Learning, nó là một phương pháp thống kê dùng để ước lượng mốiquan hệ giữa các biến độc lập (input features) và biến phụ thuộc (output target).Linear Regression giả định rằng sự tương quan giữa các biến là tuyến tính, từ đótìm ra hàm tuyến tính tốt nhất để biểu diễn mối quan hệ này Thuật toán này dựbáo giá trị của biến output từ các giá trị của các biến đầu vào Mục tiêu củaLinear Regression là tìm ra hệ số góc và điểm giao với trục tung sao cho hàm dựđoán tuyến tính đạt được sai số nhỏ nhất

Chúng ta xem xét mô hình hồi quy tuyến tính đa biến, phương trình của nó códạng:

y =a+b 1 x 1 +b 2 x 2 + +b n x n +ϵ❑Trong phương trình này, a là điểm giao với trục tung, b 1 , b 2 , , b là các hệ sốgóc, x1, x2, , là các biến độc lập, và ε là sai số Mục tiêu của chúng ta là tìm racác hệ số của phương trình để tối thiểu hóa tổng bình phương sai số (RSS):

RSS=∑i=1

Ngày đăng: 04/06/2024, 15:31

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w