1. Trang chủ
  2. » Luận Văn - Báo Cáo

Bài tập lớn môn hệ thống thông minh doanh nghiệp

34 0 0
Tài liệu đã được kiểm tra trùng lặp

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Tiêu đề Bài Tập Lớn Môn Hệ Thống Thông Minh Doanh Nghiệp
Tác giả Mai Thị Xuân An, Tạ Hoàng Phú, Ngô Hoàng Khải, Huỳnh Thanh Hoàng
Trường học Trường Đại Học Công Nghiệp Tp Hcm
Chuyên ngành Hệ Thống Thông Minh Doanh Nghiệp
Thể loại bài tập lớn
Định dạng
Số trang 34
Dung lượng 4,11 MB

Nội dung

Replace values cột Fiscal Year để lấy giá trị năm, đổi tên thành YearTạo Clustered Column Chart có x là Country, y là Sum of Sales Amount, Column legend là Category Thể hiện doanh thu gi

Trang 1

BỘ CÔNG THƯƠNG TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM

□□□□□□ 

BÀI TẬP LỚN MÔN HỆ THỐNG THÔNG MINH DOANH NGHIỆP

NHÓM 3

STT Họ tên MSSV

1 Mai Thị Xuân An 21125301

2 Tạ Hoàng Phú 21065761

3 Ngô Hoàng Khải 21065691

4 Huỳnh Thanh Hoàng 21028331

Trang 2

 Sales_data: ProductKey, SalesAmount, SalesTerritoryKey, OrderDateKey.

 Product_data: ProductKey, Product, Subcategory, Category

 SalesTerritory_data : SalesTerritoryKey, Region, Country, Group

 Date_data: DateKey, Date, Fiscal Year

Trang 3

Trong bảng Sales Territory_data: chọn 4 cột SalesTerritoryKey, Region, Country, Group

Trong bảng Date_data: Chọn 3 cột DateKey, Date, Fiscal Year

Tạo cột mới Month từ cột Date

Trang 4

Replace values cột Fiscal Year để lấy giá trị năm, đổi tên thành Year

Tạo Clustered Column Chart có x là Country, y là Sum of Sales Amount, Column legend là Category

Thể hiện doanh thu giữa các nhóm sản phẩm theo khu vực

Trang 5

Tạo slicer có Field là Country

Tạo Pie Chart có Legend là Catogory, values là sum of Sale Amount

Thể hiện tỉ trọng doanh thu giữa các nhóm hàng

Trang 6

Thể hiện doanh thu từng danh mục sản phẩm theo khu vực (Country)

 Date: DateKey, CalendarYear, CalendarQuarter, MonthNumberOfYear

 Customer : CustomerKey, FirstName, LastName, YearlyIncome, MaterialStatus, TotalChildren

Chọn 3 bảng

Trang 7

Trong bảng FactInternetSales: chọn 6 cột

Trong bảng Dimdate: chọn 4 cột

Trong bảng DimCustomer: Chọn cột 6 cột, tạo thêm cột Income để phân nhóm thu

nhập

Tạo clustered column chart có x là income, y là sum of Sale Amount

Thể hiện doanh thu giữa các phân khúc khách hàng

Trang 8

Tạo Pie Chart có legend là Income, values là sum of Sale Amount

Thể hiện tỉ trọng doanh thu giữa các nhóm thu nhập khác nhau

 SQL Server

Mục tiêu chủ đề: Phân tích mức độ tăng lương, thưởng và thăng tiến là một phần

quan trọng trong việc quản lý nhân sự, giúp tổ chức tối ưu hóa các chiến lược nhân sựcủa mình, đồng thời tăng cường sự hài lòng và động lực của nhân viên Dùng dữ liệu

từ AdventureWorks2008R2

 Các bảng để sử dụng Phân tích mức độ tăng lương, thưởng và thăng tiến

● HumanResources.EmployeePayHistory: Thông tin về lịch sử lương của nhân

viên

● HumanResources.EmployeeDepartmentHistory: Lịch sử phòng ban và chức

vụ của nhân viên

Trang 9

● HumanResources.Employee: Thông tin chung của nhân viên như ngày tuyển

dụng, giới tính, chức vụ

 Transform dữ liệu của các bảng

Trang 10

Sau khi transform xong thì apply, dưới đây là Model view thể hiện mối quan hệ giữa các bảng:

Trang 11

Biểu đồ đường (Line Chart) - Phân tích sự thay đổi lương theo thời gian

Biểu đồ cột (Clustered Column Chart) - So sánh mức lương theo giới tính

Trang 12

Biểu đồ hình tròn (Pie Chart) - Phân tích tỷ lệ thăng chức theo phòng ban

Biểu đồ kết hợp (Stacked Column and Line Chart) - Phân tích tốc độ tăng lương theo thời gian

b Load, xử lý và trình bày dữ liệu là kho dữ liệu (AdventureWorkDW2012,

…)

Trang 13

Đề bài: Một doanh nghiệp muốn phân tích hiệu suất bán hàng của mình trên kênh bán hàng trực tuyến trong 5 năm qua (2010-2014) để hiểu rõ hơn về: Doanh thu của từng danh mục sản phẩm Sự thay đổi doanh thu theo năm

Kho dữ liệu sử dụng: AdventureWorkDW2012

Trang 14

Trong bảng DimCustomer: đổi tên thành Customer, chọn 4 cột , gộp cột

FirstName và LastName thành CustomerName

Trong bảng DimProduct: Đổi tên thành Product, lọc chọn giá trị True trong

cột FinishedGoodsFlag Chọn 5 cột ProductKey, EnglishProductName, StandardCost, ListPrice, DimProductSubCategory Đổi tên cột thành ProductName, SubcategoryKey

Trang 15

Mở rộng cột DimProductSubcategory thành

EnglishProductSubcategoryName và DimProductCategory

Mở rộng cột DimProductCategory thành EnglishProductCategoryName

Trang 16

Trong bảng DimProductCategory: Đổi tên thành ProductCategory, chọn 2 cột

Trong bảng DimProductSubcategory: Đổi tên thành ProductSubcategory, chọn 3 cột

Trong bảng FactInternetSales:

Trang 17

Trong bảng DimDate: lấy 5 cột, lọc lấy từ năm 2010 đến 2014 của cột CalendarYear

Tạo slicer có Field là CalendarYear

Tạo slicer có Field là ProductCategoryName

Trang 18

Tạo linechart có x là OrderDate(Month) và y là Sum of SaleAmount

Phân tích doanh thu theo danh mục sản phẩm, thời gian từ 2010-2014

c Load, xử lý và trình bày dữ liệu dạng khác (lấy từ website, facebook…)

Trực quan dữ liệu trang cá nhân facebook

1 Lấy data từ facebook

a) Chọn Account -> Setting & privacy -> setting -> download your information

Trang 19

b) Chọn continue -> download or transfer information -> Chọn tài khoản facebook cần tải data-> Chọn download to device -> Tùy chỉnh date range-format-media quality theo ý muốn -> chọn create file.

File tải về sẽ có dạng json chứa các thông tin về trang cá nhân facebook ( bạn bè, bài viết, nhóm hội đã tham gia, comment trong nhóm, …)

Trang 21

Cột timestamp được biểu diễn theo dạng số nguyên tính theo giây nên ta chuyển đổi nó thành cột time chỉ lấy năm.

Ở mục addcomlumn -> chọn customcolumn -> Nhập tên cột và hàm để biến đổi cột timestamp thành cột time và xóa đi cột timestamp không sử dụng

3 Trực quan dữ liệu

Trang 22

Chọn các biểu đồ và trường dữ liệu hợp lý để trực quan các dữ liệu của Trang cá nhânfacebook

Câu 3:

PHÂN TÍCH MỨC LƯƠNG DỰA TRÊN SỐ XE SỞ HỮU VÀ SỐ CON TRONG MỘT GIA ĐÌNH KHÁCH HÀNG

Chọn New Data Sources -> kết nối với server SQL của máy tính cá nhân và lấy cơ sở

dữ liệu AdventureWorksDW2012 từ SQL đã attach trước đó

Trang 23

Chọn Next

Trang 24

Chọn Use the service account

Chọn New Data Source Views - > Chọn dữ liệu từ 2 bảng FactInternetSales và DimCustomer

Trang 25

Chọn giải thuật cây quyết định

Trang 27

Chọn DimCustomer làm bảng case , FactInternetSales làm bảng nested

Trang 28

Chọn các thuộc tính bảng cho Key , input, prediction

Trang 32

Tiến hành deployment để sao chép dữ liệu phân tích

Trang 33

Chọn qua Mining model viewer để tạo ra sơ đồ cây để phân tích

Dựa vào sơ đồ có thể thấy :

Khách hàng sở hữu số xe càng nhiều thì lương càng cao: Điều này cho thấy rằng

có mối quan hệ tích cực giữa số lượng xe và thu nhập Những người có thu nhập cao thường có khả năng mua nhiều xe hơn Đây là một chỉ báo hợp lý, vì thu nhập cao cho phép người tiêu dùng chi tiêu nhiều hơn cho phương tiện

Tuy nhiên : số con ít hơn nhưng lương lại nhiều hơn: Điều này có thể chỉ ra rằng

có một mối quan hệ phức tạp hơn giữa số con và thu nhập Có một số lý do tiềm năngcho sự quan sát này:

Trang 34

Chi phí nuôi con: Người có nhiều con có thể cần chi tiêu nhiều hơn cho chi

phí nuôi dưỡng, dẫn đến khả năng tiết kiệm hoặc đầu tư thấp hơn, ảnh hưởng đến thu nhập khả dụng

Lựa chọn nghề nghiệp: Những người có ít con có thể có thời gian và tài

nguyên hơn để đầu tư vào sự nghiệp, dẫn đến mức lương cao hơn

Mô hình gia đình: Có thể có sự khác biệt trong các mô hình gia đình; ví dụ,

những gia đình có ít con có thể ưu tiên đầu tư vào giáo dục và sự nghiệp, trong khi những gia đình có nhiều con có thể ưu tiên khác

Ngày đăng: 27/12/2024, 11:32