Replace values cột Fiscal Year để lấy giá trị năm, đổi tên thành YearTạo Clustered Column Chart có x là Country, y là Sum of Sales Amount, Column legend là Category Thể hiện doanh thu gi
Trang 1BỘ CÔNG THƯƠNG TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP TP HCM
□□□□□□
BÀI TẬP LỚN MÔN HỆ THỐNG THÔNG MINH DOANH NGHIỆP
NHÓM 3
STT Họ tên MSSV
1 Mai Thị Xuân An 21125301
2 Tạ Hoàng Phú 21065761
3 Ngô Hoàng Khải 21065691
4 Huỳnh Thanh Hoàng 21028331
Trang 2 Sales_data: ProductKey, SalesAmount, SalesTerritoryKey, OrderDateKey.
Product_data: ProductKey, Product, Subcategory, Category
SalesTerritory_data : SalesTerritoryKey, Region, Country, Group
Date_data: DateKey, Date, Fiscal Year
Trang 3Trong bảng Sales Territory_data: chọn 4 cột SalesTerritoryKey, Region, Country, Group
Trong bảng Date_data: Chọn 3 cột DateKey, Date, Fiscal Year
Tạo cột mới Month từ cột Date
Trang 4Replace values cột Fiscal Year để lấy giá trị năm, đổi tên thành Year
Tạo Clustered Column Chart có x là Country, y là Sum of Sales Amount, Column legend là Category
Thể hiện doanh thu giữa các nhóm sản phẩm theo khu vực
Trang 5Tạo slicer có Field là Country
Tạo Pie Chart có Legend là Catogory, values là sum of Sale Amount
Thể hiện tỉ trọng doanh thu giữa các nhóm hàng
Trang 6Thể hiện doanh thu từng danh mục sản phẩm theo khu vực (Country)
Date: DateKey, CalendarYear, CalendarQuarter, MonthNumberOfYear
Customer : CustomerKey, FirstName, LastName, YearlyIncome, MaterialStatus, TotalChildren
Chọn 3 bảng
Trang 7Trong bảng FactInternetSales: chọn 6 cột
Trong bảng Dimdate: chọn 4 cột
Trong bảng DimCustomer: Chọn cột 6 cột, tạo thêm cột Income để phân nhóm thu
nhập
Tạo clustered column chart có x là income, y là sum of Sale Amount
Thể hiện doanh thu giữa các phân khúc khách hàng
Trang 8Tạo Pie Chart có legend là Income, values là sum of Sale Amount
Thể hiện tỉ trọng doanh thu giữa các nhóm thu nhập khác nhau
SQL Server
Mục tiêu chủ đề: Phân tích mức độ tăng lương, thưởng và thăng tiến là một phần
quan trọng trong việc quản lý nhân sự, giúp tổ chức tối ưu hóa các chiến lược nhân sựcủa mình, đồng thời tăng cường sự hài lòng và động lực của nhân viên Dùng dữ liệu
từ AdventureWorks2008R2
Các bảng để sử dụng Phân tích mức độ tăng lương, thưởng và thăng tiến
● HumanResources.EmployeePayHistory: Thông tin về lịch sử lương của nhân
viên
● HumanResources.EmployeeDepartmentHistory: Lịch sử phòng ban và chức
vụ của nhân viên
Trang 9● HumanResources.Employee: Thông tin chung của nhân viên như ngày tuyển
dụng, giới tính, chức vụ
Transform dữ liệu của các bảng
Trang 10Sau khi transform xong thì apply, dưới đây là Model view thể hiện mối quan hệ giữa các bảng:
Trang 11Biểu đồ đường (Line Chart) - Phân tích sự thay đổi lương theo thời gian
Biểu đồ cột (Clustered Column Chart) - So sánh mức lương theo giới tính
Trang 12Biểu đồ hình tròn (Pie Chart) - Phân tích tỷ lệ thăng chức theo phòng ban
Biểu đồ kết hợp (Stacked Column and Line Chart) - Phân tích tốc độ tăng lương theo thời gian
b Load, xử lý và trình bày dữ liệu là kho dữ liệu (AdventureWorkDW2012,
…)
Trang 13Đề bài: Một doanh nghiệp muốn phân tích hiệu suất bán hàng của mình trên kênh bán hàng trực tuyến trong 5 năm qua (2010-2014) để hiểu rõ hơn về: Doanh thu của từng danh mục sản phẩm Sự thay đổi doanh thu theo năm
Kho dữ liệu sử dụng: AdventureWorkDW2012
Trang 14Trong bảng DimCustomer: đổi tên thành Customer, chọn 4 cột , gộp cột
FirstName và LastName thành CustomerName
Trong bảng DimProduct: Đổi tên thành Product, lọc chọn giá trị True trong
cột FinishedGoodsFlag Chọn 5 cột ProductKey, EnglishProductName, StandardCost, ListPrice, DimProductSubCategory Đổi tên cột thành ProductName, SubcategoryKey
Trang 15Mở rộng cột DimProductSubcategory thành
EnglishProductSubcategoryName và DimProductCategory
Mở rộng cột DimProductCategory thành EnglishProductCategoryName
Trang 16Trong bảng DimProductCategory: Đổi tên thành ProductCategory, chọn 2 cột
Trong bảng DimProductSubcategory: Đổi tên thành ProductSubcategory, chọn 3 cột
Trong bảng FactInternetSales:
Trang 17Trong bảng DimDate: lấy 5 cột, lọc lấy từ năm 2010 đến 2014 của cột CalendarYear
Tạo slicer có Field là CalendarYear
Tạo slicer có Field là ProductCategoryName
Trang 18Tạo linechart có x là OrderDate(Month) và y là Sum of SaleAmount
Phân tích doanh thu theo danh mục sản phẩm, thời gian từ 2010-2014
c Load, xử lý và trình bày dữ liệu dạng khác (lấy từ website, facebook…)
Trực quan dữ liệu trang cá nhân facebook
1 Lấy data từ facebook
a) Chọn Account -> Setting & privacy -> setting -> download your information
Trang 19b) Chọn continue -> download or transfer information -> Chọn tài khoản facebook cần tải data-> Chọn download to device -> Tùy chỉnh date range-format-media quality theo ý muốn -> chọn create file.
File tải về sẽ có dạng json chứa các thông tin về trang cá nhân facebook ( bạn bè, bài viết, nhóm hội đã tham gia, comment trong nhóm, …)
Trang 21Cột timestamp được biểu diễn theo dạng số nguyên tính theo giây nên ta chuyển đổi nó thành cột time chỉ lấy năm.
Ở mục addcomlumn -> chọn customcolumn -> Nhập tên cột và hàm để biến đổi cột timestamp thành cột time và xóa đi cột timestamp không sử dụng
3 Trực quan dữ liệu
Trang 22Chọn các biểu đồ và trường dữ liệu hợp lý để trực quan các dữ liệu của Trang cá nhânfacebook
Câu 3:
PHÂN TÍCH MỨC LƯƠNG DỰA TRÊN SỐ XE SỞ HỮU VÀ SỐ CON TRONG MỘT GIA ĐÌNH KHÁCH HÀNG
Chọn New Data Sources -> kết nối với server SQL của máy tính cá nhân và lấy cơ sở
dữ liệu AdventureWorksDW2012 từ SQL đã attach trước đó
Trang 23Chọn Next
Trang 24Chọn Use the service account
Chọn New Data Source Views - > Chọn dữ liệu từ 2 bảng FactInternetSales và DimCustomer
Trang 25Chọn giải thuật cây quyết định
Trang 27Chọn DimCustomer làm bảng case , FactInternetSales làm bảng nested
Trang 28Chọn các thuộc tính bảng cho Key , input, prediction
Trang 32Tiến hành deployment để sao chép dữ liệu phân tích
Trang 33Chọn qua Mining model viewer để tạo ra sơ đồ cây để phân tích
Dựa vào sơ đồ có thể thấy :
Khách hàng sở hữu số xe càng nhiều thì lương càng cao: Điều này cho thấy rằng
có mối quan hệ tích cực giữa số lượng xe và thu nhập Những người có thu nhập cao thường có khả năng mua nhiều xe hơn Đây là một chỉ báo hợp lý, vì thu nhập cao cho phép người tiêu dùng chi tiêu nhiều hơn cho phương tiện
Tuy nhiên : số con ít hơn nhưng lương lại nhiều hơn: Điều này có thể chỉ ra rằng
có một mối quan hệ phức tạp hơn giữa số con và thu nhập Có một số lý do tiềm năngcho sự quan sát này:
Trang 34 Chi phí nuôi con: Người có nhiều con có thể cần chi tiêu nhiều hơn cho chi
phí nuôi dưỡng, dẫn đến khả năng tiết kiệm hoặc đầu tư thấp hơn, ảnh hưởng đến thu nhập khả dụng
Lựa chọn nghề nghiệp: Những người có ít con có thể có thời gian và tài
nguyên hơn để đầu tư vào sự nghiệp, dẫn đến mức lương cao hơn
Mô hình gia đình: Có thể có sự khác biệt trong các mô hình gia đình; ví dụ,
những gia đình có ít con có thể ưu tiên đầu tư vào giáo dục và sự nghiệp, trong khi những gia đình có nhiều con có thể ưu tiên khác