Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 50 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
50
Dung lượng
3,74 MB
Nội dung
TRƯỜNG ĐẠI HỌC KINH TẾ KHOA THỐNG KÊ – TIN HỌC BÁO CÁO THỰC TẬP NGHỀ NGHIỆP NGÀNH HỆ THỐNG THÔNG TIN QUẢN LÝ CHUYÊN NGÀNH QUẢN TRỊ HỆ THỐNG THÔNG TIN VÀ TIN HỌC QUẢN LÝ XÂY DỰNG KHO DỮ LIỆU TRÊN NỀN TẢNG AZURE VÀ PHÂN TÍCH HOẠT ĐỘNG CHO HỆ THỐNG QUẢN LÝ CỬA HÀNG QUẦN ÁO Đơn vị thực tập : TMA Solution Bình Định Giảng viên hướng dẫn : TS Phan Đình Vấn LỜI CẢM ƠN Để hoàn thành báo cáo thực tập nghề nghiệp này, trước tiên chúng em xin gửi lời cảm ơn chân thành đến quý thầy, cô giảng viên khoa Thống kê - Tin học, trường Đại học Kinh tế - Đại học Đà Nẵng tạo điều kiện hỗ trợ chúng em trình học tập thực tập Nhờ có dẫn động viên thầy cơ, chúng em hồn thành báo cáo thực tập nghề nghiệp với tên đề tài “Xây dựng kho liệu tảng Azure phân tích hoạt động cho hệ thống quản lý cửa hàng quần áo” Tiếp theo, chúng em xin gửi lời cảm ơn đến quý Công ty TNHH Giải pháp Phần mềm Tường Minh Bình Định, nơi chúng em thực tập Chúng em xin cảm ơn ban lãnh đạo công ty tạo hội cho chúng em làm việc môi trường chuyên nghiệp thân thiện Chúng em xin cảm ơn anh chị cán bộ, nhân viên phòng Data Science giúp đỡ chúng em dự án công việc Nhờ có hướng dẫn chia sẻ anh chị, chúng em có kinh nghiệm học thực tiễn bổ ích Đặc biệt, chúng em xin gửi lời cảm ơn chân thành sâu sắc đến thầy TS.Phan Đình Vấn - Giảng viên hướng dẫn anh Nguyễn Hoàng Vũ Thân - người trực tiếp hướng dẫn công ty theo dõi q trình thực tập chúng em, ln sẵn sàng giải đáp thắc mắc khó khăn Đã dành cho chúng em lời khuyên góp ý quý giá để hoàn thiện báo cáo Trong trình thực tập thực báo cáo, kiến thức cịn nhiều hạn chế nên chúng em khơng thể tránh khỏi sai sót, kính mong nhận góp ý q thầy cơ, q cơng ty để chúng em rút kinh nghiệm chỉnh sửa Chúng em xin chân thành cảm ơn! LỜI CAM ĐOAN Chúng em xin cam đoan báo cáo “Xây dựng kho liệu tảng Azure phân tích hoạt động cho hệ thống quản lý cửa hàng quần áo” kết nghiên cứu nhóm chúng em hướng dẫn giảng viên hướng dẫn TS.Phan Đình Vấn anh Nguyễn Hồng Vũ Thân Cơng ty TMA Bình Định Báo cáo thực tập sản phẩm mà nhóm chúng em nổ lực nghiên cứu suốt thời gian thực tập Công ty TMA Bình Định Chúng em cam kết tất thông tin cung cấp báo cáo thực tập nghề nghiệp xác, trung thực Chúng em xin chịu hoàn toàn trách nhiệm, kỷ luật nhà trường có vấn đề xảy MỤC LỤC LỜI CẢM ƠN iii LỜI CAM ĐOAN iv MỤC LỤC v DANH MỤC HÌNH ẢNH vii DANH MỤC CÁC TỪ VIẾT TẮT x LỜI MỞ ĐẦU CHƯƠNG GIỚI THIỆU VỀ ĐƠN VỊ THỰC TẬP TMA BÌNH ĐỊNH VÀ ĐỀ TÀI 1.1 Giới thiệu tổng quát doanh nghiệp thực tập TMA Bình Định 1.1.1 Giới thiệu công ty TMA Bình Định 1.1.2 Lĩnh vực kinh doanh 1.2 Giới thiệu đề tài xây dựng kho liệu tảng Azure phân tích hoạt động cho hệ thống quản lý cửa hàng quần áo CHƯƠNG CƠ SỞ LÝ THUYẾT HỖ TRỢ XÂY DỰNG KHO DỮ LIỆU TRÊN NỀN TẢNG AZURE 2.1 Giới thiệu công việc Data Engineer 2.1.1 Khái niệm 2.1.2 Công việc Data Engineer dự án phân tích liệu 2.1.3 Kiến thức, kỹ cần có Data Engineer 2.1.4 Con đường phát triển nghiệp Data Engineer 2.2 Giới thiệu Database kỹ thuật xây dựng Database cho dự án 2.2.1 Giới thiệu Database 2.2.2 Hệ quản trị Database (DBMS) 2.2.3 Các kỹ thuật mô liệu cho Database 2.3 Giới thiệu Data Lake 2.4 Giới thiệu Data Warehouse 2.5 Giới thiệu ETL pipeline 2.6 Giới thiệu điện toán đám mây tảng Azure 10 2.6.1 Khái niệm 10 2.6.2 Các dịch vụ Azure sử dụng dự án 10 CHƯƠNG ỨNG DỤNG CÁC DỊCH VỤ TRÊN NỀN TẢNG AZURE ĐỂ XÂY DỰNG KHO DỮ LIỆU PHỤC VỤ PHÂN TÍCH HOẠT ĐỘNG CHO HỆ THỐNG QUẢN LÝ CỬA HÀNG QUẦN ÁO 13 3.1 Quy trình xây dựng Database 13 3.2 Quy trình xây dựng kho liệu Azure 21 3.3 Trực quan hóa liệu 33 3.4 Kết đạt 35 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 37 TÀI LIỆU THAM KHẢO 39 CHECK LIST CỦA BÁO CÁO 41 DANH MỤC HÌNH ẢNH Hình 1.1.1 Cơng ty TMA Solutions Bình Định Hình 2.5.1 Các bước để xây dựng ETL pipeline Hình 2.6.1 Các thành phần Azure Synapse Analytics 12 Hình 3.1.1 Thiết kế bảng Branch 13 Hình 3.1.2 Thiết kế bảng Category 13 Hình 3.1.3 Thiết kế bảng Customer 13 Hình 3.1.4 Thiết kế bảng Employee 14 Hình 3.1.5 Thiết kế bảng Inventory 14 Hình 3.1.6 Thiết kế bảng Order Detail 14 Hình 3.1.7 Thiết kế bảng Orders 15 Hình 3.1.8 Thiết kế bảng Product 15 Hình 3.1.9 Thiết kế bảng Shipment 15 Hình 3.1.10 Thiết kế bảng Supplier 16 Hình 3.1.11 Thiết kế bảng Supplier Tracking 16 Hình 3.1.12 Thiết kế bảng Tracking Detail 16 Hình 3.1.13 Dữ liệu cho bảng Tracking Detail 17 Hình 3.1.14 Dữ liệu cho bảng Customer 17 Hình 3.1.15 Dữ liệu cho bảng Employee 17 Hình 3.1.16 Dữ liệu cho bảng Inventory 18 Hình 3.1.17 Dữ liệu cho bảng Order Detail 18 Hình 3.1.18 Dữ liệu cho bảng Orders 18 Hình 3.1.19 Dữ liệu cho bảng Product 19 Hình 3.1.20 Dữ liệu cho bảng Category 19 Hình 3.1.21 Dữ liệu cho bảng Shipment 19 Hình 3.1.22 Dữ liệu cho bảng Supplier 20 Hình 3.1.23 Dữ liệu cho bảng Supplier Tracking 20 Hình 3.1.24 Dữ liệu cho bảng Tracking Detail 20 Hình 3.2.1 Quy trình xây dựng kho liệu Azure 21 Hình 3.2.2 Tạo tài khoản Storage 21 Hình 3.2.3 Tạo nơi lưu trữ containers 21 Hình 3.2.4 Tạo Data Factory 22 Hình 3.2.5 Thiết lập Integration Runtime 22 Hình 3.2.6 Chọn liệu nguồn 22 Hình 3.2.7 Chọn liệu đích 23 Hình 3.2.8 Định dạng tệp 23 Hình 3.2.9 Cài đặt chép liệu 23 Hình 3.2.10 Kiểm tra liệu nguồn liệu đích 24 Hình 3.2.11 Quá trình chạy pipeline 24 Hình 3.2.12 File parquet Azure Data Lake Gen 24 Hình 3.2.13 Schema datawarehouse 25 Hình 3.2.14 Tạo Dedicated SQL pool 25 Hình 3.2.15 Tạo bảng liệu Dedicated SQL pool 25 Hình 3.2.16 Dataset cho liệu Data Lake Store Gen 26 Hình 3.2.17 Linked service liên kết với Data Lake Gen 26 Hình 3.2.18 Dataset cho 12 bảng liệu nguồn 27 Hình 3.2.19 Dataset cho liệu Dedicated SQL pool 27 Hình 3.2.20 Linked service liên kết với Dedicated SQL pool 28 Hình 3.2.21 Dataset cho 10 bảng liệu đích 28 Hình 3.2.22 Data flows cho 10 bảng liệu 29 Hình 3.2.23 Data flow cho bảng Dim_Branch 29 Hình 3.2.24 Data flow cho bảng Dim_Customer 29 Hình 3.2.25 Data flow cho bảng Dim_Employee 30 Hình 3.2.26 Data flow cho bảng Fact_Import 30 Hình 3.2.27 Data flow cho bảng Fact_Sales 31 Hình 3.2.28 Data flow cho bảng Dim_Inventory 31 Hình 3.2.29 Data flow cho bảng Dim_Product 31 Hình 3.2.30 Data flow cho bảng Dim_Shipment 32 Hình 3.2.31 Data flow cho bảng Dim_Supplier 32 Hình 3.2.32 Data flow cho bảng Dim_Time 32 Hình 3.2.33 Pipeline tải liệu 33 Hình 3.3.1 Dashboard tồn kho 33 Hình 3.3.2 Dashboard bán hàng 34 DANH MỤC CÁC TỪ VIẾT TẮT ETL : Extract - Transform – Load ELT : Extract – Load - Transform BI : Business Intelligence SQL : Structured Query Language T-SQL : Transact - Structured Query Language NoSQL : Not Only Structured Query Language AWS : Amazon Web Services DBMS : Database Management System HTTP : Hypertext Transfer Protocol HTTPS : Hypertext Transfer Protocol Secure OLAP : Online Analytical Processing REST : Representational State Transfer API : Application Programming Interface DB : Database ML : Machine Learning DW : DataWarehouse LỜI MỞ ĐẦU Mục tiêu đề tài - Xây dựng kho liệu tảng Azure, nhằm cung cấp thông tin nhân viên, khách hàng, sản phẩm chi nhánh cho nhà quản lý, nhà nghiên cứu bên liên quan để khai thác, phân tích trình bày liệu - Để xây dựng kho liệu, đề tài thực bước thu thập, làm sạch, chuẩn hóa, tích hợp lưu trữ liệu tảng Azure Kết đề tài hướng tới có kho liệu hoàn chỉnh, an toàn dễ sử dụng giúp cho việc đánh giá, cải thiện hệ thống quản lý cửa hàng quần áo trở nên dễ dàng xác Đối tượng phạm vi nghiên cứu - Đối tượng nghiên cứu: Dữ liệu sử dụng ngơn ngữ lập trình python tạo liệu giả lập cửa hàng quần áo khách hàng, nhân viên, chi nhánh vài liệu thực tế sản phẩm lấy từ website yody.vn Đề tài nghiên cứu hoạt động hệ thống quản lý cửa hàng quần áo, đặc biệt cửa hàng quần áo có nhu cầu quản lý hoạt động kinh doanh cách hiệu tiết kiệm chi phí - Phạm vi nghiên cứu: Nghiên cứu hoạt động hệ thống quản lý cửa hàng quần áo Kết cấu đề tài Đề tài tổ chức gồm phần mở đầu, chương nội dung phần kết luận - Mở đầu - Chương 1: Giới thiệu đơn vị thực tập TMA Bình Định đề tài - Chương 2: Cơ sở lý thuyết hỗ trợ xây dựng kho liệu tảng Azure - Chương 3: Ứng dụng dịch vụ tảng Azure để xây dựng kho liệu phục vụ phân tích hoạt động cho hệ thống quản lý cửa hàng quần áo - Kết luận hướng phát triển Tạo Dataset cho 12 bảng liệu Data Lake Gen Hình 3.2.18 Dataset cho 12 bảng liệu nguồn • Tạo Dataset cho liệu Dedicated SQL pool Hình 3.2.19 Dataset cho liệu Dedicated SQL pool 27 Tạo Linked service liên kết với Dedicated SQL pool Hình 3.2.20 Linked service liên kết với Dedicated SQL pool Tạo Dataset cho 10 bảng liệu đích Hình 3.2.21 Dataset cho 10 bảng liệu đích 28 • Tạo Data flows để tải liệu từ Data Lake Gen đến Dedicated SQL pool Hình 3.2.22 Data flows cho 10 bảng liệu Hình 3.2.23 Data flow cho bảng Dim_Branch Hình 3.2.24 Data flow cho bảng Dim_Customer 29 Hình 3.2.25 Data flow cho bảng Dim_Employee Hình 3.2.26 Data flow cho bảng Fact_Import 30 Hình 3.2.27 Data flow cho bảng Fact_Sales Hình 3.2.28 Data flow cho bảng Dim_Inventory Hình 3.2.29 Data flow cho bảng Dim_Product 31 Hình 3.2.30 Data flow cho bảng Dim_Shipment Hình 3.2.31 Data flow cho bảng Dim_Supplier Hình 3.2.32 Data flow cho bảng Dim_Time 32 • Đưa Data flows vào Data pipeline để tiến hành tải liệu Hình 3.2.33 Pipeline tải liệu 3.3 Trực quan hóa liệu • Tổng quan hoạt động tồn kho Hình 3.3.1 Dashboard tồn kho Dashboard tồn kho giúp hiển thị thông tin, theo dõi lượng hàng tồn kho cung cấp nhìn tồn cảnh liên quan đến tình trạng tồn kho doanh nghiệp - Trực quan: Dashboard tích hợp biểu đồ trịn, cột, khu vực nhãn thể số cách tổng quan hoạt động nhập hàng cửa hàng từ nhà cung cấp - Nhận xét: 33 Đầu tiên nhãn thể số tổng quan bật dashboard Khi xây dựng biểu đồ cần trọng nội dung mang yếu tố phân tích cho nhà quản trị Thơng qua biểu đồ, nhà quản trị dễ dàng nắm bắt số sản phẩm tồn kho, tỷ lệ sản phẩm hỏng, tổng đơn đặt hàng từ nhà cung cấp, chi phí cho đơn đặt hàng số lượng sản phẩm trung bình cho đơn đặt hàng từ nhà cung cấp Tiếp đến biểu đồ thể mức độ chi tiết dashboard Biểu đồ tròn thể số lượng tồn kho theo giới tính sản phẩm Thơng qua màu sắc sản phẩm thuộc giới tính nữ chiếm tỷ lệ cao (50,23%), tiếp đến sản phẩm thuộc giới tính nam chiếm tỷ lệ (46,62%), cuối sản phẩm thuộc giới tính unisex với tỷ lệ (3,15%) Có thể thấy sản phẩm thuộc giới tính nam nữ bán chạy nên lượng hàng nhập kho hàng cao Biểu đồ khu vực thể tổng số đơn hàng từ nhà cung cấp theo tháng cho thấy phân bố tổng đơn hàng theo tháng, nhận thấy tháng tháng hai tháng cửa hàng có xu hướng nhập hàng từ nhà cung cấp nhiều Kết hợp tương quan hai biểu đồ cột tổng chi phí đặt hàng, tổng đơn hàng đơn hàng giao trễ theo nhà cung cấp thấy nhà cung cấp may mặc Trường Nam may mặc Dony có tổng chi phí đặt hàng, tổng đơn hàng lớn đơn hàng giao trễ thấp nên cửa hàng cần thiết lập mối quan hệ lâu dài đáng tin cậy với nhà cung cấp đơn vị vận chuyển • Tổng quan hoạt động bán hàng Hình 3.3.2 Dashboard bán hàng 34 Dashboard bán hàng cung cấp nhìn tổng quan hoạt động kinh doanh đưa định dựa thông tin cách nhanh chóng hiệu - Trực quan: Dashboard tích hợp biểu đồ trịn, cột, khu vực, cụm nhãn thể số cách tổng quan hoạt động bán hàng cửa hàng - Nhận xét: Các nhãn thể thông số quan trọng giúp nhà quản trị có thơng tin để phân tích, quản lý hoạt động kinh doanh, số bao gồm tổng đơn đặt hàng, tổng số khách hàng, doanh thu, chi phí, lợi nhuận tỷ suất lợi nhuận Nhìn vào biểu đồ trịn giới tính khách hàng thấy tỷ lệ khách hàng nam (50,92%) tỷ lệ khách hàng nữ (49,08%) gần tương đương Tuy nhiên, liên hệ với biểu đồ doanh thu theo danh mục sản phẩm mặt hàng thời trang nữ đem lại doanh thu cao so với mặt hàng thời trang nam Tiếp theo biểu đồ tròn kênh bán hàng, nhìn chung hai kênh bán hàng có tỷ lệ gần giống Biểu đồ cột phương thức toán phổ biến Phương thức toán phổ biến bank transfer (chuyển khoản trực tiếp vào cửa hàng), tiếp đến online payment (chuyển khoản qua zalopay, shopee pay…), thứ ba cash (tiền mặt) áp dụng với kênh mua hàng online cuối COD (thanh toán nhận hàng) đơn hàng online Cuối biểu đồ khu vực thể tổng đơn hàng bán theo tháng cho thấy tháng tháng hai tháng có đơn đặt hàng cao tháng tháng có tổng đơn đặt hàng thấp với 54 đơn hàng 3.4 Kết đạt Sau tìm hiểu ứng dụng dịch vụ Azure việc xây dựng kho liệu phục vụ phân tích hoạt động cho hệ thống quản lý cửa hàng quần áo, đề tài chúng em đạt kết sau: • Hoàn thành xây dựng database: Đảm bảo lưu trữ liệu, thông tin tạo từ giao dịch mua bán hệ thống cửa hàng quần áo cách đầy đủ hiệu 35 • Hồn thành pipeline phục vụ việc truy xuất tải liệu từ on-premise database lên Data Lake Gen 2: Dữ liệu lưu trữ Data Lake Gen tăng cường khả bảo mật nhờ tính quản lý quyền truy cập mã hóa liệu Ngồi ra, liệu đảm bảo tính tồn vẹn nhờ tính lưu phiên liệu vùng lưu trữ khác Azure • Hồn thành xây dựng data warehouse dịch vụ Dedicated SQL Pool: Dữ liệu từ data lake tích hợp lưu vào bảng dim bảng fact data warehouse giúp tối ưu hóa cho q trình phân tích liệu • Hồn thành pipeline phục vụ việc truy xuất tải liệu từ Data Lake Gen sang Dedicated SQL Pools: Pipeline giúp đồng liệu Data Lake Gen Dedicated SQL Pools, đảm bảo cung cấp liệu xác, kịp thời cho hoạt động phân tích 36 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN • Đạt được: - Có hội làm việc mơi trường doanh nghiệp, hịa nhập với văn hóa doanh nghiệp - Học hỏi, nghiên cứu thêm nhiều kiến thức chuyên môn công cụ phục vụ cho công việc - Hiểu kiến trúc dự án liệu - Nâng cao kỹ thiết kế database data warehouse - Tìm hiểu thực hành tạo liệu giả lập cho database, giúp nâng cao tư hiểu biết cách thức liệu sinh môi trường thực tế - Nâng cao kỹ xử lý, làm liệu - Trau dồi kỹ mềm: giao tiếp cơng việc, quản lý thời gian • Hạn chế: - Về đề tài: ▪ Bộ liệu dùng đề tài liệu giả lập, kết phân tích chưa mang tính thực tiễn ▪ Các pipeline chưa hoạt động cách tự động ▪ Khi có thay đổi liệu nguồn, pipeline chưa thể xử lý thay đổi mà phải xử lý toàn liệu nguồn để đồng với liệu đích ▪ Dữ liệu data warehouse chưa thể cập nhật cách tự động, theo thời gian thực - Về nhóm thực đề tài: ▪ Kiến thức, kỹ thiết kế database cịn nhiều hạn chế, database chưa đáp ứng đầy đủ nhu cầu lưu trữ liệu doanh nghiệp môi trường thực tế ▪ Kỹ thuyết trình, trình bày dự án chưa tốt • Hướng phát triển: - Về đề tài: ▪ Tiếp tục phát triển, tích hợp cơng nghệ mở rộng phạm vi ứng dụng kho liệu tảng Azure, xây dựng mơ hình dự đốn phân loại khách hàng 37 ▪ Duy trì, đảm bảo tính bảo mật ổn định hệ thống giúp tăng khả quản lý tối ưu hóa việc cung cấp sản phẩm dịch vụ ▪ Kết hợp nguồn liệu bổ sung liệu mạng xã hội, vị trí địa lý, v.v để phân tích ảnh hưởng yếu tố bên đến hoạt động hệ thống quản lý cửa hàng quần áo - Về nhóm thực đề tài: ▪ Tiếp tục trau dồi học hỏi thêm kiến thức liên quan đến công việc Data Engineer, công cụ hỗ trợ Data Engineer ▪ Tìm hiểu nắm vững kiến thức kho liệu xử lý liệu ▪ Tham gia dự án phát triển công việc lĩnh vực liệu 38 TÀI LIỆU THAM KHẢO Glints (n.d.) Database gì? Phân loại chức Truy cập từ https://glints.com/vn/blog/database-la-gi/ Trần Minh Trọng (31 tháng năm 2021) Hướng dẫn lấy liệu web, Web Crawling với Selenium - Python - WebDrive Truy cập từ https://sudo.vn/blog/huong-dan-laydu-lieu-web-web-crawling-voi-selenium-python-webdrive.html DiziBrand (n.d.) DBMS gì? Chức DBMS (Hệ thống quản trị sở liệu) [Website] Truy cập từ https://dizibrand.com/dbms/ Tuan (2022, November 20) Tạo liệu giả (dummy data) để test Faker [Blog post] Truy cập từ https://tuananalytic.com/tao-du-lieu-gia-dummy-data-de-test-bangfaker/ QuanTriMang.com (n.d.) Cách tạo trình thu thập liệu web với Scrapy Truy cập từ https://quantrimang.com/cong-nghe/tao-trinh-thu-thap-du-lieu-web-voi- scrapy-169701 Vietnix.vn (n.d.) Web scraping gì? Cách thức hoạt động Web scraping Truy cập từ https://vietnix.vn/web-scraping-la-gi/ Microsoft (nd) Giới thiệu Azure Data Lake Storage Tìm hiểu Microsoft Truy cập từ https://learn.microsoft.com/en-us/azure/storage/blobs/data-lake-storage- introduction Phung, T (2018) Tìm hiểu Microsoft Azure: Azure Storage phần Truy cập từ: https://viblo.asia/p/tim-hieu-ve-microsoft-azure-azure-storage-phan-1maGK7j0M5j2 Bùi, B H (2023, January 18) Databricks gì? Những điều cần biết Databricks Meey Land Retrieved Truy cập từ: https://meeyland.com/chuyen-doiso/databricks-la-gi-nhung-dieu-co-ban-can-biet/ 10 Microsoft (2020, ngày tháng 12 Azure SQL Data Warehouse is now Azure Synapse Analytics Truy xuất từ: https://azure.microsoft.com/en-us/blog/azure-sql-datawarehouse-is-now-azure-synapse-analytics/ 11 Keepler (2019, June 4) Introduction to Azure SQL Data Warehouse Truy xuất từ https://keepler.io/2019/06/introduction-to-azure-sql-data-warehouse/ 39 12 Microsoft (2023) What is Azure Synapse Analytics ? Azure Synapse Analytics | Microsoft Learn Truy xuất từ https://learn.microsoft.com/en-us/azure/synapseanalytics/overview-what-is 13 Microsoft (2023) What is dedicated SQL pool (formerly SQL DW) in Azure Synapse Analytics? Azure Synapse Analytics Microsoft Learn Retrieved from https://learn.microsoft.com/en-us/azure/synapse-analytics/sql-data-warehouse/sqldata-warehouse-overview-what-is 14 HRchannels (2023) Con đường trở thành Data Engineer giỏi Truy xuất từ https://hrchannels.com/uptalent/con-duong-tro-thanh-mot-data-engineer-gioi.html 15 TopViecIT (2023) Lộ trình thăng tiến Data Engineer từ https://topviecit.vn/blog/lo-trinh-thang-tien-data-engineer/ 40 Truy xuất CHECK LIST CỦA BÁO CÁO STT Nội dung cơng việc Có Báo cáo trình bày (định dạng) với yêu cầu X Báo cáo có số lượng trang đáp ứng yêu cầu (30-50 trang) X Báo cáo trình bày phần mở đầu bao gồm: Mục tiêu, Phạm vi đối tượng, kết cấu … X Báo cáo trình bày cơng ty, vị trí việc làm (cơng việc làm gì, kiến thức kỹ cần thiết gì, đường phát triển nghiệp (career path)), sở lý thuyết phù hợp với nội dung đề tài (Tối đa 10-12 trang) X Báo cáo có sản phẩm cụ thể phù hợp với mục tiêu đặt đề tài X Báo cáo có phần kết luận hướng phát triển đề tài X 41 Không Ghi chú