Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 72 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
72
Dung lượng
4,58 MB
Nội dung
UBND TỈNH BÌNH DƯƠNG TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT LÊ HUỲNH NAM RÚT TRÍCH THƠNG TIN TỪ CƠ SỞ DỮ LIỆU KINH DOANH BẰNG PHƯƠNG PHÁP TRỰC QUAN CỦA CÔNG TY X CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN MÃ SỐ: 48 01 04 LUẬN VĂN THẠC SĨ BÌNH DƯƠNG – 2022 UBND TỈNH BÌNH DƯƠNG TRƯỜNG ĐẠI HỌC THỦ DẦU MỘT LÊ HUỲNH NAM RÚT TRÍCH THƠNG TIN TỪ CƠ SỞ DỮ LIỆU KINH DOANH BẰNG PHƯƠNG PHÁP TRỰC QUAN CỦA CÔNG TY X CHUYÊN NGÀNH: HỆ THỐNG THÔNG TIN MÃ SỐ: 48 01 04 LUẬN VĂN THẠC SĨ NGƯỜI HƯỚNG DẪN KHOA HỌC: PGS TS TRẦN VĨNH PHƯỚC BÌNH DƯƠNG – 2022 LỜI CAM ĐOAN Tơi Lê Huỳnh Nam xin cam đoan: Đề tài “Rút trích thông tin từ sở liệu kinh doanh phương pháp trực quan công ty X” kết trình nỗ lực, cố gắng thân với hướng dẫn nhiệt tình khoa học PGS.TS thầy Trần Vĩnh Phước Các số liệu, kết trình bày luận văn trung thực Những tư liệu sử dụng luận văn có nguồn gốc trích dẫn rõ ràng, đầy đủ Bình Dương, ngày tháng năm 2022 Học viên Lê Huỳnh Nam ii LỜI CẢM ƠN Tác giả xin gửi lời cảm ơn chân thành đến Ban giám hiệu trường Đại học Thủ Dầu Một tỉnh Bình Dương, phịng Sau đại học, q thầy tận tình giảng dạy tạo điều kiện thuận lợi để học viên học tập, nghiên cứu hồn thành khố học Tác giả xin gửi lời cảm ơn sâu sắc đến: ⁃ PGS.TS Trần Vĩnh Phước: xin cảm ơn thầy nhận lời hướng dẫn nhiệt tình giúp đỡ, hỗ trợ chuyên môn lời động viên nhắc nhở giúp tác giả thực trọn vẹn luận văn ⁃ Cô tin tưởng nhiệt tình cung cấp sở liệu kinh doanh cơng ty X giúp tác giả có số liệu thực tế khách quan để thực hoàn thành đề tài luận văn Cuối cùng, xin cảm ơn gia đình, người thân bạn bè ủng hộ, động viên, giúp đỡ để tác giả hồn thành tốt luận văn Bình Dương, ngày tháng năm 2022 Tác giả Lê Huỳnh Nam iii MỤC LỤC LỜI CAM ĐOAN ii LỜI CẢM ƠN iii MỤC LỤC iv DANH MỤC CÁC BẢNG vi DANH MỤC HÌNH, ĐỒ THỊ vii MỞ ĐẦU Chương GIỚI THIỆU 1.1 Giới thiệu 1.2 Đặt vấn đề 1.3 Mục tiêu nghiên cứu 1.4 Đối tượng nghiên cứu 1.5 Phạm vi nghiên cứu 1.6 Nhiệm vụ nghiên cứu 1.7 Ý nghĩa đề tài 1.8 Cấu trúc luận văn Chương 2: TỔNG QUAN VỀ CƠ SỞ LÝ THUYẾT 2.1 Giới thiệu 2.2 Dữ liệu 2.3 Hệ thị giác người 2.4 Tính chất trực quan 2.5 Biến trực quan 11 2.5.1 Biến vị trí 11 2.5.2 Biến thị giác 12 2.6 Trực quan hóa liệu 13 2.6.1 Hiển trị trực quan 13 2.6.2 Phân tích trực quan 14 2.6.3 Các dạng biều đồ, đồ thị dùng trực quan hóa: 14 2.7 Kết luận 21 Chương 3: THỰC NGHIỆM 22 3.1 Phương pháp nghiên cứu 22 iv 3.1.1 Lý chọn phương pháp 22 3.1.2 Thư viện Matplotlib 22 a Giới thiệu 22 b Các dạng biểu đồ Matplotlib 23 3.1.3 3.2 Thư viện Pandas 23 Quy trình thực nghiệm 24 3.2.3 Xử lý liệu câu lệnh Pandas 25 3.2.4 Trực quan biểu đồ 26 3.3 3.3.1 Phân tích liệu thực nghiệm 28 Xác định biến mô tả 28 a Phân loại biến 30 b Mô tả biến 30 3.3.2 Phân tích mối quan hệ biến 31 3.3.3 Sơ đồ quan hệ biến 31 3.3.4 Biểu diễn quan hệ biến toán học 31 3.3.5 Phân loại câu hỏi 32 a Câu hỏi sơ cấp 32 b Câu hỏi toàn cục 32 c Câu hỏi quan hệ 32 3.4 Thực nghiệm Python 32 3.4.1 Phân tích phương pháp trực quan hóa 33 3.4.2 Phân tích phương pháp thông thường 50 KẾT QUẢ NGHIÊN CỨU 52 KẾT LUẬN VÀ KIẾN NGHỊ 53 TÀI LIỆU THAM KHẢO 54 v DANH MỤC CÁC BẢNG Bảng 2.1 Bảng phân loại liệu dựa vào thuộc tính Bảng 2.2 Bảng biến thị giác Bảng 3.1 Bảng liệt kê biến đặt ký hiệu Bảng 3.2 Bảng phân loại biến Bảng 3.3 Bảng mô tả biến Bảng 3.4 Bảng mô tả mối quan hệ biến vi DANH MỤC HÌNH, ĐỒ THỊ Hình 2.1 Sơ đồ nhận thức thị giác Hình 2.2 Biểu đồ chiều cao / cân nặng với hình dạng khác Hình 2.3 Biểu đồ chiều cao / cân nặng nam nữ Hình 2.4 Biểu đồ chiều cao / cân nặng Hình 2.5 Cách tiếp cận để chuyển đổi liệu thành tri thức Hình 2.6 Biểu đồ cột Hình 2.7 Biểu đồ đường Hình 2.8 Biểu đồ đường với điểm nút Hình 2.9 Biểu đồ Pareto Hình 2.11 Biểu đồ trịn Hình 2.12 Biểu đồ phân tán Hình 2.13 Biểu đồ bong bóng Hình 2.14 Biểu đồ vùng Hình 2.15 Biểu đồ thác nước Hình 2.16 Biểu đồ phễu Hình 2.17 Biểu đồ nhiệt Hình 2.18 Biểu đồ hộp Hình 3.1 Sơ đồ quan hệ biến Hình 3.2 Biểu diễn đọc liệu Python Hình 3.3 Biểu diễn lọc liệu Python Hình 3.4 Biểu diễn nhóm tính tổng Python Hình 3.5 Biểu diễn xếp tăng giảm Python vii Hình 3.6 Biểu đồ cột khơng gian chiều Hình 3.7 Biểu đồ đường khơng gian chiều Hình 3.8 Biểu đồ kết hợp không gian chiều Hình 3.9 Biểu đồ cột khơng gian chiều Hình 3.10 Phân tích số Hình 3.11 Dữ liệu năm 2018 Hình 3.12 Dữ liệu 12 tháng năm 2018 Hình 3.13 Biểu đồ kim ngạch theo tháng năm 2018 Hình 3.14 Biểu đồ sản phẩm theo tháng năm 2018 Hình 3.15 Biểu đồ thời gian hoạt động theo tháng năm 2018 Hình 3.16 Dữ liệu năm 2019 Hình 3.17 Dữ liệu 12 tháng năm 2019 Hình 3.18 Biểu đồ kim ngạch theo tháng năm 2019 Hình 3.19 Biểu đồ sản phẩm theo tháng năm 2019 Hình 3.20 Biểu đồ thời gian hoạt động theo tháng năm 2019 Hình 3.21 Biểu đồ kết hợp kim ngạch theo tháng năm 2018 - 2019 Hình 3.22 Biểu đồ kết hợp sản phẩm theo tháng năm 2018 – 2019 Hình 3.23 Biểu đồ kết hợp thời gian hoạt động theo tháng năm 2018 - 2019 Hình 3.24 Biểu đồ kết hợp kim ngạch thời gian hoạt động năm 2018 Hình 3.25 Biểu đồ kết hợp kim ngạch thời gian hoạt động năm 2019 Hình 3.26 Biểu đồ kim ngạch nhập kho sản xuất tháng 10 năm 2019 Hình 3.27 Biểu đồ kim ngạch nhập kho sản xuất tháng 11 năm 2019 Hình 3.228 Biểu đồ kết hợp kim ngạch thời gian hoạt động năm 2018 - 2019 Hình 3.29 Biểu đồ kết hợp kim ngạch sản phẩm năm 2018 viii Hình 3.30 Biểu đồ kết hợp kim ngạch sản phẩm năm 2019 Hình 3.31 Biểu đồ kim ngạch nhập kho sản xuất tháng năm 2019 Hình 3.32 Biểu đồ kim ngạch nhập kho sản xuất tháng năm 2019 Hình 3.33 Biểu đồ kết hợp kim ngạch sản phẩm năm 2018 - 2019 ix thay đổi lớn Những tháng có sản phẩm nhập kho sản xuất cao giá trị kim ngạch nhập kho sản xuất cao Tuy nhiên khác với kim ngạch nhập kho sản xuất có xu hướng giảm tháng cuối năm, sản phẩm nhập kho sản xuất có xu hướng tăng tháng cuối năm Hình 3.30 Biểu đồ kết hợp kim ngạch sản phẩm năm 2019 Từ biểu đồ hình 3.30 ta thấy năm 2019 tương quan số liệu kim ngạch nhập kho sản xuất sản phẩm nhập kho sản xuất có thay đổi lớn Trong kim ngạch nhập kho sản xuất khơng có thay đổi q lớn so, phần sản phẩm nhập kho sản xuất lại có thay đổi lớn đặc biệt vào tháng Có thể thấy so với tháng có kim ngạch nhập kho sản xuất thấp khơng phải tháng có sản phẩm nhập kho sản xuất thấp Trong năm 2019 từ biểu đồ hình 3.30, ta thấy tháng tháng có lượng sản phẩn sản thấp năm 2019, kim ngạch nhập kho sản 48 xuất cao, so sánh với tháng tháng có sản phẩm sản xuất cao kim ngạch lại thấp tháng Để thấy nguyên nhân ta xem biểu đồ kim ngạch tháng tháng Kim ngạch nhập kho sx tháng năm 2019 2000000 1800000 1600000 1400000 1200000 1000000 800000 600000 400000 200000 sp01sp03sp05sp07sp09sp11sp13sp15sp17sp19sp21sp23sp25sp27sp29sp31sp33 Hình 3.31 Biểu đồ kim ngạch nhập kho sản xuất tháng năm 2019 Kim ngạch nhập kho sx tháng năm 2019 1800000 1600000 1400000 1200000 1000000 800000 600000 400000 200000 sp01sp03sp05sp07sp09sp11sp13sp15sp17sp19sp21sp23sp25sp27sp29sp31sp33 Hình 3.32 Biểu đồ kim ngạch nhập kho sản xuất tháng năm 2019 Từ biểu đồ hình 3.31 hình 3.32 ta thấy sản phẩm có kim ngạch cao tháng tháng có nhiều sản phẩm có kim ngạch từ 200.000 USD nhiều tháng Qua trả lời câu hỏi tháng có sản phẩm nhập kho thấp kim ngạch nhập kho thấp 49 ⁃ Biểu diễn hệ trục tọa độ Oxyz [15] Ta biểu diễn biến liệu không gian chiều để thấy tương quan biến kim ngạch nhập kho sản xuất sản phẩm nhập kho sản xuất năm 2018 – 2019 Trên không gian chiều, biểu đồ sử dụng biểu đồ cột, với trục x tháng, y biểu diễn giá trị kim ngạch nhập kho sản xuất, trục z biểu diễn giá trị sản phẩm nhập kho sản xuất, năm biểu diễn màu sắc khác Tỷ lệ biến biểu đồ biểu diễn với tỷ lệ sau: kim ngạch nhập kho sản xuất (1:1.000.000), sản phẩm nhập kho sản xuất (1:1.000.000) Hình 3.33 Biểu đồ kết hợp kim ngạch sản phẩm năm 2018 - 2019 Dựa vào biểu đồ quan hệ kim ngạch sản phẩm nhập kho trục tọa độ Oxyz Oxy ta thấy kim ngạch sản phẩm nhập kho có tương quan với nhau, tháng năm 2019 số lượng sản phẩm thấp kim ngạch ổn định so với tháng năm 2018 3.4.2 Phân tích phương pháp thơng thường 50 Tổng số lượng sản phẩm nhập kho năm 2019 so với năm 2018 tăng 268,634,454 sản phẩm (2,226,557,035 – 1,957,922,581), tương ứng tỉ lệ tăng 12% Tổng kim ngạch sản phẩm nhập kho năm 2019 so với năm 2018 tăng 3733005.3 USD (106431348.78754 - 102698343.49653), tương ứng với tỉ lệ tăng 3.5% Tổng thời gian hoạt động năm 2019 so với năm 2018 248891.03 (3798663.57 - 3549772.54), tương ứng tỉ lệ tăng % Về mối quan hệ số lượng sản phẩm nhập kho với kim ngạch sản phẩm nhập kho 2018 – 2019, ta thấy tốc độ tăng sản phẩm nhập kho cao kim ngạch nhập kho Vấn đề ta lý giải việc giá bán sản phẩm năm 2019 hạ thấp năm 2018, số lượng sản phẩm 2019 gồm nhiều sản phẩm có giá bán thấp nhiều so với sản phẩm có giá trị cao Nhưng liệu trước ta chưa thể kết luận cách thiếu số kiện Về mối quan hệ số lượng sản phẩm nhập kho với thời gian hoạt động 2018 – 2019, ta thấy tốc độ tăng số lượng cao thời gian hoạt động Theo thống kê ta thấy xuất làm việc từ năm 2018 đến 2019 hiệu cao Tuy nhiên kiện chưa đầy đủ nên chưa đưa kết luận xác Những phân tích thấy so với năm 2018 năm 2019 hiệu cao Tuy nhiên so sánh tương quan kim ngạch sản phẩm nhập kho với thời gian hoạt động ta thấy biến tăng, thời gian hoạt động tăng khoản 6% kim ngạch tăng khoản 3.5% Từ đánh giá kim ngạch - thời gian (3.5% - 6%) năm 2019 tốc độ tăng kim ngạch sản phẩm nhập kho công ty không cao Lý giải vấn đề ta suy đốn 2019 năm bắt đầu có dịch COVID-19, thời gian số lượng sản phẩm nhiều nên giá thành phải hạ so với năm 2018 51 KẾT QUẢ NGHIÊN CỨU Qua trình nghiên cứu sở lý thuyết, với việc phân tích trực quan hóa liệu kinh doanh sản xuất doanh nghiệp, luận văn có số đóng góp định rút kết luận sau: ⁃ Tác giả tiếp cận, thu thập nguồn liệu thực tế, tìm hiểu sở liệu hoạt động kinh doanh sản xuất doanh nghiệp, tiến hành tiền xử lý, chuyển đổi từ tập liệu thơ (mục đích doanh nghiệp lưu trữ quản lý báo cáo, thống kê) thành tập liệu phân tích tìm giá trị hữu ích phương thức trực quan hóa ⁃ Trong q trình thực luận văn, tơi trình bày cách tiếp cận, xác định mục tiêu tốn, q trình thực hiện, công cụ, thư viện hỗ trợ cách lập trình cho việc thực dự án phân tích trực quan hóa liệu kinh doanh doanh nghiệp Từ kết đạt được, ứng dụng tốn vào mơi trường thực tế Luận văn thể việc trực quan hóa liệu kinh doanh, sản xuất phương pháp phân tích hiệu quả, giúp người xem nhanh chóng thấy trọng tâm liệu, phương pháp trực quan xu hướng phân tích thời đại nay, vị trí việc làm tìm Việt Nam tương lai ⁃ Tác giả kết toán ban đầu so sánh với phương pháp phân tích thơng thường Tuy nhiên, dù kết bước đầu liệu thu thập thiếu nhiều yếu tố khác, tảng để phát triển phương pháp trực quan hóa theo hướng tiếp cận, nghiên cứu để ứng dụng vào ngành nghề, nghiên cứu khác nói chung phát triển kĩ thuật trực quan hóa nói riêng 52 KẾT LUẬN VÀ KIẾN NGHỊ Cũng phương pháp phân tích khác, trực quan hóa phương pháp trung gian giúp cho việc thể liệu thu thập được, nhằm giúp người đọc xem rút kết luận Phương pháp trực quan hóa đánh giá cao việc giúp người đọc tiếp nhận thơng tin nhanh chóng người thực khơng cần phải giải thích q chi tiết Việc trực quan hóa đồ thị, hình ảnh cịn giúp người thực linh hoạt việc biểu diễn liệu phải dùng phương pháp tính tốn rút kết luận thơng thường Để giúp người đọc có nhìn tổng qt nhanh chóng việc tiếp nhận thơng tin phương pháp trực quan hóa, tơi dự kiến mở rộng thêm nguồn liệu dựa nhu cầu nhà quản lý doanh nghiệp dựa mục đích khác nhau, qua đưa lĩnh vực trực quan hóa khoa học liệu vào ứng dụng để phân tích liệu doanh nghiệp tương lai Tinh chỉnh lại biểu đồ sử dụng thêm thư viện Seaborn Python với nhiều mơ hình trực quan khác nhằm tăng phong phú việc nhìn nhận thơng tin để người đọc khơng bị nhàm chán, từ xây dựng mơ hình máy học Bên cạnh việc tối giản tối đa biểu đồ, hay gộp biểu đồ lại với làm tăng tỉ lệ tiếp nhận thông tin Tuy nhiên, việc tối giản biểu đồ hay gộp nhiều biểu đồ lại cần nhiều thời gian để phân tích hiệu chỉnh, đòi hỏi người thực phải lựa chọn biến hợp lý Hiện nay, với nhiều ngành công nghiệp lĩnh vực nghiên cứu xuất nhiều sở liệu khác nhau, qua ta thấy đa dạng liệu việc chuyển hướng sang ngành công nghiệp nghiên cứu khác định hướng phát triển tương lai Từ đó, việc có thêm đa dạng sở liệu phương pháp biểu diễn trực quan khác giúp ta có đa dạng thơng tin 53 TÀI LIỆU THAM KHẢO [1] S Few, "Tapping the Power of Visual Perception," Perceptual Edge, pp 18, September 4, 2004 [2] S Few, "Data Visualization for Human Perception," in The Encyclopedia of Human-Computer Interaction, M Soegaard and R F Dam, Eds 2nd ed (The Interaction Design Foundation., Aarhus, Denmark, 2014 [3] H T Nguyen, A V T Tran, T A T Nguyen, L T Vo, and P V Tran (2017), "Multivariate cube integrated retinal variable to visually represent multivariable data," EAI Endorsed Transactions on Context-aware Systems and Applications, vol 4, no 12, pp 1-8 [4] M Green (1998), "Toward a Perceptual Science of Multidimensional Data Visualization: Bertin and Beyond," ERGO/GERO Human Factors Science, Citeseer [5] Jacque Bertin, Sémiologie Graphique Les diagrammes, les réseaux, les cartes With Marc Barbut [et al.] Paris: Gauthier-Villars Semiology of Graphics, English Edition, Translation by William J Berg, University of Wisconsin Press, [6] Tyner, J A (2010) “Principles of map design New York: The Guilford Press” [7] J Bertin, "Semiology of graphics: Diagrams, networks, maps," ed: University of Wisconsin 1983 [8] Arif Perdana, Alastair Robb & Fiona Rohde (2018), Australasian Journal of Information Systems, Vol 22, Research Article - Does Visualization Matter? The Role of Interactive Data Visualization to Make Sense of Information [9] P V Tran and T X Le (2020), "Approaching human vision perception to designing visual graph in data visualization," Concurrency Computation: Practice Experience, vol 33, no 2, pp 1-17 54 [10] H T Nguyen, L T Le, C N T Huynh, T M T Pham, A V T Tran, P V Dang, and P V Tran (2019) “Integrating Retinal Variables into Graph Visualizing Multivariate Data to Increase Visual Features” [11] https://amber.edu.vn/dau-la-phuong-phap-tiep-thu-thong-tin-hieu-quanhat-danh-cho-ban/ [12] https://en.wikipedia.org/wiki/Data [13] https://en.wikipedia.org/wiki/Visual_system [14] https://en.wikipedia.org/wiki/Visual_variable [15] https://matplotlib.org/ [16] https://pandas.pydata.org/ [17] https://numpy.org/ [18] https://seaborn.pydata.org/ [19] https://plotly.com/graphing-libraries/ 55 56 57 58 59 60 61 62