CHƯƠNG 3 : DỮ LIỆU VÀ PHƯƠNG PHÁP LUẬN
3.3. Phương pháp dự báo
Với đề tài này, chúng tôi sử dụng phương pháp phân tích hồi quy đa biến, tức tìm mối quan hệ giữa một biến phụ thuộc với nhiều biến độc lập để dự báo giá trị biến phụ thuộc khi biết giá trị các biến độc lập. Phường trình hồi quy đa biến:
Hình 3.2: Phương trình hồi quy đa biến
Biến phụ thuộc: Doanh thu trong ngày Các biến độc lập:
Chương trình khuyến mãi của Grab; Chương trình khuyến mãi của Now; Chương trình khuyến mãi của Baemin; Chương trình khuyến mãi của GoViet.
3.4. Phân tích dự báo dựa trên nền tảng Azure Machine Learning
3.4.1. Khái niệm Machine learning
Machine learning, tức học máy, là một lĩnh vực của trí tuệ nhân tạo liên quan đến việc nghiên cứu và xây dựng các kỹ thuật cho phép các hệ thống tự động “học” từ dữ liệu có sẵn để giải quyết những vấn đề cụ thể.
3.4.2. Giới thiệu Azure Machine Learning Studio
Azure Machine Learning Studio (AMLS) à một công cụ phát triển bởi Microsoft sử dụng tính năng kéo và thả để xây dựng, kiểm tra và triển khai các giải pháp phân tích dự đốn dựa trên dữ liệu có sẵn, cũng như cho phép xuất bản các mơ hình dưới dạng dịch vụ web.
3.4.3. Xây dựng mơ hình dự báo dựa trên Azure Machine Learning Studio
Để xây dựng mơ hình dự báo doanh thu cho cửa hàng SAY Coffee Lê Văn Sỹ một cách nhanh chóng và thuận tiện, nhóm sử dụng nền tảng Azure Machine Learning của Microsoft. Mơ hình được xây dựng với kỳ vọng có độ tin cậy cao nhất và sai số thấp nhất có thể để có thể ứng dụng vào việc quản lý cửa hàng. Trước hết nhóm sẽ thực hiện nghiên cứu sơ bộ về dữ liệu của cửa hàng cùng với việc nghiên cứu những mơ hình dự báo doanh thu đã được thực hiện liên quan đến đề tài nghiên cứu. Sau đó nhóm tiến hành thực hiện nghiên cứu chính thức bằng cách xây dựng mơ hình dự báo trên nền tảng AMLS, tiến hành chỉnh sửa và chạy mơ hình, cuối cùng là test mơ hình và tạo Web services để phục vụ việc kinh doanh của cửa hảng.
Kết luận chương 3
Ở chương 3, nhóm tiến hành thiết kế nghiên cứu thơng qua việc trình bày các phương pháp nghiên cứu phù hợp được lựa chọn để nghiên cứu đề tài và xây
dựng quy trình nghiên cứu để tiện cho việc theo dõi, đo lường và đánh giá q trình nghiên cứu. Nhóm cũng trình bày việc thu thập dữ liệu, mô tả lại dữ liệu, lựa chọn và phân tích phương pháp dự báo. Phương pháp nghiên cứu được lựa chọn là nghiên cứu định tính. Kích thước mẫu của dữ liệu là n=91, thu thập dựa trên tiêu chí tiện lợi cho việc nghiên cứu. Phương pháp dự báo phân tích hồi quy đa biến (thuật tốn Linear Regression trong AMLS) được sử dụng để dự đoán sự thay đổi của doanh thu dựa trên các chương trình khuyến mãi hợp tác với bên thứ 3. Đồng thời, chương 3 cũng giới thiệu sơ lược về nền tảng AMLS và việc xây dựng mơ hình dự báo doanh thu trên AMLS.
CHƯƠNG 4: KẾT QUẢ NGHIÊN CỨU4.1. Mô tả dữ liệu 4.1. Mô tả dữ liệu
Dữ liệu thô ban đầu thu thập được từ phần mềm Kiot Viet sẽ được chỉnh sửa, lọc và mã hóa thành dạng numberic và input vào AMLS. Từ hình 4.1 có thể thấy những thơng tin của dữ liệu như:
Doanh thu trung bình đạt 11627659.3407 (VNĐ/ngày) Giá trị giữa là 11815000
Doanh thu thấp nhất là 6547000 (VNĐ/ngày) Doanh thu cao nhất là 16534000 (VNĐ/ngày) Độ lệch chuẩn là 2044526.4772
Có tổng cộng 91 dữ liệu doanh thu khác nhau, tương ứng với doanh thu của 91 ngày (kể từ 01/4/2020 đến 30/6/2020)
Khơng có dữ liệu nào bị mất Loại dữ liệu là dữ liệu số
4.2. Xây dựng mơ hình dự báo
Để xây dựng mơ hình dự báo, chúng ta đăng nhập vào trang web
https://studio.azureml.net/. Chọn mục “Data set” trong số các danh mục (phía
bên tay trái) của gaio diện AMLS và upload data về doanh thu và chương trình khuyến mãi tại cửa hàng SAY Coffee Lê Văn Sỹ.
Sau khi update dataset thành công, ở thanh công cụ bên trái tiến hành chọn mục “Experiments” và nhấn ttạo Blank Experiements để bắt đầu thực hiện thí nghiệm mới tạo mơ hình dự báo doanh thu.
Kế đến, tiến hành thực hiện kéo - thả các tùy chọn có trong toolbar ở phía bên trái giao diện AMLS:
Đầu tiên, kéo data doanh thu của cửa hàng SAY Coffee Lê Văn Sĩ đã input vào thí nghiệm;
Kéo tùy chọn “Clean missing data” vào xây dựng mơ hình để làm sạch dữ liệu, việc làm sạch dữ liệu sẽ giúp quá trình dự báo được chính xác hơn;
Kéo thả tùy chọn Filter Based Selection và kết nối với dataset để đo lường mức độ ảnh hưởng tới biến phụ thuộc của các biến độc lập có trong data. Có thể thấy trong hình 4.3 dưới đây, các yếu tố ảnh hưởng tới doanh thu ngày của cửa hàng SAY Coffee Lê Văn Sỹ được sắp xếp theo thứ tự giảm dần từ trái qua phải. Hai biến độc lập có ảnh hưởng nhiều nhất tới doanh thu lần lượt là các chương trình khuyến mãi của GoViet (16.2%) và của Baemin (2.3%);
Hình 4.3: Đo lường mức độ ảnh hưởng của các biến độc lập
Tiếp đó, kéo tùy chọn “Split data” vào xây dựng mơ hình, chia lại tỉ lệ ở mục “Fraction of rows in the first output dataset” là 0,7 (tức là 70% dữ liệu sẽ được dùng ở Train model để dạy máy học, 30% còn lại dùng tại score model để kiểm tra đối chiếu);
Hình 4.4: Kéo thả các tùy chọn lọc và đo lường dữ liệu
Tiếp tục kéo - thả “Train model” để dạy máy học, “Score model” để test mơ hình và “Evaluate model” để kiếm tra các chỉ số thống kê của mơ hình. Ở Train model, nhấn chọn “Launch column”, chọn cột “”Revenue” để dạy máy học rằng đây là biến phụ thuộc cần được dự báo;
Lựa chọn thuật toán phù hợp để và kết nối với “Train model”. Với đề tài nghiên cứu này, chúng tơi sử dụng thuật tốn Regression (Hồi quy), cụ thể là Linear Regression (Hồi quy tuyến tính). Vào thanh tìm kiếm, search keyword “Linear Regression” và kéo thả thuật toán vào vùng thử nghiệm rồi kết nối thuật toán với Train model;
Sau khi hồn thành thiết kế mơ hình dự báo, nhấn nút “Run” ở toolbar phía dưới màn hình để chạy mơ hình;
Kết quả sau khi chạy mơ hình hồn tất và khơng có lỗi được thể hiện ở hình 4.6.
Hình 4.5: Kéo thả các tùy chọn xây dựng mơ hình dự báo
Để kiểm tra độ chính xác của kết quả và đọc các chỉ số thống kê, nhấp chọn Visualize ở Evaluate model sau khi đã chạy xong mơ hình.
Hình 3.9: Các chỉ số thống kê của mơ hình
Từ hình 3.9 có thể đọc được các chỉ số thống kê:
Sai số tuyệt đối trung bình là 1751592.320712 (VNĐ), tức sai số lớn nhất của mơ hình dự báo chỉ lệch khoảng 1.7 triệu đồng so với con số thực tế;
Sai số bình phương là 2356614.348944; Độ tin cậy ở mức thấp, khoảng -0.3%.
4.3. API - Test
4.3.1. Web services set up
Sau khi hồn thành chạy mơ hình và đánh giá các chỉ số, bước tiếp theo là tạo API bằng cách nhấn vào nút “Set up web service” để lưu mơ hình và tạo Predictive Experiment.
Tại Predictive Experiment, kết nối Web service input với Score model. Add thêm tùy chọn “Select column in dataset” từ toolbar bên trái vào, kết nối 2 đầu của chức năng này với Score model và Web service output. Trong mục “Launch column” của Select column in dataset, chọn “Score Labels” để yêu cầu hiển thị kết quả dự báo doanh thu ngày khi test ở website.
Hình 4.7: Predictive Experiment
Sau khi sắp xếp các tính năng, nhấn nút “run” một lần nữa để chạy lại mơ hình. Sau khi việc chạy kết thúc và khơng có lỗi như được thể hiện ở hình 3.10, nhấn vào nút “Deploy web services” ở toolbar phía dưới màn hình.
4.3.2. Test
Sau khi Deploy web services thành công, Azure sẽ tự động mở giao diện của tính năng web services với link website dự báo và file excel để kiểm tra dự báo.
Nhấn nút “Test” và nhập các biến độc lập để dự báo. Ví dụ, dự báo doanh thu ngày 23/7/2020 của cửa hàng SAY Coffee Lê Văn Sỹ khi tất cả các bên thứ 3 là Grab, Now, Baemin và Goviet đều có chương trình khuyến mãi, kết quả trả về là doanh thu ước tính đạt khoảng 11,809,421 VNĐ
Hình 4.9: Giao diện dự báo
Hình 4.10: Kết quả dự
báo 4.3.3. Dự báo trực tiếp trên Excel
Ngoài việc dự báo doanh thu tại web services đã được tạo, doanh thu của cửa hàng SAY Coffee Lê Văn Sỹ cũng có thể được dự báo trực tiếp tại file Excel được tải về sau khi nhấn vào “Excel 2013 or later workbook” tại giao diện Web services của AMLS. Sau khi tải file về và nhập thông tin liên quan như ngày và các chương trình khuyến mãi, chọn dữ liệu mẫu vào input, chọn vị trí muốn trả output và so sánh kết quả dự báo so với file data excel gốc. Việc dự báo trực tiếp trên Excel sẽ giúp người dùng tiết kiệm thời gian bởi trên nền tảng AMLS
chúng ta chỉ có thể dự báo kết quả cho một ngày duy nhất trong mỗi lần nhập thơng tin, trong khi đó chúng ta có thể dự báo doanh thu cho nhiều ngày trên Excel một cách nhanh chóng.
Kết luận chương 4
Ở chương 4, quy trình xây dựng, chạy thử và kiểm tra mơ hình dự báo thực tế trên nền tảng AMLS được trình bày một cách ngắn gọn nhưng rất đầy đủ và dễ hình dung. Các chỉ số đo lường dữ liệu, các chỉ số có ý nghĩa thống kê cũng đã được nêu ra trong nội dung chương. Chương 4 cũng cung cấp cái nhìn tổng quan về quá trình tạo API và Deploy web services, cũng như việc dự báo trực tiếp trên file Excel.
CHƯƠNG 5: KẾT LUẬN 5.1. Tóm tắt
Những thành tựu mà con người đạt được trong thời đại công nghệ 4.0 ngày nay đã và đang góp phần vào việc cải thiện và nâng cao hiệu quả của hầu hết các lĩnh vực trong cuộc sống, đặc biệt là trong mảng kinh doanh nói chung và ngành F&B nói riêng. Việc ứng dụng những phần mềm, công nghệ big data vào dự báo doanh thu cho các cửa hàng cà phê, nhà hàng đang đóng vai trò rất lớn trong việc giúp các nhà quản lý/chủ sở hữu cửa hàng làm tốt hơn công tác quản lý việc kinh doanh: quản lý nguyên vật liệu, quản lý hàng tồn kho, quản lý và sắp xếp nhân sự phù hợp; từ đó có thể tối thiểu hóa chi phí và tối đa hóa doanh thu cho cửa hàng. Đó là những nội dung mà chương 1 đã đề cập đến. Bên cạnh đó, chương 1 cũng đã đưa ra bức tranh toàn cảnh của đề tài, hướng đi của nghiên cứu và làm mở đầu cho các nội dung triển khai cụ thể ở các chương sau. Ở chương 2, những lý thuyết về các vấn đề liên quan đến đề tài như doanh thu và quản lý doanh thu, khuyến mãi và các chương trình khuyến mãi hợp tác với bên thứ 3, vai trò của bên thứ 3, mối quan hệ giữa khuyến mãi và doanh thu cùng với những lý thuyết về các phương pháp dự báo doanh thu khả thi để cân nhắc và lựa chọn áp dụng phương pháp dự báo phù hợp nhất vào mơ hình dự báo doanh thu cho SAY Coffee Lê Văn Sỹ.
Thiết kế nghiên cứu, lựa chọn phương pháp dự báo nhằm tạo ra mơ hình dự báo doanh thu của cửa hàng SAY Coffee Lê Văn Sỹ dựa trên nền tảng AMLS, mô tả dữ liệu cùng phương pháp thu thập dữ liệu là những nội dung được trình bày ở Chương 3: Dữ liệu và phương pháp luận. Bên cạnh đó, chương 3 cũng đưa ra cái nhìn tổng quan về machine learning và giới thiệu về nền tảng AMLS.
Sau khi quyết định và thống nhất phương pháp nghiên cứu, nhóm tiến hành xây dựng mơ hình dự báo doanh thu ngày cho cửa hàng SAY Coffee Lê Văn Sỹ thực tế trên nền tảng AMLS; kiểm tra, chạy mơ hình, tạo API và tạo Web services.C hương 4 cung cấp cái nhìn tổng quan về q trình thực hiện những cơng việc trên.
Chương 5 sẽ tóm tắt lại một cách ngắn gọn nội dung của các chương trước đó, kết luận về mơ hình dự báo được xây dựng, nêu lên hàm ý đối với nhà quản lý trong việc dự báo doanh thu và quản lý bán hàng, cũng như liệt kê những hạn chế mà bài nghiên cứu gặp phải và cần khắc phục.
5.2. Kết luận
Từ việc xác định tầm quan trọng của dự báo doanh thu đối với việc quản lý kinh doanh tại cửa hàng nói chung và tối thiểu hóa chi phí/tối đa hóa lợi nhuận nói riêng, dựa vào các lý thuyết đã nêu ở chương 2 về các khái niệm và mơ
hình dự báo liên quan đến đề tài, nhóm nghiên cứu đã tiến hành thiết kế và xây dựng nghiên cứu, thu thập và xử lý dữ liệu cần thiết để tạo ra mơ hình dự báo doanh thu thực tế trên nền tảng Azure machine learning. Mặc dù vì một số lý do liên quan đến bộ dữ liệu khiến các chỉ số thống kê như độ tin cậy của mơ hình là chưa cao nhưng mơ hình cũng đã cho thấy phương pháp dự báo hồi quy tuyến tính (Linear regression) đã được sử dụng là phương pháp hiệu quả nhất để dự báo doanh thu cho cửa hàng. Tuy vậy, để mơ hình dự báo trở nên đáng tin cậy hơn và có thể áp dụng vào thực tế, bộ dữ liệu (và có thể là mơ hình) vẫn cần được bổ sung và chỉnh sửa thêm.
5.3. Hàm ý đối với nhà quản trị
Từ kết quả của nghiên cứu có thể rút ra những kết luận và đề ra giải pháp để nhà quản lý có thể tham khảo và đưa ra các quyết định kinh doanh tốt hơn như sau:
Vai trò của dự báo doanh thu là rất quan trọng
Kết hợp cùng những nghiên cứu về dự báo doanh thu đã có sẵn, nghiên cứu này phần nào củng cố và khẳng định thêm một lần nữa về tầm quan trọng của việc dự báo doanh thu đối với công tác quản lý cửa hàng và điều hành việc kinh doanh. Dự báo doanh thu có vai trị rất quan trọng đối với việc điều phối sản xuất và giúp nhà quản lý có thể đưa ra những quyết định chính xác nhất trong các tình huống, cụ thể là:
Giúp quản lý dự đốn được tình hình kinh doanh trong tương lai để có thể điều chỉnh lại các chương trình khuyến mãi cho phù hợp (ví dụ như kết quả dự báo doanh thu trong ngày sắp tới là rất thấp hoặc không đạt chỉ tiêu đề ra khi cửa hàng không chạy hoặc chỉ chạy chương trình khuyến mãi với 1 bên thứ 3 duy nhất, quản lý sẽ phải cân nhắc và đưa ra các chương trình khuyến mãi riêng ngay tại cửa hàng, hoặc bổ sung các chương trình khuyến mãi với những bên thứ 3 khác tùy theo khả năng. Ngược lại, trong trường hợp ngày hơm đó cửa hàng dự tính sẽ có nhiều chương trình khuyến mãi hợp tác với các bên thứ 3 nhưng doanh thu dự báo khá thấp, quản lý cửa hàng cần phải cân nhắc lại về việc bỏ bớt chương trình khuyến mãi với một hoặc nhiều bên thứ 3 để tiết kiệm những chi phí khơng đáng có);
Dự báo doanh thu trong ngày cũng giúp hoạt động quản lý và điều phối nhân sự tốt hơn. Chẳng hạn như dự báo doanh thu ngày kinh doanh sắp tới cao đột biến so với những ngày bình thường, quản lý cửa hàng có thể chuẩn bị phương án dự phịng để điều động thêm nhân sự khi cần thiết, đảm bảo hoạt động kinh doanh trong ngày hơm đó được diễn ra thuận lợi, tránh gây gián đoạn công việc do thiếu nhân sự và tránh việc khiến khách hàng phải chờ lâu, hạn chế việc khách hàng giảm mức độ hài lòng đối với cửa hàng;
Việc dự đoán được doanh thu ngày của cửa hàng cũng giúp quản lý,