1. Trang chủ
  2. » Giáo Dục - Đào Tạo

BIG DATA PREDICT HOTEL BOOKING CANCELLATIONS đâu là mô hình tối ưu nhất để dự đoán huỷ đặt phòng khách sạn

23 9 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

BIG DATA PREDICT HOTEL BOOKING CANCELLATIONS Lecturer: PhD Tran Thi Phi Phung Nhóm: Ủa Em ? Thành Viên Nhóm Ủa Em ? Phan Thị Mỹ Duyên Lê Hồng Quân Lê Đào Trúc Lan Nguyễn Đức Tính Bùi Hồng Thiện Tơ Huyền Trang 01 Sơ lược • Lý chọn đề tài: nhu cầu phát triển mơ hình tối ưu để dự báo huỷ phòng cá nhân vô cần thiết, điều giúp chủ khách sạn thấy khả huỷ phòng khách hàng để có chiến lược giữ chân khách hàng phù hợp, lúc thiết lập sách đặt, huỷ phịng tốt Câu hỏi nghiên cứu: • • Đâu mơ hình tối ưu để dự đốn huỷ đặt phịng khách sạn? • Làm để cải thiện tính xác mơ hình? Mục tiêu nghiên cứu: • • Đối tượng nghiên cứu: Xây dựng mơ hình dự đốn huỷ đặt phịng khách sạn So sánh tính xác mơ hình đề xuất mơ hình tối ưu để dự đốn huỷ đặt phịng Việc huỷ đặt phòng khách sạn với nguồn liệu thực tế từ Hotel Booking Demand datasets Ý nghĩa nghiên cứu: • • Nghiên cứu đóng góp cho lý thuyết dự báo huỷ đặt phòng Đề xuất mơ hình tối ưu giúp nhà quản lý thực sách phù hợp để quản lý doanh thu 02 Cơ sở lý thuyết Các nghiên cứu trước Kỹ thuật định tính phổ biến (Song Li, 2008) khơng thu kết xác chúng không dựa số liệu cần thiết (Yüksel, 2005) Kỹ thuật định lượng lựa chọn tối ưu thơng tin q khứ định lượng mẫu khứ ngoại suy cách hợp lý cho tương lai (Lee cộng sự, 2008) • • • Chuỗi thời gian phi nhân (ARIMA, SARIMA, TARIMA) Kinh tế lượng (VAR, hồi quy, AIDS) Dựa trí tuệ nhân tạo ( SVM, Tree-based methods, ANN) Đề xuất Nghiên cứu Agustín Eleazar (2020) sử dụng mơ hình ANN (kết hợp thuật toán di truyền GA) mang lại kết dự đốn tỷ lệ hủy bỏ xác đến 98% Tuy nhiên việc kết hợp mơ hình phức tạp Nhóm đề xuất sử dụng phương pháp truyền thống đơn giản bổ sung biến giá phòng, phân khúc thị trường, kênh phân phối, 03 Phương Pháp Nghiên Cứu 3.1 Thu Thập chuẩn bị liệu Tập liệu bao gồm: khách sạn thành phố khách sạn nghỉ dưỡng Bồ Đào Nha Bao gồm: 119.000 lượt đặt phòng (lượt đặt trước khoảng thời gian khoảng năm từ 1/7/2015 - 31/8/2017) Các bước chuẩn bị liệu bao gồm: • • • Chọn lọc loại bỏ biến không cần thiết thiếu liệu Encode liệu phân loại (categorical data) Chuẩn hóa liệu số (numerical data) => Để làm cho mơ hình nhạy cảm với thang đo trì tính qn so sánh kết chúng Kết phân tích mô tả cho thấy khoảng 40% lượt booking đặt online qua đại lý công ty du lịch Tỉ lệ huỷ đặt phịng trung bình hai khách sạn 37%, đó, khách sạn thành phố chiếm 42% khách sạn nghỉ dưỡng chiếm 28% 3.2 Phương pháp xử lý liệu Nhóm dùng Google Colab để áp dụng thuật toán máy học có giám sát khác dựa ngơn ngữ lập trình Python Các thuật tốn áp dụng bao gồm: Decision Tree Classifier, Random Forest, CatBoost ANN Decision Tree Random Forests Là phân cấp có cấu trúc dùng để phân lớp đối tượng dựa Là thuật tốn học có giám sát (supervised learning) Nó sử dụng cho vào dãy luật Cho liệu đối tượng gồm thuộc tính với phân lớp hồi quy Nó thuật toán linh hoạt dễ sử dụng Một lớp (classes) nó, định sinh luật để dự đoán lớp khu rừng bao gồm cối liệu chưa biết CatBoost Mạng Nơron nhân tạo (Artificial Neural Network- ANN) Là thuật tốn khoa học máy tính phát triển nhà nghiên cứu Là mơ hình xử lý thông tin mô dựa hoạt động hệ thống kỹ sư Yandex, kế thừa thuật toán MatrixNet sử dụng thần kinh sinh vật, bao gồm số lượng lớn Nơron gắn kết để xử lý rộng rãi công ty để xếp hạng nhiệm vụ, dự báo đưa đề thông tin xuất Workflow Process 04 XỬ LÝ DỮ LIỆU & KẾT QUẢ DỰ ĐỐN Kết Quả Dự Đốn Trong phần kết kỹ thuật trình bày thảo luận Các thước đo số kỹ thuật trình bày trước, sau thảo luận mơ hình kết 10 4.1 Thước đo hiệu suất Confusion Matrix: Là bảng tương quan cho thấy khác biệt giữ phân loại thực tế phân loại dự đoán cho thử nghiệm bảng có dán nhãn Thể có điểm liệu thực thuộc vào class, dự đoán rơi vào class Mối quan hệ class thể qua thước đo recall (tỷ lệ thu hồi) precision (độ đặc hiệu) 11 4.1 Thước đo hiệu suất Recall (đơi cịn gọi Sensitivity - độ nhạy): định nghĩa tỉ lệ số điểm Positive mơ hình dự đốn (TP) số điểm thực positive (TP + FN) Recall cao, tức số điểm positive bị bỏ sót Nó có cơng thức là: 12 Precision: định nghĩa tỉ lệ số điểm Positive mơ hình dự đốn (TP) tổng số điểm mơ hình dự đốn Positive (TP+FP) Precision cao đồng nghĩa với việc độ xác điểm tìm cao ngược lại Nó có cơng thức là: 13 Accuracy: độ xác tức độ dự đoán tần suất người phân loại thực dự đốn (Precision) xác Độ xác tỷ lệ số dự đoán tổng số dự đoán 14 F1 Score: phương pháp đơn giản để đo lường khác biệt hai lớp có giá trị thực, kết hợp với precision recall (Güneş cộng sự, 2010) Với F1-score, cần quan tâm đến số (thay hai – precision recall) F1-score cao tươngứng precision recall càngcao, mơ hình phân loại tốt 15 4.2 Kết mơ hình • • Các thước đo áp dụng cho mô hình: Decision Tree, Random Forest CatBoost Đối với mơ hình ANN, việc áp dụng thước đo f1 score, precision recall tạo nhầm lẫn trình đánh giá hữu dụng cho tồn liệu • Do đó, mơ hình ANN đánh giá thước đo Accuracy kết so sánh mơ hình so sánh thước đo Accuracy 16 4.2 Kết mơ hình Random Forest Decision Tree 17 4.2 Kết mơ hình CatBoost ANN 18 • 4.2 So sánh mơ hình Kết cho thấy mơ hình cho hiệu suất tốt với độ xác cao từ 95% • Trong đó, CatBoost mang lại độ xác cao (99.5%), tiếp đến ANN, Random Forest cuối Decision Tree • Mặc dù thuật toán máy học chưa nhắc đến nghiên cứu trước đề tài huỷ đặt phịng khách sạn CatBoost có tiềm trở thành mơ hình đơn giản hiệu để áp dụng cho lĩnh vực mở rộng đến ngành liên quan tương lai 19 KẾT LUẬN 20 ĐĨNG GĨP CỦA NGHIÊN CỨU Góp phần mở rộng lý thuyết có sẵn ngành khách sạn nhà nghỉ cách đề xuất phương pháp luận để dự báo số lượt hủy đặt phòng khách sạn trí tuệ nhân tạo; khẳng định tiện ích liệu PNR để dự báo lần hủy khách sạn riêng lẻ Các dự báo điều chỉnh gần với xu hướng thị trường Cho phép dự báo tình trạng huỷ phịng khách sạn với mức độ xác cao cách xử dụng biến mà khách sạn dễ tiếp cận mở rộng Sử dụng CatBoots Giảm độ phức tạp, đơn giản, nhanh chóng Có thể điều chỉnh gần với xu hướng mới, tạo mơ hình cung cấp báo cách sử dụng thơng tin có sẵn q trình đặt phịng 21 HÀM Ý QUẢN TRỊ Từ quan điểm từ nhà quản lý, kết đạt hồ sơ lịch sử khách hàng (PNR) điều cần thiết cho doanh nghiệp kinh doanh dịch vụ khách sạn Hạn chế khó khăn tổn thất doanh thu mà việc huỷ khách sạn tạo Kỹ thuật giúp ban quản lý nắm thông tin trước để họ thiết lập sách giá phù hợp Tạo lợi cạnh tranh đáng kể dự báo tỷ lệ hủy với mức độ xác cao tốc độ xử lý nhanh với lượng liệu lớn, đồng thời xác định khách hàng có khả huỷ phịng Do đó, khách sạn thực hành động chủ động để khuyến khích khách hàng trì đặt phịng cách gửi tin nhắn, email, lời nhắc, liên hệ trực tiếp 22 THANK YOU FOR LISTENING 23 ... • • Đâu mơ hình tối ưu để dự đốn huỷ đặt phịng khách sạn? • Làm để cải thiện tính xác mơ hình? Mục tiêu nghiên cứu: • • Đối tượng nghiên cứu: Xây dựng mơ hình dự đốn huỷ đặt phịng khách sạn So... phịng khách sạn So sánh tính xác mơ hình đề xuất mơ hình tối ưu để dự đốn huỷ đặt phòng Việc huỷ đặt phòng khách sạn với nguồn liệu thực tế từ Hotel Booking Demand datasets Ý nghĩa nghiên cứu: • •... triển mơ hình tối ưu để dự báo huỷ phịng cá nhân vô cần thiết, điều giúp chủ khách sạn thấy khả huỷ phòng khách hàng để có chiến lược giữ chân khách hàng phù hợp, lúc thiết lập sách đặt, huỷ phịng

Ngày đăng: 11/08/2022, 10:27

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w