(TIỂU LUẬN) BIG DATA PREDICT HOTEL BOOKING CANCELLATIONS đâu là mô hình tối ưu nhất để dự đoán huỷ đặt phòng khách sạn

24 7 0
(TIỂU LUẬN) BIG DATA PREDICT HOTEL BOOKING CANCELLATIONS đâu là mô hình tối ưu nhất để dự đoán huỷ đặt phòng khách sạn

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

BIG DATA PREDICT HOTEL BOOKING Lecturer:CANCELLATIONSPhD.TranThiPhi Phung Nhóm: Ủa Em ? Thành Viên Nhóm Ủa Em ? Phan Thị Mỹ Duyên Lê Đào Trúc Lan Lê Hồng Quân Bùi Hồng Thiện Nguyễn Đức Tính Tơ Huyền Trang 01 Sơ • Lý nh v sác Câu hỏi nghiên cứu: • lược Đâu mơ hình tối ưu để dự đốn huỷ đặt phịng khách sạn? Làm để cải thiện tính xác mơ • hình? Mục tiêu nghiên cứu: Xây dựng mơ hình dự đốn huỷ đặt phịng khách sạn • • So sánh tính xác mơ hình đề xuất mơ hình tối ưu để dự đốn huỷ đặt phịng Ý nghĩa nghiên cứu: Nghiên cứu đóng góp cho lý thuyết dự báo huỷ đặt phịng • • Đề xuất mơ hình tối ưu giúp nhà quản lý thực sách phù hợp để quản lý doanh thu 02 Cơ sở lý thuyết Các nghiên cứu Kỹ thuật địnhtrướctính phổ biến (Song Li, 2008) khơng thu kết xác chúng không dựa số liệu cần thiết (Yüksel, 2005) Kỹ thuật định lượng lựa chọn tối ưu thơng tin q khứ định lượng mẫu khứ ngoại suy cách hợp lý cho tương lai (Lee cộng sự, 2008) Chuỗi thời gian phi nhân (ARIMA, SARIMA, TARIMA) Kinh tế lượng (VAR, hồi quy, AIDS) Dựa trí tuệ nhân tạo ( SVM, Tree-based methods, ANN) • • • Đề xuất Nghiên cứu Agustín Eleazar (2020) sử dụng mơ hình ANN (kết hợp thuật toán di truyền GA) mang lại kết dự đoán tỷ lệ hủy bỏ xác đến 98% Tuy nhiên việc kết hợp mơ hình phức tạp Nhóm đề xuất sử dụng phương pháp truyền thống đơn giản bổ sung biến giá phòng, phân khúc thị trường, kênh phân phối, 03 Phương Pháp Nghiên Cứu 3.1 Thu Thập chuẩn bị Tập liệu liệubao gồm: khách sạn thành phố khách sạn nghỉ dưỡng Bồ Đào Nha Bao gồm: 119.000 lượt đặt phòng (lượt đặt trước khoảng thời gian khoảng năm từ 1/7/2015 31/8/2017) Các bước chuẩn bị liệu bao gồm: Chọn lọc loại bỏ biến không cần thiết thiếu liệu Encode liệu phân loại (categorical data) Chuẩn hóa liệu số (numerical data) • • • => Để làm cho mơ hình nhạy cảm với thang đo trì tính qn so sánh kết chúng Kết phân tích mơ tả cho thấy khoảng 40% lượt booking đặt online qua đại lý công ty du lịch Tỉ lệ huỷ đặt phịng trung bình hai khách sạn 37%, đó, khách sạn thành phố chiếm 42% khách sạn nghỉ dưỡng chiếm 28% 3.2 Phương pháp xử lý Nhóm dùng GoogliệueColab để áp dụng thuật tốn máy học có giám sát khác dựa ngơn ngữ lập trình Python Các thuật toán áp dụng bao gồm: Decision Tree Classifier, Random Forest, CatBoost ANN Decision Tree Là phân cấp có cấu trúc dùng để phân lớp đối tượng dựa vào dãy luật Cho liệu đối tượng gồm thuộc tính với lớp (classes) nó, định sinh luật để dự đoán lớp liệu chưa biết Random Forests Là thuật tốn học có giám sát (supervised learning) Nó sử dụng cho phân lớp hồi quy Nó thuật toán linh hoạt dễ sử dụng Một khu rừng bao gồm cối CatBoost Là thuật toán khoa học máy tính phát triển nhà nghiên cứu kỹ sư Yandex, kế thừa thuật toán MatrixNet sử dụng rộng rãi công ty để xếp hạng nhiệm vụ, dự báo đưa đề xuất Mạng Nơron nhân tạo (Artificial Neural Network- ANN) Là mơ hình xử lý thông tin mô dựa hoạt động hệ thống thần kinh sinh vật, bao gồm số lượng lớn Nơron gắn kết để xử lý thông tin Workflow Process 04 XỬ LÝ DỮ LIỆU & KẾT QUẢ DỰ Kết Quả Dự Trong phầnĐốnnàykết kỹ thuật trình bày thảo luận Các thước đo số kỹ thuật trình bày trước, sau thảo luận mơ hình kết 10 4.1 Thước đo hiệu suất Confusion Matrix: Là bảng tương quan cho thấy khác biệt giữ phân loại thực tế phân loại dự đoán cho thử nghiệm bảng có dán nhãn Thể có điểm liệu thực thuộc vào class, dự đoán rơi vào class Mối quan hệ class thể qua thước đo recall (tỷ lệ thu hồi) precision (độ đặc hiệu) 11 4.1 Thước đo hiệu suất Recall (đơi cịn gọi Sensitivity - độ nhạy): định nghĩa tỉ lệ số điểm Positive mơ hình dự đốn (TP) số điểm thực positive (TP + FN) Recall cao, tức số điểm positive bị bỏ sót Nó có cơng thức là: 12 Precision: định nghĩa tỉ lệ số điểm Positive mơ hình dự đốn (TP) tổng số điểm mơ hình dự đốn Positive (TP+FP) Precision cao đồng nghĩa với việc độ xác điểm tìm cao ngược lại Nó có cơng thức là: 13 Accuracy: độ xác tức độ dự đoán tần suất người phân loại thực dự đốn (Precision) xác Độ xác tỷ lệ số dự đoán tổng số dự đoán 14 F1 Score: phương pháp đơn giản để đo lường khác biệt hai lớp có giá trị thực, kết hợp với precision recall (Güneş cộng sự, 2010) Với F1-score, cần quan tâm đến số (thay hai – precision recall) F1-score cao tươngứng precision recall càngcao, mơ hình phân loại tốt 15 4.2 Kết mơ hình • • • Các thước đo áp dụng cho mơ hình: Decision Tree, Random Forest CatBoost Đối với mơ hình ANN, việc áp dụng thước đo f1 score, precision recall tạo nhầm lẫn trình đánh giá hữu dụng cho tồn liệu Do đó, mơ hình ANN đánh giá thước đo Accuracy kết so sánh mơ hình so sánh thước đo Accuracy 16 4.2 Kết mơ hình Random Forest Decision Tree 17 4.2 Kết mơ hình CatBoost ANN 18 4.2 So sánh mơ hình • • • Kết cho thấy mơ hình cho hiệu suất tốt với độ xác cao từ 95% Trong đó, CatBoost mang lại độ xác cao (99.5%), tiếp đến ANN, Random Forest cuối Decision Tree Mặc dù thuật toán máy học chưa nhắc đến nghiên cứu trước đề tài huỷ đặt phịng khách sạn CatBoost có tiềm trở thành mơ hình đơn giản hiệu để áp dụng cho lĩnh vực mở rộng đến ngành liên quan tương lai 19 KẾT LUẬN 20 ĐĨNG GĨP CỦA NGHIÊN Góp phần mở rộng lý thuyết có sẵn ngànhCỨUkhách sạn nhà nghỉ cách đề xuất phương pháp luận để dự báo số lượt hủy đặt phịng khách sạn trí tuệ nhân tạo; khẳng định tiện ích liệu PNR để dự báo lần hủy khách sạn riêng lẻ Các dự báo điều chỉnh gần với xu hướng thị trường Cho phép dự báo tình trạng huỷ phịng khách sạn với mức độ xác cao cách xử dụng biến mà khách sạn dễ tiếp cận mở rộng Sử dụng CatBoots Giảm độ phức tạp, đơn giản, nhanh chóng Có thể điều chỉnh gần với xu hướng mới, tạo mơ hình cung cấp báo cách sử dụng thơng tin có sẵn q trình đặt phịng 21 HÀM Ý QUẢN TRỊ Từ quan điểm từ nhà quản lý, kết đạt hồ sơ lịch sử khách hàng (PNR) điều cần thiết cho doanh nghiệp kinh doanh dịch vụ khách sạn Hạn chế khó khăn tổn thất doanh thu mà việc huỷ khách sạn tạo Kỹ thuật giúp ban quản lý nắm thơng tin trước để họ thiết lập sách giá phù hợp Tạo lợi cạnh tranh đáng kể dự báo tỷ lệ hủy với mức độ xác cao tốc độ xử lý nhanh với lượng liệu lớn, đồng thời xác định khách hàng có khả huỷ phịng Do đó, khách sạn thực hành động chủ động để khuyến khích khách hàng trì đặt phịng cách gửi tin nhắn, email, lời nhắc, liên hệ trực tiếp 22 THANK YOU FOR LISTENING 23 ... lược Đâu mơ hình tối ưu để dự đốn huỷ đặt phòng khách sạn? Làm để cải thiện tính xác mơ • hình? Mục tiêu nghiên cứu: Xây dựng mơ hình dự đốn huỷ đặt phịng khách sạn • • So sánh tính xác mơ hình. .. đề xuất mơ hình tối ưu để dự đốn huỷ đặt phịng Ý nghĩa nghiên cứu: Nghiên cứu đóng góp cho lý thuyết dự báo huỷ đặt phịng • • Đề xuất mơ hình tối ưu giúp nhà quản lý thực sách phù hợp để quản lý... ngànhCỨUkhách sạn nhà nghỉ cách đề xuất phương pháp luận để dự báo số lượt hủy đặt phịng khách sạn trí tuệ nhân tạo; khẳng định tiện ích liệu PNR để dự báo lần hủy khách sạn riêng lẻ Các dự báo

Ngày đăng: 06/12/2022, 06:26

Hình ảnh liên quan

Là bảng tương quan cho thấy sự khác biệt giữ phân loại thực tế và phân loại dự đoán cho bộ thử nghiệm trong một bảng có dán nhãn - (TIỂU LUẬN) BIG DATA PREDICT HOTEL BOOKING CANCELLATIONS đâu là mô hình tối ưu nhất để dự đoán huỷ đặt phòng khách sạn

b.

ảng tương quan cho thấy sự khác biệt giữ phân loại thực tế và phân loại dự đoán cho bộ thử nghiệm trong một bảng có dán nhãn Xem tại trang 12 của tài liệu.
điểm Positive mô hình dự đốn đúng - (TIỂU LUẬN) BIG DATA PREDICT HOTEL BOOKING CANCELLATIONS đâu là mô hình tối ưu nhất để dự đoán huỷ đặt phòng khách sạn

i.

ểm Positive mô hình dự đốn đúng Xem tại trang 14 của tài liệu.
4.2 So sánh mơ hình • Kết quả cho thấy cả 4 mơ hình đều cho hiệu suất tốt với độ chính xác cao từ 95% - (TIỂU LUẬN) BIG DATA PREDICT HOTEL BOOKING CANCELLATIONS đâu là mô hình tối ưu nhất để dự đoán huỷ đặt phòng khách sạn

4.2.

So sánh mơ hình • Kết quả cho thấy cả 4 mơ hình đều cho hiệu suất tốt với độ chính xác cao từ 95% Xem tại trang 20 của tài liệu.

Tài liệu cùng người dùng

Tài liệu liên quan