ĐẠI HỌC UEH TRƯỜNG KINH DOANH KHOA CÔNG NGHỆ THÔNG TIN KINH DOANH ĐỀ ÁN CUỐI KỲ MÔN KHOA HỌC DỮ LIỆU ĐỀ TÀI: ỨNG DỤNG DATA SCIENCE VÀ PHÂN TÍCH NHỮNG KHÁCH SẠN B&B CHO THUÊ NGẮN HẠN Ở TH
TỔNG QUAN VỀ DATA SCIENCE
Data Science là gì?
Khoa học dữ liệu (Data Science) đƣợc định nghĩa là tất cả những gì về thu thập, tổ chức, lưu trữ, xử lý và khai thác dữ liệu để tìm ra insight giá trị Sau đó, trực quan hóa các insight cho các bên liên quan, để chuyển hóa insight thành hành động Đây là lĩnh vực đa ngành sử dụng các phương pháp và quy trình khoa học để rút ra insight từ dữ liệu
Hình 1.1.1 Data Science và các lĩnh vực liên quan
Với sự xuất hiện của công nghệ mới các dữ liệu đã tăng lên theo cấp số nhân Điều này đã đem đến một cơ hội mới để phân tích cũng nhƣ chuyển hóa các insight ý nghĩa từ data
Theo đó, yêu cầu bức thiết đặt ra cần có một chuyên gia “Data Scientist”, người mà có khả năng dùng các công cụ thống kê và Machine Learning Một Data Scientist không chỉ dừng lại ở việc phân tích dƣ dữlieuej, mà còn biết sử dụng thuật toán Machine Learning để dự đoán tương lai của một sự kiện
Do đó, có thể hiểu Data Science là một lĩnh vực liên quan đến xử lý dữ liệu, phân tích và trích xuất thông tin chi tiết từ dữ liệu bằng các phương pháp thống kê và thuật toán máy tính khác nhau Đây là một lĩnh vực đa ngành kết hợp Toán học, Thống kê và Khoa học máy tính
Một số ví dụ tiêu biểu của Khoa học dữ liệu:
Một ví dụ tiêu biểu là đội ngũ Khoa học dữ liệu của các hãng công nghệ nhƣ Google, Amazon, Facebook, Microsoft, Youtube… Họ không ngừng tham gia vào quá trình thu thập, phân tích, dự đoán các tri thức có từ dữ liệu để hỗ trợ cho doanh nghiệp của mình
Một ví dụ ấn tƣợng nhất chính là ứng dụng hỗ trợ tranh cử tổng thống của ông Obama Các nhà Khoa học dữ liệu đã tập trung để phát triển ứng dụng hỗ trợ chiến dịch tái tranh cử tổng thống Mỹ năm 2012 của ông Barack Obama góp phần giúp ông đắc cử tổng thống nhiệm kỳ thứ 2 liên tiếp.
Vai trò và tính ứng dụng của Data Science trong thời kỳ công nghệ
Các công ty phụ thuộc vào nền tảng dữ liệu để cấu trúc, phát triển và cải tiến doanh nghiệp Các Data để xuất ra những insight ý nghĩa Những insight này rất hữu ích khi phân tích công ty và các hoạt động của công ty trên thị trường từ đó đưa ra các quyết định đúng đắn
Cũng như các ngành công nghiệp thương mại khác, ngành chăm sóc sức khỏe cũng ứng dụng Data Science Nơi mà công nghệ đang có nhu cầu rất lớn để nhận dạng các khối u siêu nhỏ ngay từ giai đoạn đầu
Thống kê chỉ ra số lượng vai trò của các Data Scientist đã tăng trưởng 650% kể từ năm 2012 Khoảng 11,5 triệu việc làm liên quan đến chức danh này sẽ đƣợc tạo ra đến năm 2016 (theo U.S Bureau of Labor Statistics) Bên cạnh đó công việc của các Data Scientist đƣợc xếp hạng top các công việc nổi bật trên LinkedIn.
ỨNG DỤNG CỦA DATA SCIENCE ĐỐI VỚI KHÁCH SẠN B&B CHO THUÊ NGẮN HẠN
Tạo một phần mềm khách sạn B&B cho thuê ngắn hạn
Link website tham khảo phần mềm: https://www.expedia.com.vn/New-Orleans- Vacation-Rentals.d178292.Travel-Guide-VacationRentals
Hình 2.1.1 Website Expedia - New Orleans Vacation Rentals
Nhờ phần mềm này mà mọi người dù ở bất kì đâu đều vẫn có thể đặt phòng, trả phòng, thanh toán online mà không phải trả bất kỳ khoản hoa hồng nào khác Và cũng có thể so sánh giá phòng, xem xét đánh giá của từng vị khách đã từng trải nghiệm khách sạn
Hình 2.1.2 Website Expedia - Top Holiday Rentals in New Orleans
Các công cụ đặt phòng đƣợc hỗ trợ bởi AI thu thập dữ liệu mỗi khi khách hàng hoặc khách hàng tiềm năng tương tác với trang web hoặc công cụ đặt phòng Hầu hết các công cụ này đều đƣợc trang bị các mô hình học tập nâng cao để phân tích dữ liệu và tìm hiểu thêm về hành vi của khách hàng và đƣa ra mức giá phù hợp nhất
Ngoài ra, khách sạn còn có mặt trên các nền tảng mạng xã hội nhƣ: Facebook, Instagram và khách hàng cũng có thể tương tác với khách sạn theo những phương tiện truyền thông xã hội này
Ngày nay, họ đang sử dụng nó cho các yêu cầu, nhu cầu, ý kiến hoặc mối quan tâm Trong khi đó, các chủ khách sạn có thể sử dụng các nền tảng này để cung cấp thông tin của khách sạn cho họ
Hình 2.1.3 Website Expedia - Sonder at 1500 Canal
Mặt khác, tích cực trên mạng xã hội và trang web cũng có nghĩa là khách hàng có thể bày tỏ sự không hài lòng của họ để chúng ta có thể chắt lọc tiếp thu và rút kinh nghiệm
Hình 2.1.4 Website Expedia - Guest reviews
Ứng dụng trong hệ thống quản lý khách sạn
Quản lý doanh thu là ứng dụng dữ liệu và phân tích để tối ƣu hóa giá và tính sẵn có của sản phẩm để đạt đƣợc doanh thu tối đa
Khi quản lý doanh thu đƣợc cung cấp bằng dữ liệu, các khách sạn có thể dự đoán tốt hơn nhu cầu và phân tích các mẫu hành vi của khách hàng chính xác hơn Phân tích dữ liệu trong ngành khách sạn có thể giúp chủ khách sạn phát triển chiến lƣợc quản lý doanh thu bằng cách sử dụng dữ liệu thu thập từ nhiều nguồn khác nhau nhƣ thông tin tìm thấy trên internet
Thông qua phân tích các dữ liệu này, họ có thể đƣa ra dự đoán giúp chủ khách sạn, họ sẽ có thể tìm hiểu về:
Kỳ vọng về nhu cầu lưu trú trong các khách sạn
Tỷ lệ giá trị tốt nhất cho khách của họ
- Phân chia thời gian làm việc của các nhân viên để giải quyết vấn đề thiếu hụt hay dư thừa nguồn lực :
Hình 2.2.1 Sơ đồ phần mềm quản lý khách sạn
- Quản lý phòng, tính giờ phòng và tính tiền theo thời gian thực điều này giúp thu ngân thanh toán chính xác và nhanh chóng cho khách hàng…
Hình 2.2.2 Phần mềm quản lý khách sạn
Phân tích hoạt động
Phân tích hoạt động là sự kết hợp của cả phân tích dữ liệu và thông tin kinh doanh Với sự trợ giúp của data science, trí tuệ nhân tạo phân tích hoạt động đo lường các chức năng thời gian thực của khách sạn để cải thiện hiệu quả và sắp xếp hợp lý các công việc hàng ngày
Hình 2.3.1 Kỹ thuật phân tích hoạt động
Khách sạn B&B hoạt động không biết ngày nghỉ hay ngày lễ là gì, điều đó có nghĩa là các hệ thống phần mềm khách sạn hoạt động mà không bị gián đoạn trong một giây, tạo ra tất cả các loại dữ liệu về khách hàng và hoạt động Giả sử khi khách hàng nào đó đặt phòng trong khách sạn, người quản gia cảnh báo thiếu bất kì dụng cụ vệ sinh nào thì hệ thống quản lý tài sản sẽ nắm bắt dữ liệu này Quan sát thời gian thực các quy trình nội bộ đƣợc thực hiện thông qua phân tích hoạt động cho phép chủ khách sạn tìm ra những sai sót và tìm cách cải thiện Các khách sạn có thể tiến hành phân tích cạnh tranh, dự báo hành vi, kỳ vọng của khách hàng cho từng mùa
Nhờ vào các dữ liệu nhận đƣợc, các khách sạn có thể thu thập dữ liệu để theo dõi, đánh giá, rút kinh nghiệm và cải thiện hiệu suất của họ.
Lưu trữ thông tin khách hàng
Khi nhân viên lễ tân tạo thông tin đặt phòng bao gồm: thông tin người đại diện đặt phòng, tên khách lưu trú, số điện thoại liên hệ,… trên hệ thống CRM (Customer Relationship Management – Quản lý quan hệ khách hàng) thì toàn bộ thông tin sẽ đƣợc lưu trữ tự động và đồng bộ với tính năng từ phần mềm, hệ thống quản lý khách hàng, quản lý khách sạn Việc này mang lại nhiều lợi ích đối với ban quản lý nhƣ:
Tự động lưu trữ toàn bộ thông tin cá nhân và thông tin đặt phòng của khách hàng
Giúp dễ dàng tìm kiếm thông tin khách hàng khi quay trở lại đặt phòng thông qua các gợi ý đề xuất về tên riêng, số điện thoại, số CMND,…
Tiết kiệm thời gian cập nhật thông tin
Thống kê và tổng hợp lịch sử lưu trú của khách hàng
Theo dõi và chủ động quản lý hành trình đặt phòng của khách hàng
Hình 2.4.1 Hệ thống phần mềm CRM online dành cho khách sạn
2.5 Thống kê và cập nhật trạng thái của các khách sạn B&B:
Hiện nay, đa số mọi người trên thế giới đã và đang sử dụng các ứng dụng về công nghệ, điển hình là các website và các mạng xã hội nổi tiếng nhƣ Facebook, Instagram,… Đây cũng là một “mảnh đất màu mỡ” giúp chủ kinh doanh khách sạn tìm kiếm đƣợc những khách hàng của mình Không ít trong số đó đã và đang bán phòng trên tất cả kênh OTA (kênh bán phòng trực tuyến) mà họ cho là có khách hàng tiềm năng, và đương nhiên khách sạn đạt được công suất phòng gấp 4 – 5 lần so với trước kia.
Khi sử dụng hệ thống này vào quản lý khách sạn, thay vì việc nhân viên của khách sạn B&B phải vào từng kênh OTA để nhập liệu số phòng và thay đổi số lƣợng phòng trống khi có booking thì giờ đây họ chỉ cần nhập số liệu lên hệ thống và hệ thống sẽ tự đồng bộ với các kênh OTA mà hệ thống khách sạn B&B đang sử dụng
Việc sử dụng hệ thống bán phòng toàn cầu sẽ giúp chủ khách sạn tiết kiệm thời gian, nguồn nhân lực và quan trọng là họ kiểm soát tốt lượng phòng trống để có những phương án tối ƣu công suất phòng, đặc biệt là trong những “mùa du lịch”, khi mà lƣợng cung phòng của khách sạn hầu nhƣ không đáp ứng kịp thời đƣợc lƣợng cầu của khách du lịch
2.6 Quản lý và phân tích các bài Review trên website và app của hệ thống khách sạn:
Do sự phát triển của mạng xã hội, digital marketing ngày càng trở nên quan trọng vì gắn liền với việc ra quyết định của người tiêu dùng Trong đó, review marketing phương - thức truyền miệng điện tử, là hình thức marketing kinh điển và hiệu quả với chi phí thấp, vì thông tin không chỉ lan nhanh mà còn lan rất xa trên môi trường Internet hiện nay
Một người nào đó có thể mất vài phút để viết và đăng bài đánh giá về kỳ nghỉ tại khách sạn của họ lên các trang mạng xã hội, nơi mà các khách du lịch tiềm năng sẽ đọc
Vì những nhận xét tiêu cực thường được mọi người ghi nhớ tốt hơn so với các bình luận tích cực nên khách sạn cần phải nhanh chóng tiếp cận và xử lý chúng
Cũng như các doanh nghiệp nói chung, khách sạn B&B dùng phương pháp phân tích dựa trên dữ liệu có sẵn các phản hồi của khách hàng để có đƣợc những thông tin mà họ muốn Công việc đòi hỏi sử dụng AI và NLP (Natural Language Processing – Xử lý ngôn ngữ tự nhiên) để phân tích các câu chữ của khách hàng bằng cách lọc bình luận, nhận xét tiêu cực/ tích cực trên các mạng xã hội hoặc qua nhiều kết quả khảo sát
2.7 Kết nối trực tiếp các hệ thống trong Phòng với trung tâm kiểm soát của
Nhờ vào Khoa học dữ liệu, những “chiếc thẻ từ” của khách sạn ra đời, mỗi chiếc thẻ sẽ đều đƣợc định danh, và các thông tin khi sử dụng “chiếc thẻ từ” đó sẽ đƣợc gửi về trung tâm kiểm soát của Khách sạn, nó cho biết ai là người bước vào phòng: Khách hàng, người hướng dẫn hay nhân viên dọn dẹp
Các thiết bị trong Phòng nhƣ máy điều hòa, điện, điện thoại, sẽ đƣợc kết nối trực tiếp với trung tâm kiểm soát của Khách sạn Từ đó khiến việc liên lạc giữa khách hàng với Lễ tân trở nên thuận tiện hơn Bên cạnh đó, Lễ tân cũng có thể chọn chế độ “Check- in” cho khách – các hệ thống trong phòng sẽ tự động bật (nhƣ điều hòa và giữ nhiệt độ dễ chịu trước khi khách vào phòng)
Hình 2.7.1 Ứng dụng của Data Science vào THẺ TỪ dùng trong khách sạn
2.8 Ứng dụng Data Science vào việc phân tích và dự báo tích cực về mong muốn của khách hàng:
Việc liên tục theo dõi và hiểu các đề nghị và chiến lƣợc của đối thủ cạnh tranh là một việc rất quan trọng của các chuyên gia trong ngành du lịch và khách sạn trên khắp thế giới Vì thế nên các dữ liệu (dữ liệu bên trong và dữ liệu bên ngoài) cho phép các chủ khách sạn có thể trực tiếp hiểu đƣợc nhu cầu khách hàng chứ không dựa trên những tin đồn và cảm xúc
Một tổ chức có thể thu thập dữ liệu xung quanh các yếu tố kỹ thuật số, chẳng hạn như môi trường cạnh tranh, giá trị khách hàng riêng biệt, các trải nghiệm của khách hàng) sau đó sẽ có thể chuyển kiến thức đó vào trải nghiệm trong phòng Đây là cơ sở cho một khách sạn thông minh, nơi dữ liệu (cùng với cơ sở hạ tầng công nghệ) đƣợc sử dụng để phân phối hàng ngày, đƣợc cá nhân hóa giá trị của khách
Hình 2.8.1 Data Science và những phân tích có thể
Hình 2.8.2 Data Science và những dữ liệu thu thập được về trình độ học vấn, nghề nghiệp và mức lương
2.9 Ứng biến các dịch vụ và trải nghiệm của khách hàng:
Data Science cho ta biết nhu cầu, sở thích, thói quen, tôn giáo, và các đặc trƣng về tính cách của khách hàng Từ đó, giúp cho việc chăm sóc khách hàng của chúng ta trở nên dễ dàng hơn Giả sử: ta sẽ hạn chế đƣa vào thực đơn buổi sáng của khách món sữa bò khi biết khách hàng dị ứng với sữa, hoặc sẽ xếp khách hàng vào căn phòng ở tầng thấp thay vì những tầng gần sân thượng nếu khách hàng của chúng ta là người sợ đồ cao Ngược lại, nếu biết khách hàng là người thích thư giãn tại phòng với người thân bằng các bộ phim hay, ta có thể giới thiệu khách giá book phòng đính kèm gói xem phim tại phòng
Hình 2.9 Data Science và các thông tin từ Khách Hàng mà nó có thể lưu trữ
2.10 Cải thiện hiệu quả tiếp thị của khách sạn:
Với phân tích dữ liệu thích hợp, các khách sạn có thể ứng biến và làm cho hoạt động tiếp thị của mình hiệu quả hơn, bằng cách biết chính xác những gì cần tiếp thị cho khách hàng tiềm năng. Điều này cho phép các nhà quảng cáo xây dựng các phân khúc độc đáo hơn có thể hỗ trợ xác định các nhóm khách hàng chính thường xuyên ghé thăm khách sạn hoặc các địa điểm có liên quan khác.
Nếu một người bình thường đến để kinh doanh, họ sẽ giới thiệu các hoạt động liên quan đến kinh doanh, điều này sẽ ảnh hưởng hiệu quả đến việc họ đến khách sạn Ngoài ra, bạn có thể tiếp thị cho một nhóm nhân khẩu học cụ thể để đánh bại đối thủ cạnh tranh của mình thông qua tiếp thị mục tiêu.
Ứng dụng Data Science vào việc phân tích và dự báo tích cực về mong muốn của khách hàng
Việc liên tục theo dõi và hiểu các đề nghị và chiến lƣợc của đối thủ cạnh tranh là một việc rất quan trọng của các chuyên gia trong ngành du lịch và khách sạn trên khắp thế giới Vì thế nên các dữ liệu (dữ liệu bên trong và dữ liệu bên ngoài) cho phép các chủ khách sạn có thể trực tiếp hiểu đƣợc nhu cầu khách hàng chứ không dựa trên những tin đồn và cảm xúc
Một tổ chức có thể thu thập dữ liệu xung quanh các yếu tố kỹ thuật số, chẳng hạn như môi trường cạnh tranh, giá trị khách hàng riêng biệt, các trải nghiệm của khách hàng) sau đó sẽ có thể chuyển kiến thức đó vào trải nghiệm trong phòng Đây là cơ sở cho một khách sạn thông minh, nơi dữ liệu (cùng với cơ sở hạ tầng công nghệ) đƣợc sử dụng để phân phối hàng ngày, đƣợc cá nhân hóa giá trị của khách
Hình 2.8.1 Data Science và những phân tích có thể
Hình 2.8.2 Data Science và những dữ liệu thu thập được về trình độ học vấn, nghề nghiệp và mức lương.
Ứng biến các dịch vụ và trải nghiệm của khách hàng
Data Science cho ta biết nhu cầu, sở thích, thói quen, tôn giáo, và các đặc trƣng về tính cách của khách hàng Từ đó, giúp cho việc chăm sóc khách hàng của chúng ta trở nên dễ dàng hơn Giả sử: ta sẽ hạn chế đƣa vào thực đơn buổi sáng của khách món sữa bò khi biết khách hàng dị ứng với sữa, hoặc sẽ xếp khách hàng vào căn phòng ở tầng thấp thay vì những tầng gần sân thượng nếu khách hàng của chúng ta là người sợ đồ cao Ngược lại, nếu biết khách hàng là người thích thư giãn tại phòng với người thân bằng các bộ phim hay, ta có thể giới thiệu khách giá book phòng đính kèm gói xem phim tại phòng
Hình 2.9 Data Science và các thông tin từ Khách Hàng mà nó có thể lưu trữ
Cải thiện hiệu quả tiếp thị của khách sạn
Với phân tích dữ liệu thích hợp, các khách sạn có thể ứng biến và làm cho hoạt động tiếp thị của mình hiệu quả hơn, bằng cách biết chính xác những gì cần tiếp thị cho khách hàng tiềm năng. Điều này cho phép các nhà quảng cáo xây dựng các phân khúc độc đáo hơn có thể hỗ trợ xác định các nhóm khách hàng chính thường xuyên ghé thăm khách sạn hoặc các địa điểm có liên quan khác.
Nếu một người bình thường đến để kinh doanh, họ sẽ giới thiệu các hoạt động liên quan đến kinh doanh, điều này sẽ ảnh hưởng hiệu quả đến việc họ đến khách sạn Ngoài ra, bạn có thể tiếp thị cho một nhóm nhân khẩu học cụ thể để đánh bại đối thủ cạnh tranh của mình thông qua tiếp thị mục tiêu.
Ta cũng có thể khảo sát về các sở thích của mỗi người cũng như đặc điểm, nhu cầu của họ cũng như những người xung quanh, từ đó đưa ra mục tiêu khách hàng mà khách sạn hướng tới.
Hình 2.10.1 Khách hàng mục tiêu
Giúp tìm hiểu môi trường kinh doanh và cạnh tranh
Để dẫn đầu trong ngành, các khách sạn phải theo dõi sự cạnh tranh và không có cách nào tốt hơn là sử dụng phân tích dữ liệu.
Giá của đối thủ cạnh tranh có thể đƣợc xác định bằng cách sử dụng phân tích dữ liệu thời gian thực để so sánh chiến lƣợc giá hiện tại của khách sạn với chiến lƣợc so sánh của bạn Ta có thể xem các dữ liệu về giá phòng của các khách sạn khác nhau qua các ứng dụng, trang web có sẵn.
Hình 2.11.1 So sánh những khách sạn với nhau dựa trên Data Science Điều này giúp xác định mức giá phù hợp cho từng phòng bằng cách sử dụng giá cạnh tranh hoạt động 24/7, dẫn đến tăng lƣợng đặt phòng khách sạn.
Dữ liệu được thu thập có thể giúp bạn tìm ra những gì những người khác trong ngành khách sạn đang làm và làm thế nào để trở nên tốt hơn họ về dịch vụ và kinh nghiệm.
Hỗ trợ trong việc cung cấp các dịch vụ bổ sung
Khách sạn giao tiếp với khách hiện tại và khách tiềm năng theo một số cách, cho phép họ thu thập một lƣợng lớn dữ liệu Khi dữ liệu đƣợc thu thập và phân tích đúng cách, nó sẽ cho thấy rất nhiều điều về không chỉ các chương trình mà khách sử dụng mà còn cả các dịch vụ mà họ sử dụng Ví dụ nhƣ dịch vụ nhà hàng, ăn uống trong khách sạn. Ngoài ra, chủ khách sạn có thể quyết định các sản phẩm và dịch vụ mới để giới thiệu Nếu khách thường yêu cầu thiết bị tập thể dục mà khách sạn còn thiếu, điều này có thể giúp họ tân trang lại phòng tập thể dục của mình.
Phân tích dữ liệu cũng có thể giúp đƣa ra quyết định về việc hình thành quan hệ đối tác với các công ty khác, chẳng hạn nhƣ công ty taxi, quán rƣợu, nhà hàng và đại lý du lịch.
Việc sử dụng phân tích dữ liệu trong ngành khách sạn là điều cần thiết để tăng năng suất, hiệu quả và lợi nhuận Kết quả của phân tích dữ liệu thông báo cho một doanh nghiệp biết nơi họ có thể tối ƣu hóa, liệu hoạt động có cần cải tiến hay không, hoạt động nào có thể đạt đƣợc hiệu quả cao hơn, v.v.
Các khách sạn có những vị trí thuận lợi trong khu du lịch thì có thể tham khảo sở thích hoặc nhu cầu du lịch của khách hàng tiềm năng, từ đó có thể liên kết với các tour du lịch
CHƯƠNG 3: PHÂN TÍCH NHỮNG KHÁCH SẠN B&B CHO THUÊ NGẮN HẠN Ở THÀNH PHỐ NEW ORLEANS
PHẦN 1: GIỚI THIỆU 3.1.1 Khách sạn cho thuê ngắn hạn:
Khách sạn cho thuê ngắn hạn là chỗ ở hay khách sạn mà du khách có thể thuê trên cơ sở ngắn hạn Những chỗ ở này bao gồm từ bất động sản sang trọng cao cấp đến phòng ngủ dự phòng trong căn hộ của người khác và có thể bao gồm nhà ở, chung cư, biệt thự, căn hộ và thậm chí cả lều, yurt và thuyền
Một số khách sạn cung cấp dịch vụ đầy đủ, trong khi đó có một số khác cung cấp cho khách sự độc lập hoàn toàn
Trong khi một số du khách vẫn thích khách sạn, thì cho thuê nhà nghỉ trên thực tế đang trở thành một lựa chọn thay thế phổ biến cho lựa chọn quen thuộc đó Khách sạn cho thuê ngắn hạn cung cấp mức giá cạnh tranh, không gian riêng tƣ và thân mật hơn Nhiều khách sạn cho thuê ngắn hạn đƣợc trang bị nhà bếp, giúp khách có cơ hội tiết kiệm tiền trong chuyến du lịch bằng cách nấu ăn trong nhà chứ không phải ra ngoài ăn cho từng bữa
Ngoài ra, du khách ngày nay đang ngày càng tìm cách hòa mình vào nền văn hóa của những nơi mà họ đến thăm, sẽ trở nên dễ dàng hơn nhiều khi ở trong một ngôi nhà địa phương độc đáo thay vì phòng khách sạn tiêu chuẩn
Mặc dù một số người xem lựa chọn thuê kỳ nghỉ là rủi ro, lo lắng rằng chỗ nghỉ có thể không giống như được mô tả trực tuyến Do vậy, đánh giá từ những khách hàng trước đây sẽ giúp khách du lịch đƣa ra quyết định của họ
B&B là viết tắt của Bed and Breakfast, dịch nôm na sang tiếng Việt là “giường ngủ và bữa sáng” Khách sạn B&B là một cơ sở lưu trú nhỏ, giá rẻ, chỉ cung cấp chỗ nghỉ qua đêm và kèm bữa sáng cho khách ở trọ, thường không cung cấp các bữa ăn khác và đa số do các hộ kinh doanh gia đình làm chủ
Hiện nay, ý nghĩa của thuật ngữ B&B được mở rộng thêm bao gồm các cơ sở lưu trú, hay còn gọi là cơ sở tự phục vụ Thông thường, người ta sẽ sử dụng nhà riêng với quy mô ít hơn 10 phòng ngủ sẵn có để sử dụng cho mục đích kinh doanh dịch vụ lưu trú Tại các thành phố Châu Âu, Châu Mỹ, B&B là dịch vụ rất phổ biến Do vậy, nhóm quyết định thực hiện dự án dựa trên Dataset của Những khách sạn cho thuê ngắn hạn ở Thành phố New Orleans
3.1.3 Bối cảnh khách sạn B&B cho thuê ngắn hạn ở Thành phố New Orleans:
Hình 3.1.3.1 Một khách sạn B&B cho thuê ngắn hạn ở Thành phố New Orleans 3.1.3.1 Bối cảnh Du lịch ở Thành phố New Orleans:
New Orleans luôn là một địa điểm du lịch hàng đầu The New York Times đã gọi đây là thành phố tốt nhất để ghé thăm vào năm 2018, cho biết những ảnh hưởng đa dạng của nó từ Châu Âu, Caribe, Châu Mỹ Latinh và Châu Phi đã khiến nó trở thành “vùng đất nóng chảy cuối cùng”
Khó có thể tìm thấy sự hội tụ của ẩm thực, giải trí, con người, nghệ thuật, lịch sử và kiến trúc nhƣ ở Thành phố New Orleans Và sự rung cảm không ngừng của bữa tiệc - nhạc sống từ jazz, blues đến rock„n roll khiến nó trở thành nơi tụ tập đông người cả năm - và bất kể mùa nào
Nền kinh tế của New Orleans phát triển mạnh về du lịch, ẩm thực, giải trí và lòng hiếu khách Vào năm 2019, Thành phố này đã phá kỷ lục khi có 19 triệu khách du lịch và thu về 10 tỷ đô la cho nền kinh tế
Tuy nhiên, vào năm 2021 cơn bão Ida và Đại dịch Covid- -19, bên cạnh đó là những quyết định của chính quyền địa phương về việc ngừng các lễ hội và hạn chế tụ tập công cộng đã tác động rất lớn cho ngành du lịch cũng nhƣ ngành kinh tế ở Thành phố New Orleans
3.1.3.2 Bối cảnh khách sạn B&B cho thuê ngắn hạn ở Thành phố New Orleans: Đối với một thành phố phụ thuộc nhiều vào du lịch để phát triển nhƣ New Orleans, thì Cơ sở lưu trú cho thuê ngắn hạn rất thích hợp, tuy nhiên có được phát triển một cách có giới hạn
GIỚI THIỆU
Khá ch sạn cho thuê ngắn hạn
Khách sạn cho thuê ngắn hạn là chỗ ở hay khách sạn mà du khách có thể thuê trên cơ sở ngắn hạn Những chỗ ở này bao gồm từ bất động sản sang trọng cao cấp đến phòng ngủ dự phòng trong căn hộ của người khác và có thể bao gồm nhà ở, chung cư, biệt thự, căn hộ và thậm chí cả lều, yurt và thuyền
Một số khách sạn cung cấp dịch vụ đầy đủ, trong khi đó có một số khác cung cấp cho khách sự độc lập hoàn toàn
Trong khi một số du khách vẫn thích khách sạn, thì cho thuê nhà nghỉ trên thực tế đang trở thành một lựa chọn thay thế phổ biến cho lựa chọn quen thuộc đó Khách sạn cho thuê ngắn hạn cung cấp mức giá cạnh tranh, không gian riêng tƣ và thân mật hơn Nhiều khách sạn cho thuê ngắn hạn đƣợc trang bị nhà bếp, giúp khách có cơ hội tiết kiệm tiền trong chuyến du lịch bằng cách nấu ăn trong nhà chứ không phải ra ngoài ăn cho từng bữa
Ngoài ra, du khách ngày nay đang ngày càng tìm cách hòa mình vào nền văn hóa của những nơi mà họ đến thăm, sẽ trở nên dễ dàng hơn nhiều khi ở trong một ngôi nhà địa phương độc đáo thay vì phòng khách sạn tiêu chuẩn
Mặc dù một số người xem lựa chọn thuê kỳ nghỉ là rủi ro, lo lắng rằng chỗ nghỉ có thể không giống như được mô tả trực tuyến Do vậy, đánh giá từ những khách hàng trước đây sẽ giúp khách du lịch đƣa ra quyết định của họ.
Khách sạn B&B
B&B là viết tắt của Bed and Breakfast, dịch nôm na sang tiếng Việt là “giường ngủ và bữa sáng” Khách sạn B&B là một cơ sở lưu trú nhỏ, giá rẻ, chỉ cung cấp chỗ nghỉ qua đêm và kèm bữa sáng cho khách ở trọ, thường không cung cấp các bữa ăn khác và đa số do các hộ kinh doanh gia đình làm chủ
Hiện nay, ý nghĩa của thuật ngữ B&B được mở rộng thêm bao gồm các cơ sở lưu trú, hay còn gọi là cơ sở tự phục vụ Thông thường, người ta sẽ sử dụng nhà riêng với quy mô ít hơn 10 phòng ngủ sẵn có để sử dụng cho mục đích kinh doanh dịch vụ lưu trú Tại các thành phố Châu Âu, Châu Mỹ, B&B là dịch vụ rất phổ biến Do vậy, nhóm quyết định thực hiện dự án dựa trên Dataset của Những khách sạn cho thuê ngắn hạn ở Thành phố New Orleans.
Bối cảnh khách sạn B&B cho thuê ngắn hạn ở Thành phố New Orleans
Hình 3.1.3.1 Một khách sạn B&B cho thuê ngắn hạn ở Thành phố New Orleans 3.1.3.1 Bối cảnh Du lịch ở Thành phố New Orleans:
New Orleans luôn là một địa điểm du lịch hàng đầu The New York Times đã gọi đây là thành phố tốt nhất để ghé thăm vào năm 2018, cho biết những ảnh hưởng đa dạng của nó từ Châu Âu, Caribe, Châu Mỹ Latinh và Châu Phi đã khiến nó trở thành “vùng đất nóng chảy cuối cùng”
Khó có thể tìm thấy sự hội tụ của ẩm thực, giải trí, con người, nghệ thuật, lịch sử và kiến trúc nhƣ ở Thành phố New Orleans Và sự rung cảm không ngừng của bữa tiệc - nhạc sống từ jazz, blues đến rock„n roll khiến nó trở thành nơi tụ tập đông người cả năm - và bất kể mùa nào
Nền kinh tế của New Orleans phát triển mạnh về du lịch, ẩm thực, giải trí và lòng hiếu khách Vào năm 2019, Thành phố này đã phá kỷ lục khi có 19 triệu khách du lịch và thu về 10 tỷ đô la cho nền kinh tế
Tuy nhiên, vào năm 2021 cơn bão Ida và Đại dịch Covid- -19, bên cạnh đó là những quyết định của chính quyền địa phương về việc ngừng các lễ hội và hạn chế tụ tập công cộng đã tác động rất lớn cho ngành du lịch cũng nhƣ ngành kinh tế ở Thành phố New Orleans
3.1.3.2 Bối cảnh khách sạn B&B cho thuê ngắn hạn ở Thành phố New Orleans: Đối với một thành phố phụ thuộc nhiều vào du lịch để phát triển nhƣ New Orleans, thì Cơ sở lưu trú cho thuê ngắn hạn rất thích hợp, tuy nhiên có được phát triển một cách có giới hạn
Chỉ 25% số căn hộ trong các bất động sản thương mại và hỗn hợp được phép cho thuê ngắn hạn Những người ở khu Vieux Carre Entertainment (VCE), chỉ cách Phố Bourbon giữa Iberville và Orleans Street 6 dãy nhà, đều đƣợc phép Tuy nhiên, các tài sản ở Garden District và phần còn lại của Khu phố Pháp bị cấm Đối với bất động sản nhà ở, chỉ cho phép thuê nhà ngắn hạn nếu họ đƣợc miễn trừ nhà trọ Mỗi bất động sản đó có thể cho thuê tối đa 3 căn Những ngôi nhà không có người ở cũng bị cấm Để tổ chức các đợt lưu trú ngắn hạn (ít hơn 30 đêm liên tục tại một thời điểm), chủ sở hữu và nhà điều hành cho thuê phải có giấy phép của chính quyền thành phố.
THU THẬP VÀ LÀM SẠCH DỮ LIỆU
Mô tả tổng quát dữ liệu
- Thu thập dữ liệu từ Orange (file dữ liệu Vacation Rentals)
- Đây là tập dữ liệu mô tả các khách sạn B&B cho thuê ngắn hạn ở thành phố New Orleans
- Data set Characteristic (Đặc điểm của tập dữ liệu): Đa biến
Tập dữ liệu mẫu testing:
- Attribute Characteristics (Đặc điểm thuộc tính): categorical, integer
- Missing value (Giá trị bị thiếu): bằng không
Các thuộc tính đƣa vào mô hình
- Guest limit (Giới hạn khách)
- Expiration date (Ngày trả phòng)
- Location (Địa chỉ - Tọa độ thập phân)
Các bước làm sạch dữ liệu
Các bước và giải pháp làm sạch dữ liệu (Data Cleaning):
- Xử lý những dữ liệu bị thiếu (Missing values)
- Xử lý nhiễu (Noisy data)
- Xử lý những dữ liệu không nhất quán (Inconsistent data)
3.2.4.1 Dữ liệu bị thiếu (Missing Values):
- Dữ liệu bị mất (quá trình thu thập)
- Dữ liệu bị thiếu (quá trình thu thập)
- Dữ liệu chƣa biết (N/A, TBD, )
- Dữ liệu không tồn tại
- Khách quan: không tồn tại lúc đƣợc nhập dữ liệu, sự cố,
- Chủ quan: tác nhân con người
- Loại bỏ những mẩu tin liên quan đến dữ liệu bị thiếu
- Thay thế bằng các giá trị đƣợc tính toán (quy tắc, thuật toán)
Các hằng số ngầm định
Các loại giá trị trung bình
Các giá trị phổ biến, có xác suất xảy ra cao nhất
Cách phòng ngừa: thiết kế tốt CSDL và các thủ tục nhập liệu (ràng buộc dữ liệu)
3.2.4.2 Dữ liệu nhiễu (Noisy Data):
- Attribute: giá trị dị biệt, bất thường
- Feature: đặc trƣng (weak/ irrelevant) không giúp giải thích target
- Item: bất thường (outliers) trong tương quan features-target, không phù hợp với các items liên quan
- Khách quan (công cụ thu thập dữ liệu, lỗi trên đường truyền, giới hạn công nghệ, )
- Chủ quan (tác nhân con người)
Phát hiện và khử nhiễu:
- Binning: so sánh với những dữ liệu lân cận
- Statistical approaches: khoảng cách, phân phối, mật độ,
- Regression: so sánh với dữ liệu được tính toán từ phương pháp hồi quy
- Clustering: gom cụm để phát hiện những dữ liệu bất thường
- Filter: chọn lựa các thuộc tính (feature selection), phân tích tương quan
3.2.4.3 Dữ liệu không nhất quán (Inconsistent data):
- Dữ liệu đƣợc ghi nhận khác nhau đối với cùng một đối tƣợng
- Dữ liệu không phản ánh đúng ngữ nghĩa
- Xử lý dữ liệu không nhất quán:
- Central semantic store approach: khai thác siêu dữ liệu (metadata), các ràng buộc dữ liệu (data constraints)
- Master reference store approach: tăng cường tập trung dữ liệu
Với dự án của nhóm, do dữ liệu bị thiếu không có nên sẽ chọn làm sạch dữ liệu bằng cách xử lý dữ liệu bị nhiễu Trong đó nhóm sẽ chọn giải pháp giảm thiểu bằng nhiều phương pháp hồi quy (regression) để làm sạch dữ liệu
Đạt đƣợc kết quả ƣớc lƣợng tốt nhất chân thực giữa các biến số;
Chỉ rõ sự tác động của thuộc tính này lên thuộc tính khác.
KIỂM ĐỊNH MÔ HÌNH
Phần mềm thể hiện (orange)
3.3.1.1 Màn hình thể hiện (Orange):
Hình 3.3.1.1.1 Màn hình thể hiện (orange)
3.3.1.2 Kết quả với tập dữ liệu testing:
Test and score: Sử dụng phương pháp K fold cross validation với- k = 5
Hình 3.3.1 2.1 Kết quả với tập dữ liệu testing - Test and Score
Hình 3.3.1 2.2 Kết quả với tập dữ liệu testing - ROC Analysis
Kết quả với tập dữ liệu dự báo
Hình 3.3.3.1.1 Màn hình thể hiện - Neural Network
Hình 3.3.3.1.2 Kết quả với tập dữ liệu dự báo - Neural Network
Hình 3.3.3.1.3 Kết quả với tập dữ liệu dự báo - Neural Network - Data table
Hình 3.3.3.2.1 Màn hình thể hiện - SVM
Hình 3.3.3.2.2 Kết quả với tập dữ liệu dự báo - SVM
Hình 3.3.3.2.3 Kết quả với tập dữ liệu dự báo - SVM - Data table 3.3.3.3 Sử dụng Tree:
Hình 3.3.3.3.1 Màn hình thể hiện - Tree
Hình 3.3.3.3.2 Kết quả với tập dữ liệu dự báo - Tree
Hình 3.3.3.3.3 Kết quả với tập dữ liệu dự báo - Tree - Data table
Hình 3.3.3.4.1 Màn hình thể hiện - Logistic Regression
Hình 3.3.3.4.2 Kết quả với tập dữ liệu dự báo - Logistic Regression
Hình 3.3.3.4.3 Kết quả với tập dữ liệu dự báo - Logistic Regression Data table -
ĐÁNH GIÁ VÀ LỰA CHỌN MÔ HÌNH
Dựa vào các chỉ số đánh giá lựa chọn mô hình phù hợp
Kết quả với tập dữ liệu testing:
Test and score: Sử dụng phương pháp K fold cross validation với k = 5-
Hình 3.4.1.1 Kết quả với tập dữ liệu testing - Test and Score
Accuracy (tính chính xác) là tỷ lệ mẫu đƣợc phân lớp đúng trong toàn bộ tập dữ liệu
Precision (độ chính xác): cho biết trong số m mẫu đƣợc phân vào lớp i thì có tỷ lệ bao nhiêu mẫu đúng
Recall (độ phủ): tỷ lệ của các kết quả đƣợc dự đoán chính xác cho tất cả các dự đoán
F1: điều hòa giữa recall và precision
Khi accuracy, precision, recall, F1 càng cao thì mô hình càng tốt
Dựa trên chỉ số AUC (tính chính xác), Recall (độ phủ) và Precision (độ chính xác) và giá trị trung bình điều hòa (harmonic mean) của hai đo Precision và Recall ta có thể thấy mô hình Tree có số liệu đo đƣợc là tốt nhất trong các mô hình
Hình 3.4.1.2 Kết quả với tập dữ liệu testing – ROC Analysis Đường cong này được tạo ra bằng cách biểu diễn tỷ lệ dự báo true positive rate (TPR) dựa trên tỷ lệ dự báo false positive rate (FPR) tại các ngƣỡng khác nhau Qua quan sát đường ROC có thể thấy được mô hình Tree là đường có tỷ lệ báo true positive rate (TPR) cao nhất và tỷ lệ false positive rate (FPR) thấp nhất
Thông qua việc đánh giá các chỉ số kiểm định ta thấy Mô hình Tree có chỉ số kiểm định tốt nhất nên đây sẽ là lựa chọn phù hợp nhất.
Sử dụng ma trận nhầm lẫn để đánh giá trường hợp xảy ra sự nhầm lẫn
Ta sử dụng Ma trận nhầm lẫn (Confusion Matrix) để so sánh mức độ nhầm lẫn giữa các lớp thực tế (Actual) và dự đoán (Predicted) của ba loại mô hình Decision Tree, SVM và Logistic Regression
Hình 3.4.2.1 Bảng Ma trận nhầm lẫn khi sử dụng mô hình Decision Tree
Hình 3.4.2.2 Bảng Ma trận nhầm lẫn khi sử dụng mô hình SVM
Hình 3.4.2.3 Bảng Ma trận nhầm lẫn khi sử dụng mô hình Logistic Regression
Các Confusion Matrix cho biết tỷ lệ các trường hợp giữa các lớp dự đoán và thực tế Việc lựa chọn các phần tử trong ma trận cung cấp các trường hợp tương ứng vào tín hiệu đầu ra Bằng cách này, ta có thể quan sát những trường hợp cụ thể bị phân loại sai và xử lý chúng
Một số thông tin về Ma trận nhầm lẫn:
Mỗi hàng tương ứng với một lớp chính xác, trong khi các cột biểu thị các lớp dự đoán;
Cột ngoài cùng bên phải đưa ra tổng số lượng mẫu từ mỗi hàng, tương tự, hàng dưới cùng cho ra tổng số lượng mẫu từ mỗi cột tương ứng;
Ô phía dưới cùng bên phải nêu ra tổng số lượng mẫu dữ liệu tham gia so sánh và dự đoán;
Đường chéo bắt đầu từ ô đầu tiên phía trên bên trái đến hết ô kề cuối phía dưới bên phải chỉ ra số lƣợng mẫu đƣợc dự đoán chính xác so với mẫu thực tế Ngƣợc lại, các ô còn lại nêu ra số lƣợng dữ liệu bị dự đoán sai lệch;
Qua quan sát đƣợc giữa 3 bảng Ma trận nhầm lẫn, ta nhận ra đƣợc Mô hình Logistic Regression có số lƣợng mẫu dữ liệu đƣợc dự đoán chính xác nhiều nhất, tiếp theo sau lần lƣợt là Decision Tree và SVM Vì thế nên, mô hình Logistic Regression là lựa chọn phù hợp nhất.