PHÂN TÍCH DỊCH VỤ MUA BÁN MỘT SỐ DỊCH VỤ DU

Một phần của tài liệu Xử lý phân tích trực tuyến OLAP và ứng dụng trong khai thác kho dữ liệu (Trang 61)

Ngoài các loại hàng hoá hữu hình và phi vật thể trên, hệ thống còn được thiết kế để có thể mua bán một loại hình thương mại thứ ba là dịch vụ. Các dịch vụ được thực hiện trong hệ thống là các dịch vụ du lịch, bao gồm: dịch vụ đặt tour du lịch, dịch vụ đặt phòng khách sạn, dịch vụ đặt vé máy bay.

Hệ thống quản lý dịch vụ du lịch được chia thành các phân hệ sau:

1. Phân hệ tạo lập đơn hàng

Khách hàng có thể đặt các tour du lịch trong nước, ngoài nước, đặt phòng ở các khách sạn miền Bắc, miền Nam, miền Trung, đặt vé máy bay của một số hãng máy bay trong nước.

Các thông tin tìm được từ cơ sở dữ liệu sẽ được đưa ra theo mức độ ngày càng chi tiết, cụ thể hơn, giúp khách hàng lựa chọn chính xác, đúng nhu cầu.

Đơn hàng sẽ được tạo lập sau mỗi phiên giao dịch của khách hàng.

Mỗi đơn hàng sẽ lưu giữ các thông tin về khách hàng, về tour, về thời gian dự định thực hiện tour, số lượng người tham gia, và trên cơ sở đó là tổng số tiển cần phải thanh toán.

Đối với các đơn hàng đặt tour, ngay sau khi thực hiện lệnh đặt hàng, đơn hàng sẽ được sinh ra và gửi đến cổng thanh toán, tương tự như trường hợp mua hàng ở các siêu thị.

Đối với việc đặt phòng tại khách sạn, sau khi chấp nhận đặt hàng, một đơn hàng tương ứng được sinh ra, người quản lý sẽ liên hệ trực tiếp với khách sạn và chỉ khi nhận được sự chấp nhận chính thức của khách sạn, người quản lý mới cập nhật trạng thái để đơn hàng được gửi đến cổng thanh toán.

Tương tự, đối với các đơn hàng đặt vé máy bay, người quản lý cũng phải liên hệ với đại lý bán vé chính thức của hãng và chỉ khi có kết quả chấp nhận, mới cập nhật trạng thái của đơn hàng để gửi ra cổng thanh toán.

Với qui trình xử lý như vậy, hệ thống sẽ giải quyết được một số mâu thuẫn thường nảy sinh giữa bên mua và bên bán dịch vụ.

3. Phân hệ khách hàng

Khách hàng có thể tự đăng ký tham gia mua bán dịch vụ khi đã được hệ thống lớn xác nhận.

Khi đã sử dụng các chức năng của hệ thống để đặt hàng các thông tin về khách hàng sẽ được cập nhật vào các bảng dữ liệu riêng về từng dịch vụ.

Điều này cho phép quản lý khách hàng theo dịch vụ để có các chính sách hậu mãi kịp thời, thích hợp.

4. Phân hệ hàng hoá

Hàng hoá ở đây được hiểu là các dịch vụ. Người quản lý có thể truy nhập vào các trang web quản lý để cập nhật, sửa đổi thông tin về các tour, về khách sạn cũng như các chuyến bay.

3.4.2 Phân tích hệ thống kho dữ liệu thƣơng mại điện tử

Mục tiêu của giai đoạn này là phân tích những yêu cầu của bài toán để xác định các chiều thông tin, dữ liệu mà kho dữ liệu sẽ chứa đựng, những yêu

cầu cụ thể của người sử dụng đầu cuối để xác định dữ liệu được lưu trong kho sẽ sử dụng như thế nào.

Các bước phân tích bao gồm: - Phân tích nghiệp vụ bài toán

- Xác định các nguồn dữ liệu cũng như nội dung dữ liệu sẽ được lưu trong kho dữ liệu

- Phân tích được dữ liệu phát sinh hàng tháng, năm và lượng dữ liệu cần lưu trữ

- Phân tích lớp người sử dụng

- Xác định nhiệm vụ của kho dữ liệu thương mại điện tử

Giai đoạn phân tích hệ thống sẽ tập trung vào phân tích hệ thống về chức năng và phân tích về dữ liệu.

3.4.2.1 Phân tích các chức năng

Chức năng chính của kho dữ liệu là thu thập, tổng hợp, lưu trữ, xử lý và cung cấp thông tin về nghiệp vụ thương mại điện tử như:

- Thông tin về việc quản lý bán hàng hữu hình. - Thông tin về việc quản lý bán hàng phi vật thể. - Thông tin về việc quản lý đặt phòng khách sạn. - Thông tin về việc quản lý đặt vé máy bay. - Thông tin về việc quản lý các dịch vụ du lịch.

Đồng thời sử dụng công cụ trợ giúp cho việc phân tích số liệu hỗ trợ ra quyết định.

Kho dữ liệu thương mại điện tử chứa đựng nhiều thông tin tổng hợp từ các hệ tác nghiệp khác nhau phục vụ cho công tác nghiệp vụ thương mại điện tử. Các dữ liệu chi tiết phục vụ cho các chức năng chính của hệ thống tác nghiệp không được lưu trong kho. Kho dữ liệu TMĐT được thiết lập để thu thập, tổng hợp, lưu trữ, xử lý và cung cấp thông tin một cách tổng thể, đồng nhất phục vụ việc ra quyết định của ban lãnh đạo, đồng thời cung cấp thông tin chi tiết và

Để thực hiện được các chức năng trên kho cần lưu trữ các bảng phân loại, các bảng danh mục nghiệp vụ:

- Danh mục sản phẩm - Danh mục nhà cung cấp - Danh mục khách hàng

- Danh mục hình thức thanh toán - Danh mục mức ưu đãi

- Danh mục các tour du lịch - Danh mục chuyến bay - Danh mục khách sạn

Kho dữ liệu TMĐT là một kho dữ liệu chủ đề có nhiệm vụ thu thập thông tin từ các CSDL hệ thống tác nghiệp khác nhau sau khi đã đựơc xử lý bởi các hệ thống tác nghiệp đó hoặc từ các hệ thống bên ngoài, sau đó tổ chức lưu trữ và thiết lập mô hình khai thác. Sau khi khảo sát, các yêu cầu khai thác dữ liệu của các đối tượng sử dụng bao gồm khai thác theo các chiều khác nhau, đồng thời muốn tạo báo cáo động theo những chỉ tiêu tổng hợp theo các chiều đó. Hệ thống cung cấp cơ chế: số liệu các báo cáo được tổng hợp tự động theo các công thức tương ứng với từng chỉ tiêu. Như vậy, việc tạo các báo cáo theo các chỉ tiêu do người sử dụng lựa chọn được thực hiện tự động đáp ứng cho chức năng khai thác thông tin của kho dữ liệu TMĐT.

Chức năng chính của kho dữ liệu TMĐT cần phải thực hiện là:

- Trích lọc, làm sạch và tải dữ liệu từ nguồn vào CSDL của kho dữ liệu - Chuyển đổi số liệu theo mã thống nhất.

- Các dữ liệu bán hàng, đặt dịch vụ, danh mục khách hàng, sản phẩm, nhà cung cấp,... được chuyển đổi và tải vào CSDL thông qua công cụ trợ giúp Enterprise Manager, Query English.

Sau khi được tải vào trong kho dữ liệu, dữ liệu sẽ tiếp tục được tổng hợp theo các chỉ tiêu, lưu trữ trong kho để sẵn sàng phục vụ cho công việc khai thác thông tin qua các công cụ.

Công việc khai thác dữ liệu bao gồm:

- Tạo các báo cáo cố định bao gồm các thông tin gần giống với các biểu mẫu định sẵn như ở hệ thống tác nghiệp.

- Tạo báo cáo khai phá theo một số chiều cần thiết.

- Tạo báo cáo theo chỉ tiêu tổng hợp: các chỉ tiêu này không cố định theo từng thời kỳ, từng năm mà thay đổi tuỳ thuộc nhu cầu của người sử dụng. Do vậy, cần có cơ chế thêm bớt và cập nhật các chỉ tiêu cũng như các báo cáo theo các chỉ tiêu đó. Số liệu tạo ra không những phải tổng hợp theo nhiều chiều mà còn phải dựa trên nhiều công thức nên khá phức tạp. Do đó, các thực thể liên quan phải được thiết kế một cách logic để có thể tạo ra một cơ chế sản sinh ra các báo cáo một cách chặt chẽ.

* Nội dung thông tin cần khai thác:

Kho dữ liệu cho phép khai thác thông tin từ chi tiết đến tổng hợp, theo nhiều chiều, đặc biệt là khai thác theo chiều sâu, các chiều bao gồm:

- Khách hàng (loại khách, thành phần kinh tế, độ tuổi, giới tính) - Thời gian (ngày, tuần, tháng, qúy, năm)

- Địa bàn (phường (xã), quận (huỵên), tỉnh, thành phố) - Sản phẩm (loại sản phẩm, hãng sản xuất)

- Nhà cung cấp

- Phương thức thanh toán - Mức ưu đãi

- Khách sạn - Tour du lịch

3.4.2.2 Phân tích về dữ liệu

Nguồn dữ liệu: được lấy từ hệ thống thông tin tác nghiệp thương mại điện tử: - Thông tin về giao dịch trên mạng

- Thông tin về dữ liệu từ các nhà cung cấp

Các nguồn dữ liệu này sẽ được trích chọn và tải vào kho dữ liệu từ những ứng dụng hiện tại đang được khai thác, sử dụng tại hệ thống thương mại điện tử qua các bộ chuyển đổi dữ liệu vào kho dữ liệu.

Dạng dữ liệu: dữ liệu nguồn chủ yếu được lấy từ CSDL SQL Server (có dạng bảng) hay các tệp text có cấu trúc.

3.4.2.3 Xác định các bảng sự kiện (Fact Table -FT) và các bảng chiều (Dimension table) của kho dữ liệu (Dimension table) của kho dữ liệu

Để xây dựng thành công một kho dữ liệu chủ đề thì việc xác định các chiều và các FT cho chính xác và hợp lý là một khâu rất quan trọng. Việc này phụ thuộc vào thông tin được lưu trữ và nhu cầu khai thác thông tin của người sử dụng.

Các chiều của kho dữ liệu được dùng để xác định, phân biệt các bản ghi nên các chiều của kho sẽ là các chiều về sản phẩm, khách hàng, thời gian, ...

Việc xác định các FT đòi hỏi thoả mãn yêu cầu: các FT không được có kích thước quá to hay quá nhỏ để đảm bảo tốc độ truy vấn. Có một số cách để phân chia các FT, tuy nhiên theo sự phân tích kho dữ liệu thương mại điện tử thì phương án chia theo các dịch vụ (dịch vụ mua bán hàng hoá hữu hình và phi vật thể, dịch vụ đặt phòng khách sạn, dịch vụ đặt vé máy bay và dịch vụ đặt tour du lịch) là phương án tối ưu nhất và sẽ được chọn là phương án thực hiện của quá trình xây dựng kho dữ liệu. Mặc dù có thể tách dịch vụ mua bán hàng hoá hữu hình và phi vật thể thành hai FT riêng biệt; tuy nhiên hai dịch vụ này có các dữ liệu phần lớn tương tự nhau, cách quản lý cũng gần giống nhau nên ta sẽ gộp chung hai loại hình dịch vụ này vào trong cùng một bảng FT.

Như vậy, kho dữ liệu TMĐT sẽ là tập hợp của các kho dữ liệu chủ đề (DM) sau:

- DM về dịch vụ mua bán hàng hoá hữu hình và phi vật thể - DM về dịch vụ đặt phòng khách sạn

- DM về dịch vụ đặt vé máy bay - DM về dịch vụ đặt tour du lịch

3.4.3 Thiết kế hệ thống

Giai đoạn phân tích đã xử lý hệ thống dựa trên quan niệm logic, giai đoạn thiết kế sẽ kế thừa và phát triển để xây dựng kho dữ liệu vật lý.

Phạm vi của luận văn xin phép chỉ trình bày về thiết kế kho dữ liệu vì phần này có liên quan trực tiếp đến việc xây dựng kho dữ liệu và khai thác thông tin bằng công cụ xử lý phân tích trực tuyến OLAP, các thiết kế chi tiết về kiến trúc dữ liệu, thiết kế kiến trúc của ứng dụng,... xin phép được bỏ qua.

Thiết kế kho dữ liệu

+ Kiến trúc kho:

Kho dữ liệu là một hệ cơ sở dữ liệu lớn dược lưu trữ trong CSDL của TMĐT, lưu trữ toàn bộ các thông tin về nghiệp vụ.

Các thành phần dữ liệu bao gồm:

- Khối dữ liệu danh mục: Bao gồm các bảng chiều lưu trữ dữ liệu danh mục như sản phẩm, khách hàng, nhà cung cấp...

- Khối dữ liệu khai thác: bao gồm các bảng dữ liệu về việc bán hàng hữu hình và phi vật thể, việc quản lý đặt phòng khách sạn ,...

- Khối dữ liệu tổng hợp báo cáo: bao gồm các bảng dữ liệu tổng hợp khai thác theo các chỉ tiêu khác nhau, báo cáo cho các đối tượng khác nhau.

Dữ liệu tác nghiệp Dữ liệu mua bán hànghoá hữu hình và phi vật thể Dữ liệu đặt vé máy bay

Dữ liệu đặt phòng khách sạn

Dữ liệu đặt tour du lịch

Kho dữ liệu

1. Danh mục khách hàng 2. Danh mục sản phẩm 3. Danh mục nhà cung cấp 4. Danh mục khách sạn 5. Danh mục tour du lịch 6. Danh mục chuyến bay 7. Danh mục mức ưu đãi 8. Bảng chiều thời gian

9. Danh mục phương thức thanh toán 10. Danh mục công ty du lịch

11. Danh mục hãng hàng không

Các bảng chiều này sẽ quan hệ với các bảng sự kiện thông qua các trường khoá ngoại tuỳ theo tính chất số liệu trong các bảng sự kiện. Bảng chiều thời gian và bảng phương thức thanh toán có quan hệ với tất cả các bảng sự kiện. Nó sẽ là các bảng chiều được dùng chung (Shared Dimension).

* Xác định các bảng thực (Fact Table):

Dựa vào kết quả của quá trình phân tích hệ thống ta xây dựng các bảng FT như sau:

1. FT lưu dữ liệu về việc mua bán hàng hoá hữu hình và phi vật thể. 2. FT lưu dữ liệu về việc đặt phòng khách sạn.

3. FT lưu dữ liệu về việc đặt vé máy bay. 4. FT lưu dữ liệu về việc đặt tour du lịch.

* Các ràng buộc quan hệ.

Sau khi tạo ra các bảng thực và các bảng chiều, việc tạo liên kết giữa các bảng được tiến hành. Bảng dưới đây thể hiện các ràng buộc liên kết giữa các bảng thực và các bảng chiều của nó (minh hoạ với bảng thực BanHang_Fact):

Bảng 3.1 Một số trường ràng buộc

* Thiết kế các chỉ mục (Index)

Sử dụng việc đánh chỉ số có thể làm tăng đáng kể hiệu suất của các truy vấn trong kho dữ liệu. Do vậy, việc thiết kế các chỉ số cho các bảng thực và các bảng chiều là hết sức cần thiết.

Đối với kho dữ liệu thương mại điện tử, ta có thể tạo ra các bảng chỉ số cho mỗi chiều dựa trên cột thuộc tính khoá chính của mỗi chiều. Riêng với các bảng thực có số lượng dữ liệu vô cùng lớn như vậy, ta có thể thay những khoá có ý nghĩa (khoá chính của các bảng chiều liên kết) bằng việc sử dụng một khoá do mình tạo ra là một khoá nhỏ nhất có thể mà vẫn đảm bảo tính duy nhất của mỗi bản ghi. Những khoá có ý nghĩa được thay thế trên không cần thiết phải huỷ bỏ, chúng có thể đơn giản được chuyển đến một thuộc tính không phải là khoá. Phương pháp này cho khả năng linh hoạt ở mức cao nhất, việc bảo trì là ít nhất và công suất cao nhất có thể.

Dưới đây minh hoạ việc thiết kế chỉ mục cho các bảng thực:

STT Tên Bảng Tên Index Trường Index

1 BanHang_Fact Index_BanHang Id_BanHang 2 KhachSan_Fact Index_KhachSan Id_KhachSan

STT Tên bảng thực Tên bảng chiều Trường liên kết

1 BanHang_Fact DMSanPham MaSP

DMKhachHang MaKH

DMNhaCC MaNCC

DMMưcUuDai MaUuDai

Time_Dim TimeID

3 DuLich_Fact Index_DuLich Id_DuLich 4 VeMayBay_Fact Index_VeMayBay Id_VeMayBay Bảng 3.2 Một số bảng chỉ mục

* Các sơ đồ dữ liệu

Dưới đây là sơ đồ dữ liệu của các DM trong kho dữ liệu thương mại điện tử:

Hình 3.4 Sơ đồ quan hệ thực thể dịch vụ đặt phòng khách sạn

3.5 KẾT LUẬN CHƢƠNG 3

Để có thể xây dựng kho dữ liệu và các khối dữ liệu phục vụ cho nhu cầu khai thác thông tin, hỗ trợ quyết định cho các nhà quản lý thương mại điện tử cần phải tìm hiểu thật kỹ càng và chính xác về hoạt động của hệ thống. Chương này đã trình bày một cách khái quát về hệ thống TMĐT, tìm hiểu các yêu cầu và dựa trên các thông tin thu thập được đã tiến hành phân tích, thiết kế kho dữ liệu TMĐT nhằm chuẩn bị cho công việc tạo lập kho.

Muốn công việc xây dựng kho dữ liệu được tiến hành một cách đúng đắn, tránh đựơc sai sót và đem lại hiệu quả cao, trước khi tiến hành xây dựng kho, chúng ta rất cần được trang bị những kiến thức cơ bản về phương pháp luận xây dựng kho dữ liệu, cần có cái nhìn tổng quát về phương pháp luận chung, phương pháp thiết kế truyền thống và từng giai đoạn cụ thể trong quá trình tạo lập kho.

Một phần của tài liệu Xử lý phân tích trực tuyến OLAP và ứng dụng trong khai thác kho dữ liệu (Trang 61)