Trợ giúp quyết định dựa vào dữ liệu trên cơsởkho dữ liệu và OLAP

Một phần của tài liệu Tiểu luận môn hệ hỗ trợ quyết định TÌM HIỂU PHƯƠNG PHÁP XỬ LÝ PHÂN TÍCH TRỰC TUYẾN VÀ ÁP DỤNG XÂY DỰNG HỆ HỖ TRỢ QUYẾT ĐỊNH (Trang 72)

Hệ thống OLAP cho chúng ta khám phá dữ liệu đểhướng đếnviệc ra quyết định. Nó cho phép chúng ta truy xuấtvà xem dữ liệu từnhiều khía cạnh

khác nhau. Nhưng quan trọng hơn là hệ thống sẽcho chúng ta những lối vào bên trong dữ liệu đểtìm hiểu, dựa trên chính những đặctính của dữ liệu. Hệ thống cũng sẽcho chúng ta khoan sâu vào trong dữ liệu đểtruy xuấtđược những thông tin chi tiếtởnhững mức độkhác nhau mà chúng ta có thểcần đến.Điểm quan trọng cuối cùng là những công cụ OLAP thường nhanh và dễ sửdụng. Chúng ta có thểlướtqua hàng Megabytes hay Gigabytes dữ liệu mà không phảiđợihàng giờmới có đượckếtquả.

Hệ thống OLAP rấtkhác với hệquản trịCSDL truyền thống: không chỉ dừng lạiởviệc truy vấn tĩnh, người sử dụng còn có thểđiều chỉnh việc tìm kiếm dữ liệu sao cho nó phù hợp với những nhu cầu chính xác của họ. Vì hệ thống OLAP cung cấp cho người sử dụng khả năng tiến sâu vào dữ liệu, cắt lát, khoan xuống các thông tin chi tiếtnên người sử dụng sẽcó thểhiểu rõ hơn vềdữ liệu đểtừđó có thểra các quyết định phù hợp một cách nhanh chóng. Hệ thống OLAP cho phép người sử dụng khiến cho “dữ liệu nói chuyện với chính chúng”.

Với mục đích nhằm hiểu đượccác loạidữ liệu đểsửdụng và cách tổ chức chúng, ta cần làm việc với những nhà ra quyết định. Họsẽcho chúng ta

biếthọsẽsửdụng các dữ liệu nhưthếnào và những câu hỏi nào mà họmong muốn đượctrảlời. Chính từtrong việc tổ chức mô hình OLAP, chúng ta sẽ khám phá ra đượcnhững loạidữ liệu nào đang sẵn có và những dữ liệu sơcấp nào cần được thu thập đểcó thểphục vụtốt cho việc tạo ra những quyết định hiệu quả.

Nhưvậy Trợ giúp quyết định hướng theo dữ liệu nhằm vào việc tổ chức hiệu quảkho dữ liệu và sửdụng giảipháp OLAP đểcung cấp tối đa các thông tin theo xu hướng quyết định cho người sử dụng, Trợ giúp cho họđưa ra được những quyết định phù hợp một cách dễdàng và nhanh chóng nhất.

4.2.2.Tiến trình Trợ giúp quyết định dựa vào dữ liệu cho bài toán cụthể

Trướckhi thiếtkếmô hình OLAP cho một bài toán, chúng ta cần xác

định rõ các vấn đềgặp phảitrong các tình huống xem xét. Các vấn đềđược nêu ra căn cứvào việc tìm hiểu tình huống thực tếmột cách khách quan và toàn diện. Trên cơsởcác nhận định này, chúng ta sẽđặtra những mục tiêu cần đạttới ví dụnhư: khắc phục hoặc giảm thiểu hạn chế,cảitiến hiệu quả...

Đểứng dụng OLAP, chúng ta cần xây dựng một mô hình phục vụcho phân tích OLAP dựa trên tình huống của bài toán, các vấn đềvà các mục tiêu đã xem xét. Đó là quá trình xác định các khối dữ liệu dựđịnh tổ chức, định nghĩacấu trúc các chiều và định nghĩacác công thức/luậtcần thiếtcho tính toán. Việc xác định các khối dữ liệu sẽphát sinh ra vấn đềtạisao lạitổ chức n khối mà không là m khối, tổ chức những khối nào là có lợi nhất? Tương tự, việc tổ chức cấu trúc các chiều cũng nhưviệc định nghĩacác công thức sẽđặt ra những câu hỏi: phân cấp chiều nhưvậy đã phù hợp và đầyđủchưa, các công thức định nghĩanhưvậy đã đúng chưa, hợp lý không? Tất cả các vấn đề này phần lớn phụthuộc vào việc cân nhắc hiệu quảxử lý đối với bài toán cụ thể,vào sựphân tích tình huống, hoàn cảnh thực tếmột cách đầyđủvà cảtrên điều kiện triển khai thực hiện mô hình: thiếtbịphần cứng, ưu, khuyếtcủa hệ thống OLAP sửdụng... Khó tạo lập đượcmột chuẩn mực, phương pháp để xây dựng mô hình OLAP cho tất cả các bài toán, công việc này chủyếu tùy thuộc vào bài toán cụthể,vào môi trường triển khai và cảvào kinh nghiệm...

Trên cơsởmô hình OLAP, CSDL OLAP đã đượcthiếtlập, ngườikhai thác hệ thống sẽđiều chỉnh việc tìm kiếm thông tin của mình bằng cách liên tục đặtra những yêu cầu truy vấn, thực hiện, rồi nhận xét kếtquả,nhằm tìm hiểu rõ dần những nội dung tiềm ẩn của dữ liệu nguồn (thu thập đượctheo những vấn đềang quan tâm) đểtiến tới chỗcó đủcơsởnhận định, từđó ra đượccác quyết định cần thiết.

Việc Trợ giúp ra quyết định không nhằm đưa ra cho người sử dụng một sốphương án khảdĩhiệu quảđểgiúp họlựa chọn hoặc đưahẳn ra một phương án khảdĩtối ưu đểgiúp họquyết định như các Hệ trợ giúp quyết định dựa vào mô hình thường làm, nó tạo phương tiện đểcung cấp nhiều nhấtcác thông tin phong phú, đa dạng, trên các khía cạnh, ởcác mức khác nhau một cách nhanh chóng, giúp cho ngườikhai thác có thểđiều chỉnh việc tìm kiếm

dữ liệu đểnắm bắtđượctối đa những gì họcần hiểu rõ, đểchính họsẽra những quyết định phù hợp. Nhưvậy ngườikhai thác cần là chuyên gia vềlĩnh vực của bài toán ứng dụng cụthể.Tuy nhiên không nhưkhuynh hướng của hệ Trợ giúp quyết định dựa vào mô hình là phần lớn phạm vi ứng dụng hẹp cho từng vấn đềcụthểvà chỉgiúp quyết định đượcmột vài vấn đề,hệ thống trợ giúp quyết định dựa vào dữ liệu có phạm vi ứng dụng là rấtrộng và có thể giúp ra nhiều quyết định khác nhau. Trong mỗi ứng dụng cụthể,chúng ta chỉ cần thiếtlập mô hình OLAP tương ứng cho nó là có thểhỗ trợra quyết định.

4.3. Xây dựng cấu trúc thông tin hỗ trợviệc ra quyết định

4.3.1. Vai trò của cấu trúc thông tin

Các hệ thống thông tin và cấu trúc thông tin của nó cần hỗ trợmỗi giai đoạn của quá trình ra quyết định. Môi trường ra quyết định đòi hỏi một sốmô hình Trợ giúp quyết định phụthuộc vào các điều kiện khác nhau. Nếu quá trình ra quyết định có thểkhông tựđộng hoá hoàn toàn thì nó cũng có thể đượctựđộng hoá một phần nào đó.

Đểra quyết định qua việc phân tích và mô hình hoá, các ứng dụng dữ liệu cần đượcliên kếttừnhiều cơ sở dữ liệu truyền thống và đượccơcấu lại đểhỗ trợứng dụng. Sau đó nó cần đượcđịnh dạng lạivà đượcđưa ra trong dạng thức có thểTrợ giúp đểlàm việc hiểu nó dễdàng hơn.

Hiện nay bấtkỳtổ chức nào cũng có các hệ thống dựa trên thực tếnhư các hệ thống xử lý giao dịch (Transaction Processing Systems), các hệ thống tựđộng hoá văn phòng (Office Automation Systems), các Hệ trợ giúp quyết định (Decision Support Systems) và các hệ thống xử lý phân tích trực tuyến (OLAP). Các hệ thống này đượchỗ trợbởi các công nghệ khai thác dữ liệu, kho dữ liệu, ảo hoá dữ liệu và các hệ thống thông tin địalý, mỗi hệ thống thông tin này có các cấu trúc thông tin riêng của nó. Đểcung cấp môi trường

Trợ giúp quyết định với các cấu trúc thông tin ởtrên cần thực hiện các bước sau: • Thống nhấtdữ liệu từcác cấu trúc thông tin khác nhau trong các nguồn dữ liệu khác nhau. Quá trình này đượcgọi là trích xuất, chuyển đổivà nạp dữ liệu (Extract Transformation Load - ETL).

• Xử lý bằng các công cụphân tích và mô hình hoá.

• Định dạng lạidữ liệu gốc, cung cấp các năng lực truy vấn, đồhoạvà báo cáo.

4.3.2.Các yếu tốảnh hưởng

Có hai tham sốcho thấy tính hiệu quảcủa hệ thống ra quyết định:

• Các yêu cầu thông tin: sựhỗ trợcủa cấu trúc thông tin đối với các yêu cầu thông tin của người ra quyết định.

• Mức độtích hợp: đây là sựmởrộng các cấu trúc thông tin trong tổ chức đượctích hợp.

4.3.2.1. Các yêu cầu thông tin

Yêu cầu quan trọng trong quá trình ra quyết định là sựcó mặt của thông tin đượcyêu cầu trong dạng thức đúng. Tính hiệu quảcủa các cấu trúc thông tin được sử dụng đểra quyết định đượco bằng các yếu tốsau:

• Độchính xác của thông tin. • Độtin cậy của thông tin. • Độtương quan của thông tin. • Dạng thức của thông tin.

• Tính chấthợp thời của thông tin.

Sựkết hợp mức độra quyết định bao hàm các cấu trúc thông tin từcác tính năng khác. Nếu không đượccấu trúc, các yêu cầu chính xác của người ra quyết định không đượcgiảiquyếtvà cũng có thểbiến đổiđa dạng hơn. Do đó

người ra quyết định có thểkhông hiểu đầyđủcác nhu cầu thông tin thực tế. Khi các hệ thống OLAP được xây dựng sửdụng các hệ thống OTLP, chức năng của hệ thống đích phụthuộc vào dữ liệu nguồn. Sựphụthuộc này có thể đượchạn chế.Chấtlượng cấu trúc thông tin của Hệ trợ giúp quyết định phụ thuộc vào chấtlượng cấu trúc thông tin của các hệ thống nguồn. (adsbygoogle = window.adsbygoogle || []).push({});

Các hậu quảcủa việc không thực hiện các yêu cầu thông tin của người ra quyết định là:

• Khi thông tin không chính xác ởcấp có thểchấp nhận được,người ra quyết định cần đưa ra các nhận xét. Đây là việc tiêu tốn thời gian và dễ mắc lỗi. Trong một sốcác trường hợp, họcần loạibỏthông tin từhệ thống và tìm kiếm thông tin từcác nguồn khác.

• Khi thông tin không liên quan đếnmục đích, người ra quyết định cần xuyên suốt quá trình đểcó đượcthông tin liên quan. Điều này có thể bao gồm việc xử lý lạidữ liệu hoặc chuyển qua các quá trình khác cho đếnkhi thông tin liên quan được thu thập.

• Khi thông tin không đúng dạng thức, người ra quyết định phảixuyên suốt quá trình để đưa nó về dạng thức chính xác. Điều này lần nữa lại làm tiêu tốn thời gian.

• Đã có các trường hợp các thông tin đượcyêu cầu không có mặtđúng lúc đểcho ra các quyết định quan trọng. Các quyết định quan trọng này đượccho ra khi sửdụng các tổng hợp bằng tay.

Mặc dù không liên quan trực tiếp đến các yêu cầu thông tin, hai yếu tố sau lại hạn chế việc thu được các lợi ích tối đa từcác Hệ trợ giúp quyết định:

• Việc thiếu các công cụphân tích hợp lý làm giảm khả năng phân tích và đánh giá các lựa chọn thay thế.Người ra quyết định không thểthực hiện phân tích lợi ích/chi phí hay phân tích ảnh hưởng.

định không thể lựa chọn giải pháp tốt nhất.

4.3.2.2. Mức độ tích hợp

Một yếu tố rõ ràng trong môi trường ra quyết định là sốlượng nguồn thông tin ngày càng tăng. Việc ra quyết định đòi hỏi khả năng từnhiều tính năng. Điều này sinh ra yêu cầu tích hợp một vài cấu trúc thông tin trong các hệ thống khác nhau. Trong đa sốcác trường hợp, không thểtruy cập hay đưa ra tấtcảthông tin đượcyêu cầu. Thậm chí nếu tất cả các yêu cầu đã đượcxác định thì cũng không thểthực hiện khi sửdụng dữ liệu từcác hệ thống thông tin hiện có. Trích xuấtdữ liệu từmột vài OLTP hay các nguồn dữ liệu hợp lệ thành một nhóm chung và chuyển nó thành dạng thức tương thích với hệ thống OLAP đòi hỏi các nỗlực đáng kể.

Với các công cụthông minh, kho dữ liệu có sẵn, việc tích hợp tấtcả hoặc tích hợp một vài tính năng không phảilà nhiệm vụdễdàng. Nó không thểđiều tiếtdữ liệu từmột vài hệ thống nội tại. Một sốnguyên nhân của các vấn đềtích hợp là:

• Việc tích hợp tựđộng không thểđượccung cấp theo tính chấtcủa hạ tầng công nghệ.Các tổ chức đầutưvào các công nghệkhác nhau vì thế cần yêu cầu tích hợp.

• Tính chất của hệ thống không cho phép cung cấp việc tích hợp hệ thống. Các ứng dụng từcác nhà cung cấp khác nhau hoạt động theo các thông sốkhác nhau. Vì vậy vềkỹthuật, có thểkhông hợp lý khi tiến hành tích hợp các hệ thống này.

• Các kỹnăng cần thiết cần cho tích hợp các hệ thống này không có trong tổ chức.

• Yêu cầu tích hợp tựđộng bịbỏqua. Các hậu quảcủa điều này là:

nhau. Cần xem xét đểđưanó vào một dạng thức chung.

• Việc thực hiện bằng tay nhằm kết hợp các kết quảnày là vô cùng nhiều. Người ra quyết định có thểkhông mấtthời gian cho các nhiệm vụnày. • Khi thực hiện các bướccần thiếtđểkết hợp các kếtquảtừcác nguồn khác

nhau, cơhội đểnhận thấy các lỗi ởmỗi bướclà hiển nhiên. Điều này đòi hỏi nỗlực bổsung đểthông qua và sửa các lỗi này.

• Người ra quyết định có thểcần sựhỗ trợkỹthuậtđểkết hợp các kết quảtừcác hệ thống khác nhau. Sựphụthuộc vềkỹthuậtởmức độnày là có thểchấp nhận được.

• Sựkhông nhấtquán trong các kếtquảtừcác nguồn khác nhau có thể không đượcphát hiện. Trong trường hợp này kếtquảcuối có thểchứa lỗi.

4.3.3.Mô hình tổ chức thông tin

Không có một biện pháp tốt nhấthay một mô hình tốt nhấtđểxây dựng các cấu trúc thông tin đểcó thểđáp ứng các yêu cầu của người ra quyết định. Một tiêu chí có thểđượccung cấp đểviệc lựa chọn cấu trúc thông tin là phù hợp nhất. Điều này dựa trên hai yếu tốđã đượcnêu ởtrên là các yêu cầu thông tin và mức độtích hợp. Các yếu tốnày được sử dụng đểhình thành chiến lượcxây dựng cấu trúc thông tin cho việc ra quyết định.

4.3.3.1. Các yêu cầu thông tin và năng lực của hệ thống thông tin

Bướcđầutiên là phải thiết lập một sựtương đồng giữa các yêu cầu thông tin và hệ thống hỗ trợthông tin. Các yêu cầu thông tin chính xác có thể không đượcxác định dựa theo tính chấtphi cấu trúc của quá trình ra quyết định, các hạn chếdựa trên hiểu biếtkinh nghiệm của người ra quyết định. Các Hệ trợ giúp quyết định hiện đạicung cấp một sốnăng lực nhằm hỗ trợngười

ra quyết định trong quá trình chuẩn bịra quyết định. Tuy nhiên, không phải tất cả các tiện ích này đềudo người ra quyết định yêu cầu. Vì thếcần gợi ý để nhận dạng các yêu cầu ởmột cấp nào đó, sau đó các tiện ích từHệ trợ giúp quyết định có thểđượcthiếtkếphù hợp với các yêu cầu này.

Bằng việc sửdụng hai thông sốlà mức độcủa việc nhận dạng yêu cầu thông tin và các năng lực phần mềm Trợ giúp quyết định, ma trận Yêu cầu/Năng lực đượcxác định.

Hình 4.4. Ma trận Yêu cầu/Năng lực

Ma trận thểhiển 4 khả năng đượcký hiệu A1, A2, A3 và A4. Mỗi khả năng cung cấp các mức độkhác nhau của việc nhận dạng các yêu cầu và các năng lực của hệ thống.

• A1: Chỉcác yêu cầu thông tin tối thiểu đượcnhận dạng và phần mềm chỉcung cấp các tiện ích tối thiểu. Chỉnhận dạng các yêu cầu tối thiểu của người ra quyết định đồng thời hệ thống chỉcung cấp một sốchức năng có ích. Nó là hệ thống tựđộng đơngiản nhưmột bảng tính. Trong trường hợp này người ra quyết định cần thực hiện công việc bằng tay nhiều hơn trong quá trình ra quyết định.

• A2: Phần lớn các yêu cầu đã đượcnhận dạng. Nhưng hệ thống không thểcung cấp tất cả các tiện ích này. Nguyên nhân có thểlà do việc đánh giá hệ thống không hợp lý, có thểlà do không có thông tin liên quan, không có ngườichuyên nghiệp có kỹnăng đểđánh giá hoặc do xu hướng của các sản phẩm thương mại. (adsbygoogle = window.adsbygoogle || []).push({});

• A3: Tất cả các yêu cầu của người ra quyết định đã đượcnhận dạng và hệ thống hỗ trợ quyết định có khả năng cung cấp các tiện ích. Người ra quyết định có thểsửdụng toàn bộcác tiện ích này. Đây là trường hợp lý tưởng cho việc ra quyết định do có một sựtương đồng giữa các yêu cầu và các tiện ích hệ thống.

• A4: Chỉmột phần các yêu cầu đượcnhận dạng. Hệ thống có các tiện ích đểcung cấp tất cả các chức năng đượcyêu cầu trong quá trình ra quyết định. Tuy nhiên các tiện ích không được sử dụng bởi những người ra quyết định. Những người ra quyết định không biếtlàm thếnào đểsửdụng hệ thống nhằm thu đượccác lợi ích tối đa. Kiểu này làm phức tạp các Hệ trợ giúp quyết định đượccài đặtmà không phân biệttất cảcác yêu cầu. A3 là tình huống lý tưởng và trên thực tếđiều này hiếm khi tồn tại. Tuy nhiên đa sốcác tổ chức có các hệ thống nằm trong khả năng A2 hoặc A4 và trên thực tếsẽđạtđượcmức vừa phảigiữa A2 và A4.

4.3.3.2. Mức độtích hợp hệ thống

Có 5 mức độtích hợp hệ thống đượcxác định. Các mức độnày biến đổitừkết hợp bằng tay hoàn thành đếntích hợp toàn bộ.

• Mức 1: Kếtquảnhận đượctừcác hệ thống khác nhau đượctích hợp cao và không thểkết hợp chúng một cách tựđộng. Đây là trường hợp không có sựtích hợp và người ra quyết định cần xử lý các kếtquảbằng tay.

• Mức 2: Đây là trường hợp tồi nhất. Các kếtquảtừcác hệ thống được xem xét bởi người ra quyết định và chỉthông tin liên quan đượctrích xuấttừbáo cáo. Ởđây có sựxử lý bằng tay đểcó đượckếtquảmong muốn. Ví dụ: có thểcó một sốhệ thống riêng biệtđưa ra các kếtquả trong dạng thức các báo cáo in.

• Mức 3: Nhưmức 2, các kếtquảnhận đượctừcác hệ thống riêng khác nhau như các báo cáo in. Đây là việc truy xuất lại hệ thống tựđộng khác đểthu đượckếtquảmong muốn. Ví dụ: các kếtquảnhận đượctừ các hệ thống khác nhau đượcnhập vào bảng tính Excel đểxử lý.

• Mức 4: Trong trường hợp này các kếtquảcó mặttrong dạng thức ‘điện tử’. Tuy nhiên sựcan thiệp bằng tay là cần thiếtđểđưacác kếtquảnày vào quá trình kết hợp đượctựđộng hoá. Ví dụ: các kếtquảtừnhiều hệ thống có mặtnhư các file riêng, người ra quyết định cần tảicác file này vào thưmục liên quan bằng cách sửdụng các thủtục.

Một phần của tài liệu Tiểu luận môn hệ hỗ trợ quyết định TÌM HIỂU PHƯƠNG PHÁP XỬ LÝ PHÂN TÍCH TRỰC TUYẾN VÀ ÁP DỤNG XÂY DỰNG HỆ HỖ TRỢ QUYẾT ĐỊNH (Trang 72)