Những đặc tính và lợi ích

Một phần của tài liệu ÁP DỤNG KỸ THUẬT OLAP VÀ KHO DỮ LIỆU TRONG DỰ BÁO TÀI CHÍNH (Trang 32 - 36)

Cung cp hiu biết tường tn gia các mu và mi quan hệẩn trong d liu ca bn:

Một ví dụđiển hình của việc khai thác dữ liệu là một người bán lẻ phát hiện ra mối quan hệ giữa việc bán tả lĩt và bia vào những chiều chủ nhật – Hai sản phẩm này chẳng cĩ quan hệ gì với nhau. Nhưng nếu tình cờ nhữnhg ơng chồng phát hiện trong kho hàng cĩ bia thì họ sẽ nhặt bia lên thay vì tả lĩt – điều này sẽ khơng được phát hiện trước khi khai thác dữ liệu.

Cho phép bn khai thác nhng tương quan để ci thin cơng vic

Tiếp tục ví dụ trên, những người bán lẻ thường hoạt động trong những mối quan hệ họ cĩ bằng cách dùng chiến thuật liên kết các hạn mục với nhau để kích thích sự mua hàng. Các doanh nghiệp cĩ thể thu lợi từ theo cách làm giống nhau – sử dụng những kiểu mẫu được khám phá mới nhất và những tương quan như cơ sởđể thi hành cải thiện hiệu quả và hiệu lực.

Đúc kết các bí quyết cho tương lai

“Khơng học từ quá khứ chắc chắn sẽ bị vấp lại” là một lời trích nổi tiếng từ nhà triết học George Santayana. Việc khai thác dữ liệu cĩ khả năng dựđốn những hậu quả dựa vào dữ liệu đã cĩ để cải thiện đáng kể chất lượng và những hậu quả trước khi đưa ra quyết định. Lấy ví dụđơn giản, là người quyết định tốt nên kết hợp các giai đọan mà khách hàng thanh tốn đúng hẹn và lợi dụng những thơng tin hữu ích này để đưa ra những quyết định.

Cho phép đưa các khuyến cáo vào trong ng dng

Bạn cĩ thể dùng kết quả khai thác dữ liệu để trình bày một bản tổng kết thu chi đơn giản và đua ra những khuyến cáo vào họat động ứng dụng. Ví dụ trên màn hình thanh tốn bạn cĩ thể thêm câu: “Dựa vào số liệu mới cĩ đến 85% khả năng khách hàng này trả chậm, vì thế hĩa đơn này được đề nghị trả trước 50%”. Việc lập báo cáo

30

dựa trên kết quả tổng thể giống như thời gian thu hồi tiền hàng tồn đọng (DSO) giúp bạn đo được sự tiến triển trong kinh doanh dựa vào các đề xuất cho phép hay khơng cho phép để bạn tinh chỉnh mơ hình và các khuyến cáo cĩ hiệu quả tối ưu, cho phép bạn tận dụng triệt để các phạm vi thuật tốn.

Khơng cĩ thuật tốn nào tối ưu cho tất cả các tình huống. Vì vậy bạn nên thửở các phạm vi để tìm ra thụât tốn phù hợp nhất cho dữ liệu của bạn.

Nếu bạn cĩ nhiều thuật tốn hợp lý bạn cĩ thể dùng tất cả – Ví dụ: “Dựa trên sự phân tích của 3 mơ hình dựđĩan thì khả năng khách hàng này trả chậm là: Mơ hình A: 95% (96% đúng), Mơ hình B: 89% (92% đúng), Mơ hình C: 76% (97% đúng)”.

Cĩ th áp dng cho bt c BI hoc tiến trình kinh doanh nào

Tích hợp với các thành phần khác của hệ Pentaho BI cho phép bạn dễ dàng áp dụng khai thác dữ liệu cho bất kỳ tiến trình nào trong hệ thống (chẳn hạng như quay vịng tiền mặt) và qui trình kinh doanh thơng minh (như phát sinh báo cáo, hĩa đơn, và nhữg hành động trái quy luật). Việc ứng dụng này rất linh họat tùy theo dữ kiện của tiến trình BI được thực hiện.

Trích dn, to, khai thác để cĩ cái nhìn sâu sc hơn trong phân tích ca bn

Điều này xảy ra khi dữ liệu được sinh ra hoặc một phần trong tiến trình chuẩn bị dữ liệu. Ví dụ khi làm báo cáo bán hàng bạn cĩ thể hiện vùng đồ họa mà bạn dùng cho khai thác dữ liệu sau này. Ngịai ra bạn cũng cĩ thể thêm dữ liệu trong quá trình chuẩn bị khai thác dữ liệu – như các biến tính tốn hay đơn vịđo lường khác.

Cách khai thác d liu.

Chn mt mơ hình

Các nhà phân tích cĩ thể làm việc trên phạm vi mơ hình trực quan bao gồm các hình thức tiên tiến của khai thác dữ liệu như là xếp nhĩm, phân đoạn, các quyết định hình cây, kiểu ngẫu nhiên, kiểu hình mạng, và phân tích nhân tố thiết yếu.

Thêm d liu

Cĩ thể thêm các tính năng khác cho dữ liệu. Ví dụ, bạn cĩ thểđịnh nghĩa các biến để hệ thống cĩ thể tựđộng lấy dữ liệu tạo thêm các cột mới để phân tích.

31

Mỗi mơ hình làm việc cĩ những tham số riêng để phù hợp với dữ liệu mẫu. Những người phân tích cĩ thể dùng tham số này một cách tựđộng hay điều chỉnh bằng tay (phụ thuộc vào mơ hình)

Đánh giá

Kết quả cĩ thểđược đánh giá theo mơ hình dùng dữ liệu đã cĩ để so với kết quả thực tế

Tính hồn ho

Áp dụng mơ hình huấn luyện trong qui trình. Sau khi được huấn luyện chắc chắn sẽđưa ra kết quả tốt nhất cho mục đích kinh doanh cụ thể cần áp dụng.

D liu đầu ra

Áp dụng mơ hình huấn luyện trong qui trình. Sau khi được huấn luyện chắc chắn sẽ đưa ra kết quả tốt nhất cho mục đích kinh doanh cụ thể cần áp dụng.

K thut

Cơng c khai thác d liu mnh

Cung cấp một cơng cụ học giải thuật tồn diện từ dự án Weka bao gồm xếp nhĩm, chia đoạn, quyết định hình cây, kiểu ngẫu nhiên, kiểu hình mạng, và phân tích nhân tố thiết yếu.

Pentaho tích hợp với hệ Pentaho BI xử lý chuyển đổi định dạng dữ liệu tựđộng thành các định dạng mà cơng cụ khai thác dữ liệu cần[8].

Giải thuật cĩ thể áp dụng trực tiếp vào dữ liệu hoặc gọi từ Java.

Đầu ra cĩ thể xem dạng đồ thị tương tác với chương trình hoặc dùng nguồn dữ liệu để tạo báo cáo, phân tích sâu hơn hay các xử lý khác nữa.

Bộ lọc hỗ trợ việc phân rời hố, bình thường hĩa, mẫu sử dùng lại, chọn lọc thuộc tính, thay đổi và kết hợp thuộc tính.

Cơng cụ phân loại cung cấp các mơ hình để dựđốn những số lựơng ảo và thực. Sơ đồ học bao gồm những cây quyết định và danh sách, những máy véc tơ hỗ trợ,

32

Cơng cụ khai thác dữ liệu là một hệ hịan hảo trong việc phát triển máy học sơđồ giúp khách hàng kết hợp chặt chẽ các mơ hình của họ.

Đầu vào và đầu ra được kiểm sốt chặt chẽ, cho phép người phát triển đưa ra những giải pháp hồn tồn tùy biến sử dụng những thành phần được cung cấp.

Cơng c thiết kế trc quan

Cơng cụ thiết kế khai thác dữ liệu và quản trị trực quan được tích hợp theo chuẩn Pentaho và cĩ hỗ trợ trong Eclipse.

Cung cấp giao diện người dùng trực quan trong việc tiền xử lý dữ liệu, phân loại, hồi qui, xếp loại, qui luật hiệp hội và trực quan hĩa.

Bo mt và đạt chun

Cung cấp bảo mật vai trị và qui tắc kinh doanh

Hỗ trợ Java đăng nhập một lần và LDAP để tích hợp với các bảo mật doanh nhiệp đang tồn tại

Hỗ trợ mục đích kiểm thử. Dữ liệu kiểm thử cĩ thể in ngay ra báo cáo và được tích hợp với các đặc tính của tiến trình trong hệ Pentaho BI

Các định nghĩa Web Services, Repositories, XML

Các thành phần cĩ giao diện đồ họa được sử dụng một cách linh họat

Kho dữ liệu tập trung chứa các biểu báo, biểu mẫu, truy vấn và các nội dung khác Các định nghĩa về nội dung được lưu dạng XML cĩ thể tạo, sửa chữa bằng nhiều cách khác hơn là chỉ trên giao diện – ví dụ sửa file XML bằng tay.

Tính mm do và tính thc thi

Được thiết kếđể triển khai trong các doanh nghiệp, ứng dụng với chức năng phong phú chạy trên nền J2EE bao gồm JBoss™ , ngồi ra cịn cĩ tính năng mềm dẻo như là phân nhĩm.

33

Chương 4. Gii thiu bài tốn trin khai trên Pentaho và kết quả đạt được

Một phần của tài liệu ÁP DỤNG KỸ THUẬT OLAP VÀ KHO DỮ LIỆU TRONG DỰ BÁO TÀI CHÍNH (Trang 32 - 36)