Phõn tớch đặc điểm cấu trỳc

Một phần của tài liệu Một số phương pháp khai phá dữ liệu và ứng dụng trong bài toán lập thời khoá biểu (Trang 48 - 50)

1. Tổ chức và khai thỏc cơ sở dữ liệu truyền thống

3.4.1.Phõn tớch đặc điểm cấu trỳc

Rất nhiều cỏc kết luận đƣợc đƣa ra một cỏch đơn giản bằng việc nhỡn vào cấu trỳc trỡnh bày. Những phần tử trong cảnh qua cú thể chỉ ra nơi cú cỏc mẫu đang ẩn. Việc xếp đặt và xuất hiện của cỏc đối tƣợng cú thể mang đến rất nhiều thụng tin cho ngƣời dựng. Những mẫu bất thƣờng cú thể đem lại thụng tin về cỏc dữ liệu đó mất hoặc cho ta cỏc mẫu rất bất ngờ. Hơn nữa, hỡnh thức thể hiện cú thể đƣa ra cỏc dị thƣờng nhƣ dữ liệu với cỏc giỏ trị trỏi luật, nhúm dữ liệu với tỷ lệ và kớch thƣớc khụng bằng nhau. Chỳng ta luụn luụn phõn tớch trực quan bằng việc xem xột cỏc thể hiện hoặc dữ liệu mà khụng cú cỏc nhón đối tƣợng hoặc cỏc sự xếp đặt, điều đú làm cho chỳng ta nhỡn sự việc tổng quan hơn.

Những giỏ trị vƣợt giới hạn.

Thớnh thoảng hiển thị của cỏc thụng tin bờn ngoài rừ đến mức nú thể kiểm tra ngay lập tức cấu trỳc dữ liệu của nú. Bằng phƣơng phỏp vẽ biểu đồ biểu diễn mật độ

cỏc đối tƣợng ta xỏc định đƣợc cỏc giỏ trị ở bờn ngoài nhƣ trong hỡnh trờn [6].  Dữ liệu mất tớch.

Đụi khi mục đớch của phõn tớch sẽ phỏt hiện ra những bản ghi cần phải cú mặt nhƣng thật ra đó mất tớch từ tập dữ liệu. Nếu khi gọi thụng tin mà bất kỳ mảng nào của thụng tin mất tớch thỡ chỳng ta biết rằng sự thất bại của hệ thống xuất hiện. Bởi vậy, nếu chỳng ta muốn kiểm tra liệu cỏc chức năng hệ thống hoạt động đỳng ở bất kỳ điểm nào, chỳng ta cú thể tập hợp dữ liệu đƣợc gọi và phải xỏc định bất kỳ bản ghi nào là khụng đầy đủ.

Làm ƣớc lƣợng, một ma trận kiểm thử đƣợc phỏt sinh để định nghĩa những tham số của những trƣờng hợp điển hỡnh. Ma trận sẽ bao gồm những thực thể mụ tả cỏch bố trớ, xếp đặt. Một ma trận kiểm thử chuẩn sẽ chứa đựng thụng tin mụ tả một hàng nghỡn bản ghi tế bào. Cỏc kiểm thử thƣờng dựng những cụng nghệ tế bào phần cứng chuyờn dụng cú khả năng ghi tất cả cỏc điều kiện vận hành. Một danh sỏch điều khiển “chủ" đƣợc phỏt sinh từ phần cứng để trở thành là cơ sở để thử hệ thống nhƣ thế nào là tốt khi phần cứng hoặc phần mềm cú thay đổi, nõng cấp.

Khi dựng mụ tả trực quan dạng bú, dữ liệu đƣợc bú theo tập cỏc đặc tớnh, sự khụng nhất quỏn cú thể dễ dàng đƣợc xỏc định giữa điều khiển và những tập dữ liệu chuyển đổi. Cỏi mà chỳng ta tỡm kiếm trong những sơ đồ này là một tập hợp chắc chắn những cặp đụi giữa dữ liệu điều khiển và dữ liệu chuyển đổi dựa vào những giỏ trị đó thực hiện sự xếp nhúm.

Giỏ trị vượt giới hạn

Hỡnh sau[6] cho thấy rằng một màn hỡnh mà để lộ ra dữ liệu mất tớch trong tập dữ liệu ứng dụng. Cỏc dữ liệu mất tớch thỡ khụng cú đụi, trong khi những bản ghi tỡm thấy trong sơ đồ chỉ bỏo một lỗi trong tế bào mạng. Nhƣ vậy, những sơ đồ cú thể rất nhanh chúng để lộ ra những xung khắc cho cấu hỡnh đú bởi việc phơi bày dữ liệu mất tớch. Sự Phõn tớch dữ kiện dạng bảng trong vấn đề này cú thể là một quỏ trỡnh khú khăn và dài. Tuy vậy, ta cú thể ngay lập tức thấy rằng dữ liệu mất tớch một khi những tập dữ liệu đƣợc gửi cho một mỏy hiển thị.

Những mẫu dị thƣờng

Cỏc tập dữ liệu chứa đựng cỏc đại diện thỡ rất tuõn thủ cỏc nguyờn tắc trong kiến trỳc của chỳng sao cho chỳng cú động lực thỳc đẩy lẫn nhau trong cỏc biến cố (biến cố này thỳc đẩy biến cố kia). Hơn nữa, trong nhiều trƣờng hợp, những sự kiện cú thể đƣợc chờ đợi xuất hiện trong một thứ tự đặc biệt. Khi một loạt sự kiện xuất hiện sai thứ tự, điều này cấu thành một sự dị thƣờng mà cú thể dẫn đến một mẫu quan trọng.

Một phần của tài liệu Một số phương pháp khai phá dữ liệu và ứng dụng trong bài toán lập thời khoá biểu (Trang 48 - 50)