Phõn tớch cấu trỳc mạng

Một phần của tài liệu Một số phương pháp khai phá dữ liệu và ứng dụng trong bài toán lập thời khoá biểu (Trang 50 - 54)

1. Tổ chức và khai thỏc cơ sở dữ liệu truyền thống

3.4.2.Phõn tớch cấu trỳc mạng

Mụ hỡnh cấu trỳc mạng:[6]

Vấn đề kết nối

Điều kiện 1 Điều kiện 2 Điều kiện 3 Điều kiện 4 Điều kiện 5

Đơn vị kiểm thử Điều khiển Chuyển đổi

Liờn kết Đối tượng

Trong một số trƣờng hợp chỳng ta cần nghiờn cứu cỏc dữ liệu quan trọng vớ dụ nhƣ của chớnh phủ, thụng thƣờng chỳng ta khụng đƣợc cấp quyền truy cập dữ liệu vỡ lý do an ninh, ngoài ra chỳng ta cũng khụng cú dữ liệu sạch để phõn tớch. Khi đú chỳng ta dựng giải phỏp dung hoà, chỳng ta định hỡnh một cụng cụ trực quan để tải dữ liệu trong khuụn dạng nhất định trong mụ hỡnh trung, tiếp theo ta xõy dựng cỏc hàm hiển thị để lấy cỏc thụng tin mụ tả nhất định. Mụ hỡnh này cú thể lộ ra dữ liệu nguyờn thuỷ hoặc nội dung dữ liệu.

Mỗi lần thụng tin đƣợc đƣa vào trong mụ hỡnh, chỳng ta cú thể giỳp đỡ chỳng xỏc định những mẫu then chốt và cỏc phần tử dữ liệu mẫu trong màn hỡnh đơn dựa trờn cơ sở thể hiện của cấu trỳc đối tƣợng. Sử dụng cụng cụ phõn tớch liờn kết chỳng ta dễ dàng xỏc định cỏc đối tƣợng cú kết nối cao với nhau và cỏc mối quan hệ khỏc thƣờng hoặc khụng trựng lặp nhiều lắm với phần cũn lại của dữ liệu. Xa hơn nữa, dựa trờn sự xếp nhúm cỏc thuộc tớnh, chỳng ta chỉ ra nới mà mối quan hệ trong tập dữ liệu tồn tại mạnh mẽ nhất. Khi những khỏch hàng của chỳng ta muốn kiểm tra những giỏ trị của những đối tƣợng đặc biệt thỡ chỳng ta cú thể trỡnh bày cỏc thụng tin này. Nhƣ vậy, chỳng ta cú thể thực hiện sự phõn tớch thành cụng và chớnh xỏc bởi việc khảo sỏt cấu trỳc mạng.

Điểm nối bản lề

Cỏch tiếp cận phõn tớch dựng cụng nghệ trực quan húa để phỏt hiện những nỳt cổ chai hoặc khớp nối trong tập dữ liệu. Chẳng hạn, những đối tƣợng dữ liệu nối hai hoặc nhiều hơn cỏc mạng con cú thể rất quan trọng trong việc là điểm nối bản lề trong toàn bộ mạng. Nếu một đối tƣợng nối bản lề tồn tại bờn trong mạng thƣờng xuyờn thỡ nú chỉ bỏo rằng đối tƣợng đƣợc đại diện cú một vai trũ quan trọng trong thể hiện. Cú thể cú nhiều điểm nối bản lề bờn trong một mạng cú thể hoặc khụng cú thể đỏp ứng những hàm tƣơng tự.

Một điểm nối bản lề cú thể đại diện là một đối tƣợng cú số lƣợng kết nối lớn hoặc quỏ độ. Nếu đối tƣợng bị loại bỏ thỡ toàn bộ cấu trỳc mạng bị ảnh hƣởng đỏng kể. Đối tƣợng quan trọng đƣợc xỏc định từ mụ hỡnh đƣợc sử dụng trong trỡnh bày dữ liệu.

Trong một mụ hỡnh mạng cú cấu trỳc phức tạp và lớn, tất yếu cú cỏc mạng mức dƣới, cỏc mạng này rất hữu ớch cho quỏ trỡnh phõn tớch. Tất cả cỏc mạng này đều riờng biệt hoặc cụ lập để cú thể đƣợc phõn tớch một cỏch độc lập, do đú cấu hỡnh của nú đƣợc xỏc định độc lập. Đụi khi mục đớch của phõn tớch mạng khỏm phỏ những mạng mức dƣới tồn tại trong một tổ chức mạng lớn hơn. Vớ dụ, khi phõn tớch mụ hỡnh nhõn sự ta cú thể phỏt hiện ra cỏc nhõn viờn hoặc cỏc bộ phận tỏch rời khỏi tổ chức, khi đú sẽ cú cỏc thụng bỏo để tổ chức lại nếu cần.

Trong những thể hiện khỏc, mục đớch nghiờn cứu là xõy dựng mạng từ cỏc mạng riờng bịờt. Chẳng hạn, cảnh sỏt cú thể xõy dựng cho một tập dữ liệu chứa đựng thụng tin riờng lẻ về những tờn trộm đờm xuất hiện bờn trong một thành phố lớn. Sau đú với việc lọc ra cỏc thuộc tớnh riờng cú thể cụ lập cỏc tờn tội phạm và do đú dễ dàng xử lý hơn.

Kết nối mất tớch

Những kết nối mất tớch cú thể cấu thành một dạng đặc biệt của mụ hỡnh mạng riờng biệt, khi đú mạng mức dƣới sẽ gồm một đối tƣợng đơn. Những phần mất tớch cú thể phản ỏnh dữ liệu mõu thuẫn hoặc khụng đầy đủ và khi đú cần phải xem xột cẩn thận để điều đú là chắc chắn. Cần phải cho ý rằng nếu đó dựng lọc trong hiển thị trực quan thỡ việc mất tớch cú thể do nguyờn nhõn này.

Trọng số kết nối.

Nhỡn vào thể hiện trực quan ta cú thể thấy đƣợc quan hệ trong tập dữ liệu thụng qua mối liờn kết giữa cỏc đối tƣợng. Cỏc kết nối đú mạnh hay yếu là tuỳ thuộc vào mối quan hệ trờn thực tế của dữ liệu. Vớ dụ, trong mụ hỡnh bỏn hàng, mối quan hệ giữa hàng hoỏ và khỏch hàng sẽ thể hiện hàng nào đƣợc bỏn chạy hay khụng, mối quan hệ này mạnh hay yếu là dựa vào số lần đặt hàng, số lần mua và số lƣợng bỏn ra.

Khỏm phỏ những mẫu nổi bật của kết nối

Cú một vài kỹ thuật đƣợc ỏp dụng rất tốt trong mụ hỡnh mạng. Cỏc giải thuật đặc biệt này làm lộ ra mẫu nổi bật trong kết nối. Cỏc mẫu này chỉ ra cỏc cấu trỳc ẩn trong tƣơng tỏc thõn cận giữa cỏc nỳt. Cỏc nỳt này đƣợc nhúm lại với nhau để tạo sự kết nối vững chắc hơn trong nội bộ so với cỏc nỳt bờn ngoài.

1. Nhúm nổi bật.

Giải thuật nhúm nổi bật cú thể sử dụng để xỏc định những nhúm đối tƣợng ràng buộc với nhau bằng quan hệ.

Giải thuật: Giải thuật dựa trờn 3 tiờu chuẩn:  Nhúm phải chứa ớt nhất ba nỳt ứng viờn.

 Mỗi thành viờn trong nhúm phải cú mối quan hệ chỉ định tối thiểu với cỏc thành viờn trong nhúm.

 Tối thiểu cú một con số chắc chắn của tổng cỏc mối quan hệ cho mỗi thực thể tồn tại duy nhất với một thực thể đƣợc đề nghị trong nhúm. Cỏc tiờu chuẩn này cú thể đƣợc thay đổi tuỳ theo tong trƣờng hợp để đạt đƣợc kết quả cao nhất.

Chỳng ta cú mụ hỡnh vớ dụ:[6]

2. Cỏc thành phần khoỏ khụng thuộc vào nhúm.

Khụng phải là tất cả cỏc phần tử dữ liệu đều phõn lớp vào duy nhất một nhúm. Tuy nhiờn, những phần tử dữ liệu ngoại lệ cú thể đúng vai trũ then chốt trong toàn cấu trỳc mạng. Phụ thuộc vào ứng dụng thỡ vai trũ này cú thể rất quan trọng trong việc hiểu cấu trỳc dữ liệu. Sau đõy là ba vai trũ bổ sung cho sự phõn lớp cỏc kiểu đối tƣợng này

Liờn lạc: Liờn lạc là cỏc đối tƣợng đúng vai trũ khoỏ thành phần trong mạng chớnh của thực thể. Chỳng cú thể khụng là bộ phận của nhúm nào, nhƣng chỳng lại cú kết nối cao đến cỏc nỳt khỏc trong mụ hỡnh. Chỳng quan trọng vỡ chỳng cú thể

bắc cầu qua những chỗ trống giữa hai hoặc nhiều hơn hai nhúm trong toàn bộ cấu trỳc.

Gắn liền cỏc phần cụ lập: Những thực thể này cú một vai trũ đỏng quan tõm trong mạng bởi vỡ chỳng đƣợc nối tới những đối tƣợng khỏc, sau này với cỏc ràng buộc dần dần nú sẽ là thành viờn của nhúm nổi bật hoặc nhúm liờn lạc.

Cụ lập cỏc biệt lập: Những thực thể này đơn giản khụng phải là thành phần hoặc bất kỳ mạng xõy dựng thành. Chỳng khụng thuộc về bất kỳ nhúm nào mà cũng khụng cú hỗ trợ kết nối tới mọi thực thể khỏc bờn trong mạng.

(adsbygoogle = window.adsbygoogle || []).push({});

Một phần của tài liệu Một số phương pháp khai phá dữ liệu và ứng dụng trong bài toán lập thời khoá biểu (Trang 50 - 54)