Sự phụ thuộc của LOF theo Minpts.

Một phần của tài liệu Nghiên cứu các phần tử ngoại lai luận văn thạc sĩ máy tính (Trang 58 - 59)

c. Đánh giá độ phức tạp của thuật toán FindAllOutsD và so sánh với thuật toán Nested Loop.

3.4.1 Sự phụ thuộc của LOF theo Minpts.

Với những kết quả đã phân tích ở phàn trên, chúng ta đặt ra một số câu hỏi như: Giá trị của LOF thay đổi như thế nào khi điều chỉnh giá trị Minpts? Khi cho một dãy tăng các giá trị Minpts, thì có tương ứng là một chuỗi các thay đổi một cách đơn điệu của LOF hay không? Điều đó có nghĩa LOF có tăng hay giảm đơn điệu?

Thực tế thì LOF không tăng cũng không giảm một cách đơn điệu, ở hình 3.7 tôi trình bày một trường hợp đơn giản khi tất cả các đối tượng được phân bố theo phân bố Gauss, với mỗi giá trị Minpts giữa 2 và 50 thì giá trị Min, giá trị Max, giá trị trung bình cũng như là độ lệch tiêu chuẩn của LOF được biểu diễn.

Xét cận trên của LOF ở ví dụ trong hình 3.7. Đầu tiên, khi giá trị Minpts = 2, giá trị này quy về sử dụng khoảng cách thực của các đối tượng trong định nghĩa 5, bằng cách tăng dàn giá tri Minpts, các dao động thực hiện về các khoảng cách đạt được và giá trị LOF cũng giảm đi. Do đó, giá trị cựcđại của LOF có giảm xuống. Tuy nhiên, nếu giá trị Minpts tiếp tục tăng lên thì giá trị Max của LOF dao động lên xuống và cuối cùng nó ổn định tới một giá trị nhất định.

Nếu giá trị của LOF thay đổi không đơn điệu ngay cả trong phân bố thuần túy như phân bố

Gauss thì giá trị LOF sẽ thay đổi rất lớn đối với nhiều trường họp phức tạp. Trong hình 3.8 mô tả tập dữ liệu trong không gian 2 chiều, có 3 vùng, vùng Si bao gồm 10 đối tượng, S2bao gồm 35 đối tượng, s3 bao gồm 500 đối tượng, ở phía bên phải trình bày các

biểu đồ cho một đối tượng trong mỗi vùng, các biểu đồ này cho thấy các đồ thị của LOF thông qua Minpts nằm trong miền từ 10 tới 50. Trong khi LOF của đối tượng s3 rất ổn định quanh giá trị 1 thì các giá trị LOF của các đối tượng trong Si và s2 lại thay đổi rất lớn.

Một phần của tài liệu Nghiên cứu các phần tử ngoại lai luận văn thạc sĩ máy tính (Trang 58 - 59)

Tải bản đầy đủ (DOCX)

(89 trang)
w