1. Trang chủ
  2. » Giáo án - Bài giảng

Mối liên quan giữa khái niệm tính bao đóng bắc cầu Min - Max với thuật toán phân cụm theo khoảng cách độ đo

10 71 0

Đang tải... (xem toàn văn)

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 10
Dung lượng 128,93 KB

Nội dung

Trong nội dung của bài viết này, tác giả trình bày một số khái niệm lí thuyết về quan hệ mờ quan trọng; chỉ ra có thể vận dụng tính chất của nó để đề xuất thuật toán phân cụm theo khoảng cách độ đo và tiến hành triển khai tường minh các bước giải thuật phân cụm theo khoảng cách độ đo.

JOURNAL OF SCIENCE OF HNUE Natural Sci., 2014, Vol 59, No 4, pp 96-105 This paper is available online at http://stdb.hnue.edu.vn MỐI LIÊN QUAN GIỮA KHÁI NIỆM TÍNH BAO ĐĨNG BẮC CẦU MIN - MAX VỚI THUẬT TOÁN PHÂN CỤM THEO KHOẢNG CÁCH ĐỘ ĐO Phạm Thanh Huyền Bộ môn Tin học, Khoa Tự nhiên, Trường Cao Đẳng Sư phạm Quảng Ninh Tóm tắt Điểm giống mà hầu hết thuật toán phân cụm theo độ đo khoảng cách (thuật toán k-means, thuật toán c-means) phụ thuộc vào khả chọn số cụm tập tâm cụm ban đầu Điều ảnh hưởng lớn đến hiệu thực thuật tốn, chí dẫn đến kết thu khơng có chất lượng Trong báo này, chúng tơi xây dựng thuật tốn phân cụm dựa vào khoảng cách Min - Max (tạm đặt tên thuật toán phân cụm theo khoảng cách Min - Max) Thuật toán đảm bảo hiệu dựa vào tính chất độ đo khoảng cách Euclide (hoặc khoảng cách Hamming) vận dụng khái niệm tính bao đóng Min - Max Nói cách khác, chúng tơi đề xuất xây dựng thuật toán phân cụm theo khoảng cách Min - Max không phụ thuộc vào việc lựa chọn trước tập tâm cụm mà phụ thuộc vào n đối tượng cần phân cụm việc xác định độ đo đối tượng Từ khóa: Phân cụm, độ đo khoảng cách, bao đóng Min - Max Mở đầu Phân cụm (Clustering) xếp đối tượng theo cụm liệu tự nhiên, tức số lượng tên cụm chưa biết trước Các đối tượng gom cụm cho mức độ tượng tự đối tượng cụm lớn mức độ tương tự đối tượng nằm cụm khác nhỏ Phân cụm sử dụng rộng rãi nhiều ứng dụng nhận dạng mẫu, phân tích liệu, xử lí ảnh, nghiên cứu vũ trụ, nén ảnh phân khúc ảnh Trong thực tế, người ta áp dụng lí thuyết tập mờ phân cụm liệu để giải kiểu đối tượng [2] Phân cụm phân tích đối tượng liệu chưa biết nhãn lớp Nhãn lớp không tồn suốt trình huấn luyện liệu Việc phân cụm xác định nhãn lớp Mỗi cụm tạo thành xem lớp đối tượng có quy tắc tạo Do đó, để giải toán phân cụm việc cuối phải xác định chất nhóm đối tượng tập liệu chưa có nhãn Tuy nhiên, việc giải tốn Ngày nhận bài: 25/4/2014 Ngày nhận đăng: 21/5/2014 Tác giả liên lạc: Phạm Thanh Huyền, địa e-mail: phamthanhhuyen34@gmail.com 96 Mối liên quan khái niệm tính bao đóng bắc cầu Min - Max với thuật tốn cịn vấn đề khó mở, phải giải nhiều vấn đề cách trọn vẹn phù hợp với nhiều dạng liệu khác nhau, đặc biệt liệu hỗn hợp ngày tăng hệ quản trị liệu Một số yếu tố cần quan tâm toán phân cụm nhạy cảm với kiểu liệu khác nhau, có khả mở rộng, hình dạng cụm không ấn định, dễ bị ảnh hưởng kết liệu nhiễu Trong lí thuyết quan hệ mờ, khái niệm bao đóng bắc cầu Min - Max quan hệ bất tương đương [2] nêu để phân cụm liệu Trong [3] có rõ khả ứng dụng khái niệm phân cụm chưa trình bày tường minh bước giải thuật phân cụm Từ ý tưởng muốn có thuật tốn phân cụm khơng phụ thuộc vào việc lựa chọn trước tập tâm cụm (dữ liệu đầu vào) mà phụ thuộc vào n đối tượng cần phân cụm việc xác định độ đo đối tượng đó, chúng tơi đề xuất bổ sung thêm ràng buộc quan hệ bất tương đương, tính chất bao đóng bắc cầu để đảm bảo tính hiệu thuật tốn tường bước thực phân cụm liệu mà [2, 3] chưa trình bày Trong nội dung viết này, chúng tơi trình bày số khái niệm lí thuyết quan hệ mờ quan trọng; vận dụng tính chất để đề xuất thuật tốn phân cụm theo khoảng cách độ đo tiến hành triển khai tường minh bước giải thuật phân cụm theo khoảng cách độ đo Ở đây, không xác định tính dừng giải thuật mà chứng minh đắn xây dựng hệ tiêu chuẩn sở lí thuyết quan hệ mờ Nội dung nghiên cứu 2.1 Cơ sở lí thuyết quan hệ mờ Trong số khái niệm mờ quan trọng phương diện ứng dụng có, quan hệ mờ mở rộng khái niệm quan hệ cổ điển định nghĩa tập liệu Chúng làm bật mối liên kết khơng xác hay có cấp độ phần tử tập hợp giúp cho việc tổ chức, phân loại liệu hiệu [4] * Định nghĩa quan hệ mờ Định nghĩa quan hệ mờ R: Một quan hệ mờ R r tập tham chiếu X1 , X2 , , Xr tập mờ X1 × X2 × × Xr với hàm thuộc µR Nghịch đảo quan hệ mờ R X Y quan hệ mờ R−1 Y X định nghĩa: ∀y ∈ Y, ∀x ∈ X, µR − 1(y, x) = µR (x, y) * Hợp thành mờ Hợp thành hai quan hệ mờ R1 X × Y R2 Y × Z xác định quan hệ mờ R = R1 ◦ R2 X × Z có hàm thuộc định nghĩa bởi: ∀(x, z) ∈ X × Z, µR (x, z) = Maxy [min(µR1 (x, y), µR2 (y, z))] Định nghĩa tương ứng với hợp thành Max - Min Ta cịn có định nghĩa hợp thành Min - Max sau [2]: Hợp thành hai quan hệ mờ R1 X × Y R2 97 Phạm Thanh Huyền Y × Z xác định quan hệ mờ R = R1 ∗ R2 X × Z có hàm thuộc định nghĩa: (x, z) X ì Z, àR (x, z) = Miny [Max(µR 1(x, y), µR 2(y, z))] * Quan hệ hai ngơi mờ • Các tính chất đặc biệt Quan hệ nhị phân mờ R X định nghĩa: - Đối xứng nghiệm đúng: ∀(x, y) ∈ X × X, µR (x, y) = µR (y, x) - Phản xạ nghiệm đúng: ∀x ∈ X, µR (x, x) = - Bắc cầu nghiệm đúng: R ◦ R ⊇ R - Bắc cầu Max - Min ta dùng hợp thành Max - Min quan h m: (x, z) X ì X, àR (x, z) ≥ supy ∈ XMin(µR (x, y), µR (y, z)) - Phản xứng nghiệm đúng: ∀(x, y) ∈ X ì X, (àR (x, y) > 0vàR (y, x) > 0) ⇒ x = y Khi X hữu hạn, ta thấy: + Tính đối xứng quan hệ mờ R tương ứng với tính đối xứng ma trận M (R) + Tính phản xạ quan hệ R tương ứng với đường chéo ma trận M (R) + Tính bắc cầu dễ kiểm tra phần tử ma trận M (R) phải lớn hay phần tử tương ứng ma trận M (R ◦ R) + Tính phản xứng quan hệ R thoả mãn ma trận M (R) tam giác • Các hình thái tính chất bắc cầu Tính chất bắc cầu Max - Min: Cho quan hệ R xác định X × X Lập hợp thành Max - Min R2 = R ◦ R Nếu R2 = R ◦ R ⊇ R quan hệ R gọi có tính bắc cầu Max - Min Tính chất bắc cầu Max - tích: Nếu hợp thành Max - tích thoả mãn điều kiện R.R ⊇ R quan hệ R gọi có tính bắc cầu Max - tích Tính chất bắc cầu Min - Max: Nếu hợp thành Min - Max thoả mãn điều kiện R∗R ⊂ R quan hệ R gọi có tính chất bắc cầu Min - Max Quan hệ mờ có tính chất tập mờ Ngồi ra, từ tính hợp thành Max - Min Min -Max, ta thấy số tính chất quan hệ mờ Chẳng hạn, tính chất kết hợp quan hệ mờ: Cho quan hệ mờ R1 , R2 , R3 , đó: (R1 ◦ R2 ) ◦ R3 = R1 ◦ (R2 ◦ R3 ) Tính chất đối ngẫu quan hệ mờ nói lên mối quan hệ phép hợp thành Max - Min phép hợp thành Min - Max thể sau [3]: R ◦R = R ∗ R Đây hai tính chất có tác dụng làm giảm độ phức tạp tính tốn khối lượng thơng tin cần lưu trữ q trình phân lớp, phân cụm liệu 98 Mối liên quan khái niệm tính bao đóng bắc cầu Min - Max với thuật tốn • Bao đóng bắc cầu quan hệ hai ngơi mờ Định nghĩa bao đóng bắc cầu Max - Min [3]: Cho quan hệ mờ R Quan hệ dạng: ∧ R = R ∪ R2 ∪ R3 ∪ , R2 = R ◦ R, R3 = R2◦ R gọi bao đóng bắc cầu Max - Min quan hệ R ∧ Định lí: Bao đóng bắc cầu Max - Min R có tính chất bắc cầu Max - Min: ∧◦ ∧ ∧ RR ⊇ R Định lí chứng minh [3] Ngoài ra, với hệ quy chiếu hữu hạn, card X = n, tìm k≤ n cho: ∧ ′′ R = R ∪ R2 ∪ R3 ∪ Rk Định nghĩa bao đóng bắc cầu Min - Max: Cho quan hệ mờ R Quan hệ dạng: ∨ R = R ∩ (R ∗ R) ∩ (R ∗ R ∗ R) ∩ gọi bao đóng bắc cầu Min - Max quan hệ R * Quan hệ tương đương quan hệ bất tương đương mờ - Quan hệ tương đương mờ Một quan hệ tương đương quan hệ mờ đối xứng, phản xạ bắc cầu Max Min [5] Theo định nghĩa, quan hệ tương đương mờ R tập tích X × X phải có tính chất sau: Tính phản xạ: R(x, x) = 1, với x ∈ X; Tính đối xứng: R(x, y) = R(y, x), với cặp (x, y) ∈ X × X; Tính bắc cầu Max - Min: R ◦ R ⊇ R - Quan hệ bất tương đương mờ Một quan hệ bất tương đương quan hệ mờ có tính chất đối xứng, phản - phản xạ bắc cầu Min - Max [4] Một quan hệ bất tương đương mờ R tập tích X × X phải có tính chất sau: Tính phản - phản xạ: R(x, x) = 0, ∀x ∈ X; Tính đối xứng: R(x, y) = R(y, x), với cặp (x, y) ∈ X × X; Tính bắc cầu Min - Max: R ∗ R ⊇ R Định lí: Nếu R quan hệ tương đương mờ R quan hệ bất tương đương mờ ngược lại: R ◦ R ⊇ R ⇔ R ∗ R ⊇ R Định lí chứng minh [3] 2.2 Thuật toán phân cụm theo độ đo Min - Max 2.2.1 Thuật toán phân cụm Min - Max Yếu tố thúc đẩy việc đề xuất ý tưởng xây dựng thuật toán phân cụm Min - Max: - Dựa tính chất khoảng cách Euclide (khoảng cách Hamming), ta vận dụng để biến đổi khoảng cách phần liệu mờ Đối với liệu xác (khơng có tính mờ), thông qua chuyển đổi dạng liệu mờ, ta hồn tồn áp dụng tính chất - Tính chất bao đóng bắc cầu Min - Max cho phép xác định tính hữu hạn cho vịng lặp Thuật toán phân cụm Min - Max đề xuất không phụ thuộc vào việc lựa chọn trước tập tâm cụm (hay thuật toán tạm gọi hệ tiêu chuẩn) đầu vào mà phụ 99 Phạm Thanh Huyền thuộc vào n đối tượng cần phân cụm việc xác định độ đo đối tượng Đầu vào: n đối tượng với m thuộc tính Xi = xi1 , xi2 , , xim (0 ≤ i ≤ n) Đầu ra: Các phân cụm Các bước tiến hành thuật toán: Bước 1: Mỗi đối tượng tham gia phân cụm đánh giá đầy đủ thuộc tính số mờ biểu thị hàm thuộc (do chuyên gia đánh giá) Bước 2: Tính khoảng cách mờ đối tượng (từ cơng thức tính khoảng cách Euclide tương đối khoảng cách Hamming tương đối) Ta quan hệ bất tương đương mờ D ∨ Bước 3: Tính bao đóng bắc cầu Min - Max R quan hệ mờ (xác định bước 2) Việc tính bao đóng dừng tìm k(k ≤ n) thoả mãn ma trận quan hệ Dk = Dk+1 ∨ Bước 4: Xác định hệ tiêu chuẩn từ giá trị khoảng cách thu R Phân ∨ tích R thành cụm dựa tiêu chuẩn 2.2.2 Áp dụng tính chất bao đóng bắc cầu giải thuật toán phân cụm Từ việc nghiên cứu hình thái tính chất bắc cầu bao đóng bắc cầu quan hệ hai ngơi mờ, ta có nhận xét sau: Mệnh đề 2.2.1 Cho R quan hệ mờ phép hợp thành Max - Min phép hợp thành Min - Max có tính chất: Rk◦ R = R ◦ Rk (a) k k R ∗R=R∗R (b) Chứng minh Để chứng minh ta cần sử dụng tính chất sau: Tính chất kết hợp: (R1 ◦ R2 ) ◦ R3 = R1 ◦ (R2 ◦ R3 ) ∧ ∨ Tính chất đối ngẫu: R ◦ R = R ∗ R R = R Bằng phương pháp quy nạp, ta chứng minh (a) (b) nhận xét Với k = 1, ta có R ◦ R = R2 (đã nêu nội dung 1.4.2) nên (a) Giả sử (a) với k = n, tức Rn◦ R = R ◦ Rn Khi đó, ta cần chứng minh (a) với k = n + Thật vậy, Rn+1◦ R = (R ◦ Rn ) ◦ R = R ◦ (Rn◦ R) = R ◦ Rn+1 (do áp dụng tính chất kết hợp quan hệ mờ) Như (a) đúng, ta gọi tính chất “giao hoán” phép hợp thành Max - Min quan hệ mờ Từ tính chất đối ngẫu De Morgan quan hệ hợp thành Max - Min (hợp thành Min - Max): Rk ◦ R = Rk ∗ R R ◦ Rk = R ∗ Rk Khi đó, R quan hệ mờ có Rk ∗ R = R ∗ Rk hay ta chứng minh (b) k với R ∗ R = R ∗ Rk Ta gọi R có tính chất giao hoán ✷ Mệnh đề 2.2.2 Với R quan hệ mờ có tính chất đối xứng giá trị 100 Mối liên quan khái niệm tính bao đóng bắc cầu Min - Max với thuật tốn k ≥ 1, Rk có tính chất đối xứng Chứng minh Khơng tính chất tổng qt, R quan hệ mờ có tính chất đối xứng Khi đó, giá trị phần tử ma trận R, Rk Rk+1 là: R = [aij ], Rk = [bij ]vRk+1 = [cj ] với i, j = 1, 2, 3, , n; n : số đối tượng Dễ thấy với k = Rk = R, Rk có tính chất đối xứng Ta cần chứng minh: Rk+1 = R2 = R ◦ R có tính chất đối xứng Thật vậy, với i, j, h = 1, 2, , n ta có: cij = Max(Min(aih , bhj ))vcji = Max(Min(ajh , bhi )) Trong trường hợp này, ta cịn viết: cij = Max(Min(aih , ahj ))vcji = Max(Min(ajh , ahi )) Do R đối xứng nên ta ln có aih = ahi vàajh = ahj (∀i, j, h = 1, 2, , n) Suy ra: cij = cji , ∀i, j = 1, 2, , n Giả sử Rk với k = m, ta cần chứng minh k = m + điều Thật vậy, theo giả sử ta có Rk có tính đối xứng hay bij = bji ∀i, j Khi đó: cij = Max(Min(aih , bhj ))vàcji = Max(Min(ajh , bhi )) Từ tính chất giao hốn chứng minh nhận xét ta có: n n cij = Max(Min(bih , ahj )) = Max(Min(ahj , bih )) h=1 h=1 n n mà ahj = ajh bih = bhi nên cij = Max(Min(ahj , bih )) = Max(Min(ajh , bhi )) = cji h=1 h=1 Như vậy, hợp thành Max - Min quan hệ mờ Rk có tính chất đối xứng Tương tự chứng minh ta có kết với hợp thành Min - Max quan hệ mờ có tính chất đối xứng ✷ Mệnh đề 2.2.3 Với R quan hệ mờ có tính chất phản xạ, hợp thành Max Min R quan hệ Rk Rk+1 thoả mãn: Rk ⊇ Rk+1 (c) Với phép hợp thành Min - Max quan hệ hai ngơi R có tính chất phản - phản xạ thì: Rk+1 ⊇ Rk (d) n Chứng minh Ta có: cij = Max(Min(aih , bhj )), để (c) ta cần chứng minh: h=1 cij ≥ bij ≥ aij ∀i, j = 1, , n Thật vậy, với k = aij = bji , đó: n (f) n cij = Max(Min(aih , bhj )) = Max(Min(aih , ahj )) h=1 h=1 với h = i aii = (theo giả thiết) nên aij đưa vào tập hợp để xét lấy Max Do vậy, cij ≥ aij cij = i = j n Với k = 2, ta có: cij = Max(Min(aih , bhj )) h=1 Khi với h = i ta ln có bij đưa vào tập hợp để xét lấy Max cho cij Do 101 Phạm Thanh Huyền vậy, cij ≥ bij Bằng phương pháp quy nạp, dễ dàng rút kết luận (f) ✷ Vậy, ma trận quan hệ tạo thành từ việc tính hợp thành Max - Min quan hệ có tính chất phản xạ quan hệ có tính chất phản xạ giá trị phần tử quan hệ không nhỏ phần tử tương ứng ma trận tham gia phép lấy hợp thành (tức Rk ⊇ Rk+1 ) Chứng minh tương tự, ta có kết luận quan hệ R có tính phản - phản xạ (aii = 0) hợp thành Min - Max quan hệ quan hệ có tính phản - phản xạ, tức có: n cij = Min(Max(aih , bhj )) thoả mãn cij ≤ bij ≤ aij cii = h=1 (hay Rk+1 ⊇ Rk ) Các kết luận có vai trị hữu ích q trình giải thuật tốn nêu Nhờ áp dụng kết luận thực cài đặt thuật tốn, ta có kết khối lượng tính tốn giảm việc lưu trữ giá trị trung gian Ri (i = 1, 2, , k) loại bỏ số đối tượng tham gia n điểm dừng k lớn (k ≤ n) Cụ thể: + Quá trình tính tốn giá trị phần tử ma trận quan hệ: Vì ma trận khoảng cách, hay ma trận quan hệ tính từ hợp thành Min - Max cấp luỹ thừa quan hệ mờ có tính chất phản - phản xạ (hoặc ma trận quan hệ tính từ hợp thành Max Min cấp luỹ thừa quan hệ có tính chất phản xạ) có tính đối xứng, nên tính giá trị phần tử cij ta cần tính toán trường hợp i < j i = j(cii = 0) Cịn trường hợp i > j cij = cji + Quá trình thực tìm bao đóng bắc cầu quan hệ mờ: Với R quan hệ mờ có tính phản - phản xạ, hợp thành Min - Max ln có kết Rk+1 ⊇ Rk Như vậy, tồn điểm dừng k thoả mãn Rk+1 = Rk bao đóng bắc cầu Min - Max ∨ quan hệ R Rk Như vậy, ta có kết luận giải thuật tốn phân cụm nêu trên: - Thuật tốn tìm bao đóng bắc cầu ln có tính dừng, với cấp luỹ thừa thứ k(1 ≤ k ≤ n) thoả mãn Rk = Rk+1 - Có thể loại bỏ giá trị trung gian q trình tìm bao đóng bắc cầu Min Max Ta cần lưu trữ giá trị ma trận quan hệ R, Rk Rk+1 Độ phức tạp thuật toán phân cụm dựa khoảng cách Min - Max O(n2 k) Trong đó, n số đối tượng tham gia, k cấp lũy thừa tìm bao đóng bắc cầu (hay k số vịng lặp tìm bao đóng bắc cầu) Như vậy, giải toán phân lớp, phân cụm đối tượng, dựa vào tính chất quan hệ mờ, ta xây dựng thuật tốn phân cụm theo khoảng cách để thu cụm đối tượng mong muốn Việc áp dụng hợp lí quan hệ bất tương đương mờ, bao đóng bắc cầu đảm bảo đặc tính dừng giảm bớt lượng lớn giá trị cần tính tốn lưu trữ Điểm khác biệt thuật toán thuật toán phân cụm theo độ đo khác (K - mean, K - medoid, Fuzzy C - mean [1]) việc xác định cụm không cần 102 Mối liên quan khái niệm tính bao đóng bắc cầu Min - Max với thuật toán xác định tâm ban đầu Thuật toán đề xuất khắc phục nhược điểm khơng cần lặp thử nhiều lần tìm cụm tối ưu theo trung tâm cụm, loại trừ phần tử nhiễu 2.2.3 Phân tích quan hệ mờ dựa giá trị khoảng cách Cho tập liệu với n đối tượng tương ứng có m thuộc tính, ta ln xây dựng quan hệ hai mờ tương ứng Vấn đề đặt cần tìm cách phân cụm hay gom cụm liệu theo khoảng cách (tức dựa vào ma trận quan hệ xây dựng từ khái niệm khoảng cách, ta cần tìm cụm phù hợp) [3] Khái niệm khoảng cách Min - Max, tương ứng với quan hệ bất tương đương thích hợp cho tốn Khi phân tích quan hệ mờ tương ứng, khái niệm thông thường thu có tính chất bảo tồn tính bắc cầu khoảng cách Min - Max Ví dụ 1: Cho danh sách gồm đối tượng sinh viên (n = 7) với thuộc tính bảng sau: Tên ĐT Văn hố Tâm lí CT ĐĐội Tập giảng VD01 9,3 8,0 9,7 9,0 VD02 6,0 6,0 6,0 7,0 VD03 5,7 5,8 5,0 5,0 VD04 8,9 9,4 8,6 8,5 VD05 8,0 5,0 5,8 6,5 VD06 5,0 6,8 8,5 7,0 VD07 7,5 8,0 5,5 6,8 → Sử dụng khoảng cách Hamming tương đối khơng trọng số: Duv = duv ta có ma trận khoảng cách tương ứng: D VD01 VD02 VD03 VD04 VD05 VD06 VD07 VD01 0,000 0,109 0,109 0,049 0,109 0,109 0,109 VD02 0,109 0,000 0,050 0,109 0,053 0,061 0,059 VD03 0,109 0,050 0,000 0,109 0,053 0,061 0,059 VD04 0,049 0,109 0,109 0,000 0,109 0,109 0,109 VD05 0,109 0,053 0,053 0,109 0,000 0,061 0,059 VD06 0,109 0,061 0,061 0,109 0,061 0,000 0,061 VD07 0,109 0,059 0,059 0,109 0,059 0,061 0,000 → Thực tính bao đóng bắc cầu Min - Max D: ∨ D = D ∩ (D ∗ D) ∩ (D ∗ D ∗ D) ∩ 103 Phạm Thanh Huyền ∨ Ta tìm k = thoả mãn k < để D3 = D4 Khi kết D cần tìm là: ∨ D VD01 VD01 VD02 VD03 VD04 VD05 VD06 VD07 0,000 0,109 0,109 0,049 0,109 0,109 0,109 VD02 0,109 0,000 0,05 0,109 0,053 0,061 0,059 VD03 0,109 0,050 0,000 0,109 0,053 0,061 0,059 VD04 0,049 0,109 0,109 0,000 0,109 0,109 0,109 VD05 0,109 0,053 0,053 0,109 0,000 0,061 0,059 VD06 0,109 0,061 0,061 0,109 0,061 0,000 0,061 VD07 0,109 0,059 0,059 0,109 0,059 0,061 0,000 → Xác định hệ tiêu chuẩn: T C = {0; 0, 049; 0, 050; 0, 053; 0, 059; 0, 061; 0, 109} ∨ → Phân tích quan hệ D thu thành quan hệ thông thường dựa giá trị khoảng cách tương ứng với giá trị tiêu chuẩn xác định: - Với tiêu chuẩn TC1 = 0: Quan hệ thông thường cho ta cụm riêng biệt là: {V D01}, {V D02}, {V D03}, {V D04}, {V D05}, {V D06}, {V D07} - Với tiêu chuẩn TC2 = 0, 049: Ta cụm là: {V D01, V D04}, {V D02}, {V D03}, {V D05}, {V D06}v{V D07} - Với tiêu chuẩn TC3 = 0, 050: Ta cụm là: {V D01, V D04}, {V D02, V D03}, {V D05}, {V D06}v{V D07} - Với tiêu chuẩn TC4 = 0, 053: Ta cụm là: {V D01, V D04}, {V D02, V D03, V D05}, {V D06}v{V D07} - Với tiêu chuẩn TC5 = 0, 059: Ta cụm là: {V D01, V D04}, {V D02, V D03, V D05, V D07}v{V D06} - Với tiêu chuẩn TC6 = 0, 061: Ta cụm là: {V D01, V D04}, {V D02, V D03, V D05, V D06, V D07} - Với tiêu chuẩn TC7 = 0, 109: Ta cụm là: {V D01, V D02, V D03, V D04, V D05, V D06, V D07} Sự phân cụm hay gom cụm tùy thuộc vào giá trị khoảng cách đề ta coi tiêu chuẩn để xét đối tượng có thuộc cụm hay không Với tiêu chuẩn cần xét thời điểm, đối tượng thuộc vào cụm cụm phân Điều không ngược lại với khái niệm toán phân cụm Bởi thực tế thường gặp khái niệm “khá”, “tương đối khá”, “rất khá”, Tại tiêu chuẩn xét, sinh viên A đánh giá sinh viên có lực sư phạm “khá”, song mức tiêu chuẩn khác sinh viên A lại đánh giá “rất khá” Trong ví dụ trên, theo tiêu chuẩn TC3 , đối tượng (sinh viên) VD05 phân độc lập cụm, VD02 VD03 104 Mối liên quan khái niệm tính bao đóng bắc cầu Min - Max với thuật tốn phân cụm Tiêu chuẩn TC4 , đối tượng phân vào cụm Đây sinh viên có lực sư phạm thuộc mức trung bình (mặc dù kết rèn luyện văn hóa có chênh lệch) Như vậy, phát tìm cụm cho đối tượng, theo thuật tốn nêu xét theo bước Việc sử dụng khái niệm độ đo khoảng cách số khái niệm liên quan có lí thuyết tập mờ (như hợp thành Min - Max, bao đóng bắc cầu) hỗ trợ thiết thực việc nhanh chóng phát cụm từ quan hệ xác định ban đầu Kết luận Trong báo, nghiên cứu lí thuyết quan hệ mờ, đó, đặc biệt ý tới khái niệm tính chất bao đóng Min - Max Dựa vào tính chất này, chúng tơi đề xuất cách xây dựng thuật tốn phân cụm dựa khoảng cách độ đo Min - Max Thuật tốn giảm thiểu khối lượng tính tốn lớn tính quan hệ dựa phương pháp tính khoảng cách tìm bao đóng bắc cầu cách loại bỏ số bước lưu trữ trung gian từ vận dụng số tính chất tính chất quan hệ mờ bất tương đương, tính chất suy từ phép hợp thành Hướng nghiên cứu phát triển khả phân cụm, khả gom cụm đối tượng mờ sở liệu hướng đối tượng sử dụng khoảng cách TÀI LIỆU THAM KHẢO [1] [2] [3] [4] [5] [6] Trần Thị Gia, 2008 Nghiên cứu, so sánh tập thô, tập mờ phương pháp biểu diễn tập thô theo hàm thuộc thô Luận văn thạc sỹ kỹ thuật, Học viện kỹ thuật Quân sự, Hà Nội Nguyễn Cát Hồ, 2002 Lí thuyết tập mờ cơng nghệ tính tốn mềm Nxb Khoa học Kỹ thuật, Hà Nội Nguyễn Hồng Phương, 1995 Tích hợp đa văn hóa đơng tây cho chiến lược giáo dục tương lai Nxb Giáo dục, Hà Nội B.Bouchon, Meunier, Hồ Thuần, Đặng Thanh Hà, 2007 Logic mờ ứng dụng Nxb Đại học Quốc gia Hà Nội J.C.Bezdek, 1981 Pattern Recognition with fuzzy Objective function algorithms New York, Plenum http://en.wikipedia.org/wiki/fuzzy_set ABSTRACT The relationship between the concept of transitive closure Min - Max with clustering algorithm using distance measures The similarity of most clustering algorithms using distance measures (k-means algorithm, c-means algorithm) depend on the ability to choose the number of clusters and set of original cluster center This greatly affects the efficiency of the algorithm implementation, even leads to poor results In this paper, we build a clustering algorithm based on distance Min - Max This algorithm is effectively guaranteed based on the nature of the Euclide distance metric (or Hamming distance) and apply the concept of closures Min - Max In other words, we proposed clustering algorithm Min - Max does not depend on the choice of the earlier set of cluster center which depend only on n object clustering and determining the measure between those objects 105 ... trình phân lớp, phân cụm liệu 98 Mối liên quan khái niệm tính bao đóng bắc cầu Min - Max với thuật tốn • Bao đóng bắc cầu quan hệ hai ngơi mờ Định nghĩa bao đóng bắc cầu Max - Min [3]: Cho quan. .. minh [3] 2.2 Thuật toán phân cụm theo độ đo Min - Max 2.2.1 Thuật toán phân cụm Min - Max Yếu tố thúc đẩy việc đề xuất ý tưởng xây dựng thuật toán phân cụm Min - Max: - Dựa tính chất khoảng cách. .. thái tính chất bắc cầu Tính chất bắc cầu Max - Min: Cho quan hệ R xác định X × X Lập hợp thành Max - Min R2 = R ◦ R Nếu R2 = R ◦ R ⊇ R quan hệ R gọi có tính bắc cầu Max - Min Tính chất bắc cầu Max

Ngày đăng: 07/11/2020, 11:07

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w