Thứ bậc trong phép phân lớp

Một phần của tài liệu phân tích cơ cấu khách hàng trong công ty chứng khoán apec và định hướng cho sàn apec bắc ninh (Trang 31 - 33)

3) Các chủ thể tham gia thị trường chứng khoán

2.3.1.Thứ bậc trong phép phân lớp

a. Thứ bậc của các lớp trong tập hợp cá thể cho trước Một họ H các lớp của tập E là một họ các thứ bậc nếu:

- Cho mọi A, B thuộc H ta có AB∈{A,B,φ}

Người ta có thể thiết lập các chỉ số (i) đối với các lớp, cho mỗi phép chia lớp có thứ bậc theo cách sau: Nếu A là một lớp con của B thì i(A) <= i(B), chỉ số I như vậy sẽ tăng theo tính không thuần nhất trong lớp. Chẳng hạn với kết quả chia lớp ở trên có thể thiết lập chỉ số chia lớp cho các tập con của tập đang xét như sau:

Người ta cũng xác định chỉ số kết hợp của hai lớplà chỉ số của lớp hợp thành chẳng hạn: i(a2,a4,a1) = δ((a2,a4),a1) , trong đó δ((a2,a4),a1) là chỉ số kết hợp của hai nhóm (a2,a4) và a1.

Một phép phân lớp phù hợp với H là phép phân lớp mà các lớp là các thành phần của H. Nói cách khác phép phân lớp này có thể nhận được nhờ việc cắt cây phân lớp theo chiều ngang va tập hợp các phần của nó. Chẳng hạn, đường thẳng g tạo ra các lớp sau đây gồm các thành phần cảu H:

( ) ( )

{ a2,a4 , a3,a1 ,a5}

Một thứ tự H sẽ được gọi là thứ tự phân tầng nếu a được ghép với b trước c được ghép với d theo một thứ tự bao hàm, hay nói cách khác là chúng ta xem xét việc ghép lớp bắt đầu từ cặp hai phần tử bất kì khác nhau. Một cách phân lớp có chỉ số nếu nó là một họ H có thứ bậc và tồn tại một cách lập các chỉ số (i) tăng. Có nghĩa là nếu A chứa B thì i(A) <= i(B). Như vậy có thể nói rằng một cách phân lớp có chỉ số tương ứng một phép phân lớp có thứ tự phân tầng.

Vấn đề đặt ra với mỗi thứ bậc H là nếu hai cá thể a,b được ghép vào một lớp trước c và d trong thuật toán phân lớp thì thính chất i(a,b) < i(c,d) có thoả mãn hay không. Nếu điều kiện này thoả mãn thì có thể mô tả H một cách tường minh, xác định. Ngược lại sẽ có nhiều H mô tả tương ứng với một phép chia lớp.

Mỗi thứ bậc H tương ứng với một chỉ số với khoảng cách giữa các phần tử của H: d(A,B) do mức độ kết hợp giữa A và B tức là chỉ số của bộ phận nhỏ nhất của H đồng thời chứa cả A và B.

Khoảng cách này có tính chất: d( )a,bSup{d( ) ( )a,c ,d b,c} với mọi a,b,c.

Tính chất này được gọi ;à tính chất siêu Metric.

Thực tế tính chất siêu Metric được thể hiện như sau: trong lần đầu tiên a và b được nhóm với nhau có thể:

- Một là: một điểm c không còn được nhóm với a và cũng như vậy nó không được nhóm với b. Nó có thể được nhóm với (a,b) về sau, theo cách tính trên d(a,c) = d(b,c) và nói chung lớn hơn d(a,b).

- Hai là: điểm c được nhóm với a hoặc b trước (chẳng hạn nhóm với a) Thì d(a,c) lớn hơn d(a,b) nhưng d(b,c) = d(a,b) vì c và a cùng nhóm với b trong một lần.

Có thể thấy rằng khoảng cách dạng này không thông thường và có những điều kiện rất lỏng. Tuy vậy trong thực tế có nhiều trường hợp khoảng cách dạng này cũng được sử dụng trong phân lớp.

Một phần của tài liệu phân tích cơ cấu khách hàng trong công ty chứng khoán apec và định hướng cho sàn apec bắc ninh (Trang 31 - 33)