Một số ký hiệu sử dụng trong MMC và MMDT

Một phần của tài liệu Tìm hiểu các thuật toán MMC và MMDT trên bảng quyết định đa trị (Trang 30 - 32)

Cỏc kớ hiệu của MMC và MMDT cho vấn đề phõn lớp dữ liệu đa trị được quy định như sau:

(a) D là tập dữ liệu huấn luyện và |D| là số lượng bản ghi.

(b) C là tập cỏc nhón {Ci| i=1..k, Ci là một nhón}. Số lượng nhón trong C được biết trước.

(c) A kớ hiệu cho tập thuộc tớnh. A={Ai|Ai là thuộc tớnh bất kỳ của D, i=1..n}. |A| là ký hiệu số lượng thuộc tớnh (gồm n thuộc tớnh)

(d) L biểu diễn một tập hợp cỏc nhón, nhón này cú thể là đơn trị hoặc đa trị.

L= {Lj|Lj 2C}.

(e) T(V,E) biểu thị một cõy quyết định bắt nguồn từ gốc và cú nhiều cấp, trong đú V là tập hợp cỏc nỳt và E là tập hợp cỏc nhỏnh. Mỗi nỳt của T chứa thuộc tớnh số hoặc phi số. Mỗi nỳt lỏ của T chứa nhiều nhón thuộc L.

(f) “Nhiều nhón” được biểu diễn như một tập nhón. Lj kớ hiệu một nhón được thiết lập để đại diện cho một tập hợp cỏc nhón trong C.

Vỡ vậy mỗi bản ghi trong D cú thể được biểu diễn (A,Lj), trong đú A là tập cỏc thuộc tớnh Ai, chỳ ý rằng mỗi thuộc tớnh Ai cú thể được ỏnh xạ đến 1 giỏ trị duy nhất hoặc nhiều giỏ trị, và cú thể phi số hoặc số. Mục tiờu của chỳng tụi là xõy dựng một cõy phõn loại quyết định đú cú thể dự đoỏn giỏ trị của Lj khi giỏ trị của A được cho.

(g) Để giải quyết cỏc thuộc tớnh số, chỳng tụi sử dụng một tham số do người dựng tự định nghĩa (gọi là tham số ub) để thiết lập trờn ràng buộc về số nhỏnh mà một nỳt của thuộc tớnh số cho ra. Ngoài ra, khi tỏch cỏc nhỏnh từ một nỳt, chỳng tụi ỏp dụng định nghĩa của một khoảng thời gian trong IC [11]: “Mỗi nhỏnh tương ứng với một khoảng giỏ trị cho thuộc tớnh số và tương ứng với một giỏ trị duy nhất cho thuộc tớnh phi số”.

Sự phỏt triển của MMC chủ yếu dựa vào độ đo tương tự trong nhiều nhón, trong khi sự phỏt triển của MMDT chủ yếu dựa trờn cả hai là độ đo tương tự và tỉ lệ tương tự trong nhiều nhón. Sự phỏt triển của MMDT dựa trờn MMC, vỡ vậy, chỳng tụi sẽ lần lượt mụ tả cỏc thuật toỏn MMC và MMDT trong cỏc mục tiếp theo.

Một phần của tài liệu Tìm hiểu các thuật toán MMC và MMDT trên bảng quyết định đa trị (Trang 30 - 32)