Phõn lớp với dữ liệu đa trị

Một phần của tài liệu Tìm hiểu các thuật toán MMC và MMDT trên bảng quyết định đa trị (Trang 30)

Khú khăn lớn nhất trong việc xử lý dữ liệu đa trị bằng phương phỏp truyền thống là:

- Thứ nhất: Dữ liệu đa trị cú một hoặc nhiều nhón tại mỗi nỳt, trong khi dữ liệu đơn trị thỡ mỗi nỳt con chỉ cú một nhón duy nhất.

- Thứ hai: Trong việc phõn loại một đối tượng, một đối tượng với thuộc tớnh đa trị thỡ cú thể tỏch thành nhiều nhỏnh, trong khi phõn loại đối tượng với thuộc tớnh đơn trị chỉ đi ra 1 nhỏnh.

Để giải quyết vấn đề phõn lớp với bảng quyết định đa trị, nhúm ba nhà khoa học:

Yen-Liang Chen, Chang-Ling Hsu, Shih-Chieh Chou đó đề xuất thuật toỏn MMC (Multi-valued and Multi-labeled Classifier). MMC khỏc với những phương phỏp phõn lớp truyền thống trong một số chức năng chớnh bao gồm (1) phỏt triển một cõy quyết định, (2) chỉ định nhón đại diện cho một nỳt lỏ và (3) thực hiện một dự đoỏn cho một dữ liệu mới. Trong quỏ trỡnh phỏt triển một cõy, MMC đề xuất một giải phỏp mới cú tờn trọng số tương tự (weighted similarity) để lựa chọn thuộc tớnh phõn nhỏnh tốt nhất. Gỏn nhón, MMC chọn những nỳt liờn quan với số đủ lớn để đại diện cho một lỏ. Để thực hiện một dự đoỏn cho một dữ liệu mới, MMC vẫn duyệt cõy, và khi duyệt đến một số nỳt lỏ cho cỏc dũng với thuộc tớnh đa trị, MMC sẽ kết hợp tất cả cỏc nhón của cỏc nỳt lỏ lại và đú cũng là kết quả dự đoỏn.

Cú một thuật toỏn phõn lớp với dữ liệu đa trị nhằm cải thiện tớnh chớnh xỏc của MMC. Hai nhà khoa học Shihchieh Chou, Chang-Ling Hsu đó thiết kế thuật toỏn mới đú là MMDT (Multi-valued and Multi-labeled Decision Tree).

Một số hàm chớnh được sử dụng trong cỏc thuật toỏn trờn:

(1) Chọn thuộc tớnh tỏch lớp.

(2) Kiểm tra nỳt lỏ (Kết thỳc sự phõn tỏch). (3) Xỏc định nhón của một nỳt.

(4) Dự đoỏn nhón của một dữ liệu mới.

Một phần của tài liệu Tìm hiểu các thuật toán MMC và MMDT trên bảng quyết định đa trị (Trang 30)