Chuyển cây quyết định sang dạng luật dễ hiểu

Một phần của tài liệu Khai thác và phân tích dữ liệu ngân hàng nhằm phát hiện rủi ro và hỗ trợ ra quyết định trong quản trị (Trang 42)

3. Phân lớp sử dụng cây quyết định

3.7Chuyển cây quyết định sang dạng luật dễ hiểu

Thông thường, cây quyết định sẽ được chuyển về dạng các luật để thuận tiện cho việc cài đặt và sử dụng. Tuy nhiên việc tạo ra tập luật từ tập dữ liệu lớn và nhiều giá trị sai là vô cùng lớn. Vì vậy trong quá trình chuyển đổi từ cây quyết định sang luật cần phải cắt tỉa để thu được tập luật tối ưu

Việc chuyển đổi từ cây sang tập luật được thực hiện qua 4 bước Cắt tỉa:

Luật khởi tạo ban đầu là đường đi từ gốc đến lá của cây quyết định. Một cây quyết định có một lá thì tương ứng tập luật sản xuất sẽ có một luật khởi tạo. Từng điều kiện trong luật được xem xét và loại bỏ nếu không ảnh hưởng tới độ chính xác của luật đó. Sau

đó, các luật đã cắt tỉa được thêm vào tập luật trung gian nếu nó không trùng với những luật đã có.

•Lựa chọn

Các luật đã cắt tỉa được nhóm lại theo giá trị phân lớp, tạo nên các tập con chứa các luật theo lớp. Sẽ có k tập luật con nếu tập training có k giá trị phân lớp. Từng tập con trên được xem xét để chọn ra một tập con các luật mà tối ưu hóa độ chính xác dự đoán của lớp gắn với tập luật đó.

•Sắp xếp

Sắp xếp K tập luật đã tạo ra từ trên bước theo tần số lỗi. Lớp mặc định được tạo ra bằng cách xác định các case trong tập training không chứa trong các luật hiện tại và chọn lớp phổ biến nhất trong các case đó làm lớp mặc định.

•Ước lượng, đánh giá:

Tập luật được đem ước lượng lại trên toàn bộ tập training, nhằm mục đích xác định xem liệu có luật nào làm giảm độ chính xác của sự phân lớp. Nếu có, luật đó bị loại bỏ và quá trình ước lượng được lặp cho đến khi không thể cải tiến thêm.

Một phần của tài liệu Khai thác và phân tích dữ liệu ngân hàng nhằm phát hiện rủi ro và hỗ trợ ra quyết định trong quản trị (Trang 42)