Khai phỏ luật kết hợp định lƣợng

Một phần của tài liệu Sử dụng luật kết hợp khai phá dữ liệu tai nạn giao thông.PDF (Trang 44)

6. Cỏc thuật toỏn khai phỏ dữ liệu nhờ luật kết hợp:

6.2. Khai phỏ luật kết hợp định lƣợng

Khai phỏ luật kết hợp định lƣợng là quỏ trỡnh khai phỏ cỏc luật kết hợp cho cỏc cơ sở dữ liệu với cỏc thuộc tớnh cú giỏ trị khụng đơn giản là giỏ trị nhị phõn. Đối với cỏc luật kết hợp định lƣợng X  Y, X và Y cú thể là sự kết hợp của cỏc giỏ trị nhị phõn, phõn loại, khoảng số.

Phỏt hiện luật kết hợp định lƣợng gồm 2 kỹ thuật chớnh:

- Ánh xạ cỏc thuộc tớnh nhận giỏ trị trong khoảng nào đú thành cỏc thuộc tớnh nhị phõn.

- Chuyển thuộc tớnh giỏ trị số thành một thuột tớnh

Ta xột vớ dụ về dữ liệu điều tra dõn số trong bảng 2.9 sau:

Bảng 2.8: Dữ liệu tai nạn giao thụng

ID Tuổi Giới tớnh Nguyờn nhõn Tỡnh trạng Thiệt hại

1 17 Nam Vƣợt ẩu Góy tay 1.000.000

2 28 Nữ Phúng nhanh Góy chõn 1.500.000

3 37 Nam Say bia rƣợu Chấn thƣơng đầu 10.000.000

Giải thớch thụng tin:

- ID: Định danh cho mỗi tỏc vụ. Khi khai phỏp ta khụng quan tõm tới trƣờng này. - Tuổi: Thuộc tớnh này nhận nhiều giỏ trị khỏc nhau, nú khụng phải là giỏ trị nhị phõn. Để khai phỏ dữ liệu dạng này ta ỏnh xạ thuộc tớnh nhận giỏ trị trong khoảng nào đú thành cỏc thuộc tớnh nhị phõn. Vớ dụ ta ỏnh xạ tuổi từ 0-21 thành "rất trẻ"; từ 22-35 thành "trẻ"; 36-55 thành "trung niờn".

- Giới tớnh: Nhận 1 trong 2 giỏ trị: "nam" và "nữ", do vậy ta cú thể chuyển thuộc tớnh này thành 2 thuộc tớnh.

- Nguyờn nhõn: Tƣơng tự nhƣ thuộc tớnh giới tớnh, ta chuyển thành 2 thuộc tớnh "Vƣợt ẩu", "Phúng nhanh” và “Say bia rƣợu”.

- Tỡnh trạng: ỏnh xạ thuộc tớnh này thành "Góy tay”, “Góy chõn”, "Chấn thƣơng đầu”. - Thiệt hại: ỏnh xạ thành cỏc khoảng: "ớt nghiờm trọng", "nghiờm trọng” và “rất nghiờm trọng”.

Việc ỏnh xạ phải hoàn toàn rừ ràng đối với ngƣời khai phỏ dữ liệu. Với cỏc ỏnh xạ trờn dữ liệu của vớ dụ trở thành cơ sở dữ liệu với 13 thuộc tớnh sau:

1. Rất trẻ 8. Góy tay

2. Trẻ 9. Góy chõn

3. Trung niờn 10. Chấn thƣơng đầu

4. Nam 11. Ít nghiờm trọng

5. Nữ 12. Nghiờm trọng

6. Phúng nhanh 13. Rất nghiờm trọng 7. Vƣợt ẩu

Vớ dụ sau khi khai phỏ ta đƣợc cỏc luật kết hợp dạng: tuổi  [0,21] Vƣợt ẩu  Góy tay

Sau khi tất cả cỏc luật đƣợc sinh ra, cỏc luật đƣợc nhúm lại theo từng nhúm giỏ trị. Vớ dụ với cỏc luật sau:

tuổi = 22  Phúng nhanh  Góy chõn tuổi = 35  Phúng nhanh  Góy chõn ta kết hợp thành luật mới:

tuổi  [22,35]  Phúng nhanh  Góy tay

Cỏch này cú nhiều hạn chế khi cú quỏ nhiều giỏ trị cho mỗi thuộc tớnh

Như vậy, khai phỏ luật định lượng gồm 3 bước chớnh sau:

Một phần của tài liệu Sử dụng luật kết hợp khai phá dữ liệu tai nạn giao thông.PDF (Trang 44)

Tải bản đầy đủ (PDF)

(73 trang)