Xác định luật kết hợp trong CBA

Một phần của tài liệu Luật kết hợp âm dương và ứng dụng trong công tác bình ổn giá (Trang 42 - 47)

43

Phần mềm CBA hỗ trợ hai loại khai phá dữ liệu đó là: phân lớp dữ liệu và khai phá luật kết hợp. Tương ứng với hai loại khai phá dữ liệu này thì sẽ có một số loại định dạng dữ liệu đầu vào: bảng dữ liệu quan hệ và dữ liệu ở dưới dạng giao dịch.

Đối với dữ liệu cho việc phân lớp dữ liệu có 2 định dạng:

- Theo bảng: dữ liệu lưu tại hai file, file *.names, file *.data

- Theo giao dịch: dữ liệu lưu ở một file , file *.trc (transaction classification) Đối với dữ liệu cho việc khai phá luật kết hợp cũng có 2 định dạng:

- Theo bảng: dữ liệu lưu tại hai file, file *.names, file *.data

44

Với mục tiêu phát hiện luật kết hợp trong luận văn, nên chúng ta sẽ dùng dữ liệu ở dạng giao dịch (file *.tra).

45

Sau khi xác định được file dữ liệu đầu vào, chúng ta chọn nút “Mine: Single Sup”, trước khi thực hiện phát hiện, hệ thống cho chúng ta thiết lập các tham số: minSup, minConf, …

Giải thích một số tham số chính của phần mềm CBA khi sử dụng thuật toán Apriori sinh luật kết hợp:

MinSupport: Cận dưới của độ hỗ trợ. Min Confidence: Cận dưới của độ tin cậy.

Rule limit: Số các luật tối đa cần tìm được, do quá trình phát hiện luật kết hợp tăng theo cấp số nhân, trong khi bộ nhớ máy tính hạn chế nên cần phải chọn số luật tối đa cần tìm phù hợp với phần cứng máy tính hiện có.

46

Sau khi chạy phần mềm phân tích để sinh ra luật, thì có thể bấm nút View Assoc Rules để phần mềm hiển thị danh sách các luật tìm được. Lưu ý, để đảm bảo tìm được số lượng luật đủ lớn đáp ứng yêu cầu phân tích, trong nhiều trường hợp chúng ta phải chọn độ hỗ trợ và độ tin cậy đủ nhỏ.

.

2.4 Kết luận chương

Như vậy trong chương này luận văn đã phân tích chi tiết bài toán cần phải thực hiện đó là xác định mối quan hệ về sự biến đổi giá của các mặt hàng trong đời sống dân sinh. Đồng thời cũng đã thực hiện thu thập được dữ liệu đầy đủ, chính xác đó là giá của các mặt hàng trong thời gian từ 3/1/2008 đến 31/3/2010, giá của các mặt hàng được thể hiện theo tuần để phục vụ bài toán đặt ra.

Chương 2 này cũng đã giới thiệu cơ bản về phần mềm phát hiện luật kết hợp – phần mềm CBA, làm công cụ cho quá trình phát hiện môi quan hệ về sự biến đổi giá cả của các mặt hàng trong chương tiếp theo.

47

Chương 3 Phát hiện mối quan hệ về sự biến động giá của các mặt hàng dân sinh

Một phần của tài liệu Luật kết hợp âm dương và ứng dụng trong công tác bình ổn giá (Trang 42 - 47)