- Tao_cay: Duyệt cơ sở dữ liệu và gọi Create_FPTree để tạo cỏc cõy con phụ thuộc
4. Kết quả đạt đƣợc và phỏt triển ứng dụng
Hệ thống khai phỏ dữ liệu tai nạn giao thụng đƣợc phỏt triển trờn nền tảng ngụn ngữ lập trỡnh Visual Basic 6.0 và hệ quản trị cơ sở dữ liệu SQL SERVER 2000. Ứng dụng đó đƣợc cài đặt theo cấu trỳc dữ liệu thật của cơ sở dữ liệu thuộc hệ thống quản lý tai nạn giao thụng của do cục C26 kết hợp với cục E15 xõy dựng cũng nhƣ triển khai trờn toàn quốc. Bộ dữ liệu phục vụ chạy thử nghiệm là một phần dữ liệu về tai nạn giao thụng của cụng an tỉnh Hải Dƣơng năm 2005. Do đú ứng dụng hoàn toàn mang tớnh tổng quỏt và cú thể hoàn thiện để đƣa vào ứng dụng phục vụ cụng tỏc nghiệp vụ của cục C26 và cỏc PC26 núi riờng, ngành Cụng an núi chung.
Mặc dự ứng dụng này đó đƣợc phỏt triển phự hợp với cấu trỳc và kiểm tra thử nghiệm trờn bộ số liệu tai nạn giao thụng thật song ứng dụng mới chỉ đƣợc cài đặt và phỏt triển theo cỏc chuyờn đề định sẵn núi trờn, cũn cú rất nhiều chuyờn đề khai phỏ dữ liệu khỏc cần đƣợc cài đặt . Hơn thế nữa ta cú thể khai phỏ dữ liệu dựa trờn cơ sở dữ liệu tai nạn và cơ sở dữ liờu đăng ký ễ tụ, Mụ tụ để biết đƣợc mối tƣơng quan giữa tai nạn giao thụng với phƣơng tiện, hóng sản xuất ... Do đú nếu cú điều kiện ứng dụng sẽ đƣợc phỏt triển mở rộng theo cỏc hƣớng này.
KẾT LUẬN
Khai phỏ dữ liệu là một trong những vực đó và đang ngày càng trở nờn phổ biến trờn thế giới núi chung và ở Việt Nam núi riờng. Nằm trong xu thế đú, sắp tới Ủy ban an toàn giao thụng quốc gia, Bộ giao thụng vận tải, Bộ Cụng an sẽ triển khai dự ỏn xõy dựng trung tõm dữ liệu tai nạn giao thụng quốc gia. Trong dự ỏn này cú hạng mục xõy dựng chƣơng trỡnh khai phỏ dữ liệu tan nạn giao thụng nhằm tỡm hiểu mối liờn hệ giữa cỏc yếu tố gõy tai nạn giao thụng để từ đú hỗ trợ cho cỏc cơ quan chức năng ra cỏc văn bản, nghị định thụng tƣ chấn chỉnh kịp thời hạn chế tai nạn giao thụng.
Là một cỏn bộ thuộc cơ quan chủ quản lĩnh vực tin học của Bộ Cụng an, tỏc giả đó chọn đề tài này để nghiờn cứu nhằm cú thể hiểu và giỏm sỏt đƣợc cỏc vấn đề thuộc dự ỏn. Với đề tài đó chọn, luận văn chỉ tập trung vào tỡm hiểu và cài đặt cỏc thuật toỏn liờn quan tới khai phỏ dữ liệu núi chung và khai phỏ dữ liệu tai nạn giao thụng núi riờng. Đú là những vấn đề rất cơ bản thuộc lĩnh vực khai phỏ dữ liệu nhờ luật kết hợp. Luận văn đó trỡnh bày hƣớng tiếp cận trong khai phỏ dữ liệu bằng luật kết hợp thụng qua cài đặt thuật toỏn xõy dựng cõy FP-Tree và cài đặt thuật toỏn FP-Growth để tỡm cỏc tập mục phổ biến.
Ứng dụng minh họa đó đƣợc cài đặt cũng nhƣ kiểm thử thụng qua bộ dữ liệu thật và cho kết quả tốt.
TÀI LIỆU THAM KHẢO Tài liệu tiếng Việt Tài liệu tiếng Việt
1. Vũ Đức Thi, Cơ sở dữ liệu - Kiến trỳc và thực hành, Nhà xuất bản thống kờ, 1997. 2. Vũ Đức Thi – Lờ Hải Khụi, Một số nguyờn lý hoạt động của kho dữ liệu, Tạp chớ
tin học và Điều khiển, 1999.
3. Nguyễn Thanh Thủy, Khai phỏ dữ liệu-Kỹ thuật và ứng dụng, Hà Nội thỏng 8 - 2001.
Tài liệu tiếng Anh
1. Alan Rea (1995), Data Mining – An Introduction, The Parallel Computer Center, The Queen’s University of Belfast
2. Jiawei Han and Micheline Kamber (2002), Data mining: Concepts and Techniques, University of Illinois, Morgan Kaufamn Publishers.
3. Rakesh Agrawal, Tomasz Imielinski and Arun Swami (1993), Mining association rules between sets of Items in lagre databases, In Proc of the ACM SIGMOD Conference on Mangement of Data, Washington, DC.
4. Mohammed J.Zaki and Ching –Jui Hsiao (1999), CHAM: An Efficient Algorithm for Closed Association Rules Mining, PRI Technical Report 99.
5. Jiawei Han and Micheline Kamber, Data mining: Concepts and Techniques,
Academic Press 2001.
6. Zaki M., Parthasarathy S., Ogihara M.: New algorithms for fast discovery of association rule, KDDM 1998.
Tài liệu trờn mạng