Khai phádữliệu phát hiệnluậtkếthợpvàứng
dụng đốivớikhodữliệucủangân hàng
Nguyễn Thị Thu Trang
Trường Đại học Công nghệ
Luận văn Thạc sĩ ngành: Công nghệ phần mềm; Mã số: 60 48 10
Người hướng dẫn: PGS.TS. Vũ Đức Thi
Năm bảo vệ: 2008
Abstract: Tìm hiểu những nét khái quát nhất về hệ thống xử lý giao dịch trực tuyến
(OLTP), Khodữliệu (Data warehouse) và hệ thống phân tích dữliệu trực tuyến
(OLAP). Trình bày các vấn đề chung, cơ bản nhất về Luậtkết hợp, giải thuật kinh điển
Apriori, khai pháluậtkếthợpvới OLAP và sinh luậtkếthợp từ tập mục phổ biến.
Nghiên cứu xây dựng khung ứng dụng, bao gồm các công việc: tập hợp, làm sạch,
chuẩn hoá dữ liệu, xây dựng Data-cube, khai pháluậtkếthợp từ Data-cube; từ đó triển
khai ứngdụng minh hoạ đốivớiKhodữliệuNgân hàng
Keywords: Dữliệu trực tuyến; Khai phádữ liệu; Khodữ liệu; Ngân hàng
Content
MỞ ĐẦU
Khai phádữliệu trong những năm gần đây đã và đang được ứngdụng rộng rãi trong nhiều
lĩnh vực như: Ngân hàng, Tài chính và thị trường chứng khoán, Thương mại, Giáo dục, Y tế,
Sinh học, Bưu chính viễn thông, … với nhiều hướng tiếp cận khác nhau như: Phân lớp/Dự
đoán, Phân cụm, Luậtkết hợp, … Các kỹ thuật chính được áp dụng trong khai phádữliệu
phần lớn được thừa kế từ lĩnh vực: Cơ sở dữ liệu, Máy tự học (Machine learning), Trí tuệ
nhân tạo, Lý thuyết thông tin, Xác suất thống kê, … và nổi trội trong đó là phương pháp Khai
phá dữliệu phát hiệnluậtkếthợpvới cơ sở lý thuyết vững chãi và đầy tính ứngdụng thực
tiễn.
Mặc dù trên thế giới, Khai phádữliệu bằng luậtkếthợp đã và đang là một trong những
phương pháp phô
̉
du
̣
ng va
̀
hiệu quả , được nhiều nhà khoa học va
̀
ca
́
c tô
̉
chư
́
c , doanh nghiê
̣
p
tìm hiểu, nghiên cứu, thử nghiệm, phát triển vàkết quả đã thu được những thành công lớn đặc
biệt trong lĩnh vực Ngân hàng và Tài chính trên những Khodữliệu khổng lồ. Tuy nhiên ở
nước ta, các nhà quản trị thậm chí còn chưa biết làm sao tổ chức dữliệucủa mình thành một
Kho dữ liệu, họ mới chỉ dừng lại ở việc trích rút được những báocáo đơn giản đáp ứng các
nghiệp vụ hàng ngày, chưa có khái niệm về Khodữ liệu, về phân tích OLAP, chứ chưa nói
đến là Khai phádữliệu từ Khodữliệu đó. Chính vì vậy đề tài tập trung vào vấn đề rất thực
tiễn này: Khai phádữliệu phát hiệnluậtkếthợpvàỨngdụngđốivớiKhodữliệucủa
ngân hàng.
Luận văn được tổ chức thành 3 chương:
Chương 1: Khodữliệuvà Phân tích dữliệu trực tuyến
2
Trình bày những nét khái quát nhất về Khodữliệu (Data warehouse) và Phân tích dữ
liệu trực tuyến (OLAP).
Chương 2: Khai phádữliệu phát hiệnluậtkếthợp
Trình bày các vấn đề chung, cơ bản nhất về Luậtkết hợp, giải thuật kinh điển Apriori
và Khai pháluậtkếthợp dựa trên OLAP.
Chương 3: Xây dựngứngdụng minh hoạ
Triển khai ứngdụng minh hoạ đốivớiKhodữliệuNgân hàng.
References
Danh sách tài liệu tham khảo tiếng Việt
[001] Tạ Liên Dung (2003), Một số vấn đề khai phádữ liệu, Luận văn thạc sĩ CNTT, Đại học
Quốc gia Hà Nội.
[002] Trần Vĩnh Hoàng (2007), Một số phương pháp khai phádữliệu sinh luậtkết hợp, Luận
văn thạc sĩ CNTT, Đại học Quốc gia Hà Nội.
[003] Hoàng Kiếm (4/2005), Giải một bài toán trên máy tính như thế nào, Tập 3 (tái bản lần
thứ nhất). NXB Giáo dục.
[004] Nguyễn Hùng Sơn (2006), Bài giảng Tập thô và Khai phádữ liệu.
[005] Vũ Đức Thi, Lê Hải Khôi (1999), Một số nguyên lý hoạt động củakhodữ liệu.
[006] Vũ Đức Thi (1997), Cơ sở dữliệu – Kiến thức và thực hành. NXB Thống Kê.
[007] Nguyễn Thanh Thuỷ (8/2001), Bài giảng Khai phádữliệu - Kỹ thuật vàứng dụng.
Danh sách tài liệu tham khảo tiếng Anh
[101] (1995) J.Gray, S.Chaudhuri, A.Bosworth, A.Layman, D.Reichart, M.Venkatrao,
F.Pellow and H.Pirahesh, Data-cube: a relational aggregation operator generalizing
group-by, cross-tab and sub-totals, Microsoft Technical report.
[102] J.Han (1999), OLAP-Mining: An integration of OLAP with Data-Mining, Simon Fraser
University.
[103] J.Han and M.Kamber (2001), Data Mining: Concepts and Techniques, Hacours Science
and Technology Company, USA.
[104] W.H.Inmon (1996), Building the Data Warehouse, John Wiley & Sons, Chichester,
second edition.
[105] W.H.Inmon (1995), "What is a Data Warehouse?", Prism, Volume 1.
[106] W.H.Inmon, C. Kelly (1993), Rdb/VMS: Developing the Data Warehouse, QED
Publishing Group, Boston, Massachussetts.
[107] Mehmed Kantardzic (2002), Data Mining: Concepts, Models, Methods and Algorithms,
Wiley-IEEE Press.
[108] R.Kimball (1996), The Data Warehouse Toolkit: Practical Techniques for Building
Dimensional Data Warehouses, John Wiley & Sons.
[109] M. Levene, G. Loizou (2000), “Why is the Snowflake Schema a Good Data Warehouse
Design?”, Birkbeck College, University of London.
[110] M.J.Zaki and M.Ogihara (6/1998), Theoretical Foundations of Association Rules, In 3
rd
ACM SIGMOD Workshop on Research Issues in Data mining and Knowledge
Discovery.
[111] Hua Zhu (1998), Online Analytical Mining of Association Rules, Master thesis, Simon
Fraser University.
3
Danh sách Websites tham khảo
[L01] http://citeseer.ist.psu.edu/
[L02] http://citeseer.ist.psu.edu/agrawal93mining.html
[L03] http://citeseer.ist.psu.edu/han99mining.html
[L04] http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.21.3808
[L05] http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.74.3044
[L06] http://www.cs.sfu.ca/
[L07] http://www.cse.ohio-state.edu/~agrawal/Research_new/mining.htm
[L08] http://en.wikipedia.org/wiki/Data_mining
[L09] http://en.wikipedia.org/wiki/Association_rule_mining
[L10] http://www.filibeto.org/sun/lib/nonsun/oracle/11.1.0.6.0/B28359_01/datamine.111/
b28129/intro_concepts.htm
[L11] http://freedatawarehouse.com/tutorials/dmtutorial/Dimensional%20Modeling%20
Tutorial.aspx
[L12] http://freedatawarehouse.com/tutorials/dmtutorial/Star%20Schema.aspx
[L13] http://freedatawarehouse.com/tutorials/dmtutorial/Snowflake%20Schema.aspx
[L14] http://www.intranetjournal.com/features/datawarehousing.html
[L15] http://it.toolbox.com/blogs/enterprise-solutions/snowflake-schema-modelling-data-
warehouse-20809
. Khai phá dữ liệu phát hiện luật kết hợp và Ứng dụng đối với Kho dữ liệu của
ngân hàng.
Luận văn được tổ chức thành 3 chương:
Chương 1: Kho dữ liệu và. Khai phá dữ liệu phát hiện luật kết hợp và ứng
dụng đối với kho dữ liệu của ngân hàng
Nguyễn Thị Thu Trang
Trường