Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống
1
/ 62 trang
THÔNG TIN TÀI LIỆU
Thông tin cơ bản
Định dạng
Số trang
62
Dung lượng
3,38 MB
Nội dung
1 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ NINH HỆ TƢ VẤN VÀ ỨNG DỤNG CHO BÀI TỐN DỰ BÁO KẾT QUẢ BĨNG ĐÁ LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN HÀ NỘI - 2014 ĐẠI HỌC QUỐC GIA HÀ NỘI TRƢỜNG ĐẠI HỌC CÔNG NGHỆ NGUYỄN THỊ NINH HỆ TƢ VẤN VÀ ỨNG DỤNG CHO BÀI TOÁN DỰ BÁO KẾT QUẢ BĨNG ĐÁ Ngành: Cơng nghệ thơng tin Chun ngành: Hệ thống thông tin Mã số: 60480104 LUẬN VĂN THẠC SĨ CÔNG NGHỆ THÔNG TIN NGƢỜI HƢỚNG DẪN KHOA HỌC: PGS.TS Nguyễn Đình Hóa TS Lê Hồng Sơn HÀ NỘI - 2014 LỜI CAM ĐOAN Tôi xin cam đoan cơng trình nghiên cứu độc lập riêng tơi, khơng chép cơng trình luận văn, luận án tác giả khác Các số liệu, kết nêu luận văn trung thực chƣa đƣợc công bố cơng trình khác Các trích dẫn, số liệu kết tham khảo dùng để so sánh có nguồn trích dẫn rõ ràng Tơi xin hồn tồn chịu trách nhiệm chịu hình thức kỷ luật theo quy định cho lời cam đoan Hà Nội, tháng 12 năm 2014 Tác giả luận văn Nguyễn Thị Ninh LỜI CẢM ƠN Trƣớc trình bày nội dung luận văn, em xin bày tỏ lịng biết ơn sâu sắc tới PGS.TS Nguyễn Đình Hóa Tiến sĩ Lê Hồng Sơn, ngƣời tận tình hƣớng dẫn tạo điều kiện để em hoàn thành luận văn Thứ hai, em xin bày tỏ lịng biết ơn chân thành tới tồn thể thầy cô giáo khoa Công nghệ thông tin, trƣờng Đại học Công nghệ Hà Nội, Đại học Quốc gia Hà Nội dạy bảo tận tình em suốt trình em học tập khoa Thứ ba, em xin đƣợc gửi lời cảm ơn tới thầy cô, anh chị bạn Trung tâm Tính tốn Hiệu cao, trƣờng Đại học Khoa học tự nhiên giúp đỡ em suốt thời gian làm luận văn Cuối em xin chân thành cảm ơn tới gia đình, bạn bè, đồng nghiệp bên em cổ vũ, động viên, giúp đỡ em suốt trình học tập thực luận văn Luận văn đƣợc thực dƣới tài trợ đề tài NAFOSTED, mã số: 102.05-2014.01 Mặc dù cố gắng hoàn thành luận văn phạm vi khả cho phép nhƣng chắn khơng tránh khỏi thiếu sót Em mong đƣợc góp ý chân thành thầy bạn để em hồn thiện luận văn Xin chân thành cảm ơn! Hà Nội, ngày 02 tháng 12 năm 2014 Học viên Nguyễn Thị Ninh MỤC LỤC LỜI CAM ĐOAN LỜI CẢM ƠN MỤC LỤC DANH SÁCH HÌNH VẼ DANH SÁCH BẢNG DANH MỤC CÁC KÝ HIỆU VIẾT TẮT 10 MỞ ĐẦU 11 CHƢƠNG TỔNG QUAN VỀ KHAI PHÁ DỮ LIỆU 13 1.1 KHAI PHÁ DỮ LIỆU 13 1.1.1 Định nghĩa khai phá liệu 13 1.1.2 Khám phá tri thức 13 1.2 KỸ THUẬT KHAI PHÁ DỮ LIỆU .14 1.2.1 Các thành tố 14 1.2.2 Các nhiệm vụ khai phá liệu 16 1.2.3 Kỹ thuật khai phá liệu 17 1.3 ỨNG DỤNG CỦA KHAI PHÁ DỮ LIỆU 19 1.3.1 Ứng dụng khai phá liệu 19 1.3.2 Ứng dụng phƣơng pháp khai phá liệu hệ tƣ vấn 20 1.4 KẾT LUẬN CHƢƠNG 21 CHƢƠNG HỆ TƢ VẤN VÀ CÁC PHƢƠNG PHÁP LỌC 22 2.1 HỆ TƢ VẤN 22 2.1.1 Định nghĩa hệ tƣ vấn 22 2.1.2 Các phƣơng pháp khuyến nghị 22 2.2 PHƢƠNG PHÁP LỌC CỘNG TÁC .23 2.2.1 Khát quát lọc cộng tác 23 2.2.2 Cách tiếp cận dựa ngƣời dùng 24 2.2.3 Cách tiếp cận dựa tài nguyên 26 2.3 VẤN ĐỀ COLD - START .28 2.3.1 Phát sinh vấn đề cold - start 28 2.3.2 Phƣơng pháp dựa nhân 29 2.4 PHƢƠNG PHÁP TIẾP CẬN ĐA CHIỀU .31 2.4.1 Mơ hình khuyến nghị đa chiều 31 2.4.2 Giảm chiều cho mơ hình khuyến nghị đa chiều 32 2.5 NGỮ CẢNH TRONG HỆ TƢ VẤN .34 2.5.1 Vai trò ngữ cảnh 34 2.5.2 Kết hợp ngữ cảnh trƣớc lọc 35 2.5.3 Kết hợp ngữ cảnh sau lọc 35 2.5.4 Kết hợp ngữ cảnh lọc 36 2.6 MƠ HÌNH NGƢỜI DÙNG TƢƠNG TỰ NHSM 36 2.6.1 Nhƣợc điểm độ đo tƣơng tự có 36 2.6.2 Công thức độ đo tƣơng tự NHSM 39 2.7 THUẬT TOÁN DỰ BÁO 40 2.8 KẾT LUẬN CHƢƠNG 42 CHƢƠNG ỨNG DỤNG CHO BÀI TỐN DỰ BÁO KẾT QUẢ BĨNG ĐÁ 43 3.1 ĐẶC TẢ YÊU CẦU .43 3.1.1 Yêu cầu thực tế 43 3.1.2 Thực tế hóa hệ thống 43 3.1.3 Mục đích hệ thống 43 3.2 PHÂN TÍCH HỆ THỐNG .44 3.2.1 Chức ngƣời dùng 44 3.2.2 Chức ngƣời quản trị 44 3.2.3 Mơ hình tổng thể thể mối quan hệ ca sử dụng 46 3.2.4 Mô tả giao diện hệ thống 46 3.3 ĐẶC TẢ CSDL 49 3.3.1 CSDL 49 3.3.2 Mô tả quan hệ CSDL 51 3.4 THIẾT KẾ HỆ THỐNG 51 3.4.1 Modul dự báo 51 3.4.2 Modul giải đấu 52 3.4.3 Modul mùa giải 52 3.4.4 Modul thơng tin đội bóng 52 3.4.5 Modul thuật toán 53 3.5 MINH HỌA CÁC CHỨC NĂNG HỆ THỐNG 53 3.5.1 Chức dự báo kết bóng đá 53 3.5.2 Các chức việc quản lý liệu 56 3.6 KẾT LUẬN CHƢƠNG 58 KẾT LUẬN 59 TÀI LIỆU THAM KHẢO .60 DANH SÁCH HÌNH VẼ Hình 1.1: Q trình khám phá tri thức Hình 1.2: Các nhiệm vụ khai phá liệu Hình 1.3: Các kỹ thuật khai phá liệu Hình 2.1: Ma trận đánh giá R ngƣời dùng lên tài nguyên Hình 2.2: Minh họa đánh giá cần dự đoán ngƣời dùng với lọc cộng tác Hình 2.3: Các cách tiếp cận lọc cộng tác Hình 2.4: Phƣơng pháp dựa nhân Hình 2.5: Khung đánh giá thuộc tính nhân Hình 2.6: Mơ hình khuyến nghị đa chiều với khơng gian Ngƣời dùng Mặt hàng Thời gian Hình 2.7: Tƣ vấn cho ngƣời dùng theo ngữ cảnh (thời tiết) Hình 2.8: Mơ hình (U I C R) : Dữ liệu ban đầu gồm ngƣời dùng, mục để đƣa khuyến nghị, ngữ cảnh liên quan hàm xếp hạng Hình 2.9: Ma trận ngƣời dùng tƣơng tự theo bảng 2.3 Hình 3.1: Sơ đồ ca sử dụng ngƣời dùng Hình 3.2: Sơ đồ ca ngƣời quản trị quản lý thông tin đội bóng Hình 3.3: Sơ đồ ca ngƣời quản trị quản lý giải đấu Hình 3.4: Sơ đồ ca ngƣời quản trị quản lý mùa giải Hình 3.5: Sơ đồ ca ngƣời quản trị quản trị quản lý thuật toán Hình 3.6: Sơ đồ ca tổng thể mối quan hệ ca sử dụng Hình 3.7: Giao diện mục trang chủ (phần trang chủ) Hình 3.8: Giao diện menu ảnh nằm ngang (phần trang quản trị) Hình 3.9: CSDL quan hệ bảng Hình 3.10: Lựa chọn giải đấu cho dự báo Hình 3.11: Lựa chọn mùa giải cần dự báo Hình 3.12: Lựa chọn tập huấn luyện tập kiểm tra Hình 3.13: Lựa chọn ô kết cần dự báo Hình 3.14: Lựa chọn sai số cho kết cần dự báo hiển thị kết Hình 3.15: Giao diện phần quản lý thơng tin đội bóng Hình 3.16: Giao diện phần quản lý giải đấu Hình 3.17: Giao diện phần quản lý mùa giải chung Hình 3.18: Giao diện phần quản lý mùa giải chi tiết Hình 3.19: Giao diện phần quản lý thuật tốn DANH SÁCH BẢNG Bảng 2.1: Ví dụ đánh giá ngƣời dùng lên tài nguyên Bảng 2.2: Ma trận đánh giá ngƣời dùng lên tài ngun có ngƣời dùng Bảng 2.3: Bảng thơng tin nhân số ngƣời dùng Bảng 2.4: Ma trận đánh giá ngƣời dùng – tài nguyên Bảng 3.1: Bảng giải đấu Bảng 3.2: Bảng mùa giải Bảng 3.3: Bảng thơng tin đội bóng Bảng 3.4: Bảng tham chiếu Bảng 3.5: Bảng thuật toán 10 DANH MỤC CÁC KÝ HIỆU VIẾT TẮT Từ cụm từ Từ viết tắt Từ Tiếng Anh Khai phá liệu KPDL Data mining Khám phá tri thức KDD Knowledge Discovery in Databases Cơ sở liệu CSDL Database Đa chiều MD Multidimensional Chênh lệch trung bình bình MSD phƣơng Mean squared difference Lọc cộng tác Collaborative filtering CF Mơ hình ngƣời dùng tƣơng tự NHSM New heuristic similarity model Độ đo PIP PIP Proximity Impact Popylarity Độ đo tƣơng quan Pearson PCC Pearson correlation coefficient Độ tƣơng tự cosin COS Cosine Độ đo tƣơng quan Pearson có CPCC ràng buộc Constrained coefficient Độ đo cosin hiệu chỉnh ACOS Adjusted Cosine Độ đo PSS PSS Proximity Signsficance Singularity Pearson correlation 48 Mô tả chung trang (phần trang quản trị) có: Phần bên phải: Phần chứa tên trang web Dƣới tên trang web lời chào admin Phía dƣới lối quay trang chủ khỏi tài khoản quản trị Phía dƣới menu dọc gồm ảnh nằm ngang, ảnh thẳng đứng, ảnh vuông, đoạn văn trang chủ, cập nhật, cấu hình, tài khoản cá nhân Trong mục cập nhật bao gồm cập nhật tin tức ngơn ngữ Trong mục cấu hình bao gồm có thơng tin đội bóng, giải đấu, mùa giải, thuật toán Trong mục tài khoản cá nhân bao gồm thông tin cá nhân tài khoản Mô tả riêng trang (phần trang quản trị) có: Tại menu ảnh nằm ngang: hiển thị ảnh nằm ngang có Trang quản trị menu thêm, xóa, sửa thơng tin ảnh quảng cáo nằm ngang (ảnh động gif) Ảnh đƣợc lƣu trữ thƣ mục advertising_horizontal Tại menu ảnh thẳng đứng: hiển thị ảnh thẳng đứng có Trang quản trị menu thêm, xóa, sửa thơng tin ảnh quảng cáo thẳng đứng (ảnh động gif) Ảnh đƣợc lƣu trữ thƣ mục advertising_vertival Tại menu ảnh vuông: hiển thị ảnh vng có Trang quản trị menu thêm, xóa, sửa thơng tin ảnh quảng cáo vuông (ảnh động gif) Ảnh đƣợc lƣu trữ thƣ mục advertising_square Tại menu đoạn văn trang chủ: hiển thị đoạn văn lƣu trữ Trang quản trị menu thêm, xóa, sửa, đoạn văn Tại menu cập nhật: chứa cách cập nhật tin tức ngôn ngữ Trang quản trị mục cập nhật tin tức lựa chọn cách cập nhật tin tức có sẵn Trang quản trị mục ngơn ngữ thêm, xóa, sửa ngơn ngữ cho trang web Tại menu cấu hình: chứa tồn liệu liên quan đến việc dự báo bóng đá Trang quản trị mục thơng tin đội bóng thực việc quản lý thơng tin đội bóng bao gồm thêm, xóa, sửa sử dụng Tại mục giải đấu, trang thực việc thêm, xóa, sửa giải đấu Tại mục mùa giải, trang thực việc thêm, xóa, sửa mùa giải thực quản lý thơng tin đội bóng cho mùa giải khác Trang quản trị mục thuật tốn thêm, xóa, sửa thuật tốn lựa chọn sử dụng thuật tốn cho việc dự báo 49 Hình 3.8: Giao diện menu ảnh nằm ngang (phần trang quản trị) 3.3 ĐẶC TẢ CSDL 3.3.1 CSDL Dữ liệu đầu vào cho dự báo bóng đá đƣợc thu thập từ trang web nhƣ [32] Các liệu đƣợc lƣu trữ CSDL trang web Có năm bảng CSDL tournament (bảng giải đấu), season (bảng mùa giải), infofootball (bảng thơng tin đội bóng), reference (bảng tham chiếu đội bóng mùa giải), bảng algorithm (bảng thuật tốn) Ngồi ra, trang web cịn sử dụng CSDL lƣu giữ thƣ mục hai file text Footballteam.txt Result.txt Bảng 3.1: Bảng giải đấu ID Field Type Length Null Key Default Description IDT Int 11 No Primary Name Varchar 255 No Tên giải đấu URL Varchar 255 No Tên đƣờng dẫn Mã giải đấu Bảng 3.2: Bảng mùa giải ID Field Type Length Null Key Default Description IDS Int 11 No Primary Name Varchar 255 No Tên mùa giải URL Varchar 255 No Tên đƣờng dẫn IDT Int 11 No Mã giải đấu Mã mùa giải 50 Bảng 3.3: Bảng thơng tin đội bóng ID Field Type Length Null Key IDI Int 11 No Primary Name Varchar 255 No Tên thông tin Milestone Varchar 255 No Các mốc liệu Defaults Varchar 255 No Các mốc mặc định Choice Tinyint No Sử dụng / Không sử dụng Default Description Mã thông tin Bảng 3.4: Bảng tham chiếu ID Field Type Length Null Key Default Description IDI Int 11 No Primary Value Varchar 255 No Các liệu Dvalue Varchar 255 No Các liệu mặc định IDS Int 255 No Mã mùa giải Mã giải đấu Bảng 3.5: Bảng thuật toán ID Field Type Length Null Key Default Description ID Int 11 No Primary Name Varchar 255 No Tên thuật toán URL Varchar 255 No Tên đƣờng dẫn Choice Tinyint No Sử dụng / Khơng sử dụng Mã thuật tốn File text Footballteam.txt lƣu giữ tên đội bóng đƣợc xếp theo thứ tự bảng chữ Mỗi tên đội bóng đƣợc lƣu trữ dòng Số dòng số đội bóng tham gia mùa giải File text Result.txt lƣu giữ kết mùa giải bao gồm kết biết chƣa biết Các kết file đƣợc xếp thành ma trận vng có chiều số đội bóng tham dự Các kết tƣơng ứng với trận đƣợc thêm theo thƣ tự tên đội bóng tham gia 51 3.3.2 Mơ tả quan hệ CSDL Hình 3.9: CSDL quan hệ bảng 3.4 THIẾT KẾ HỆ THỐNG Trang web đƣợc chia thành modul dự báo, giải đấu, mùa giải, thông tin đội bóng, thuật tốn 3.4.1 Modul dự báo Modul dự báo hoạt động sau modul giải đấu, mùa giải, thơng tin đội bóng, thuật tốn Modul dự báo bao gồm file select.php, training.php, testing.php, result.php, algorithmhybrid.php, algorithmsimple.php algorithmfuzzy.php hai tập tin text Footballteam.txt Result.txt Select.php thực lựa chọn giải đấu mùa giải cần dự báo, chuyển tiếp cho tập tin training.php Tập tin sử dụng CSDL tournament, season Training.php chức hiển thị kết mùa giải tại, cho phép lựa chọn tập kiểm tra tập huấn luyện cho việc dự báo, chuyển tiếp cho tập tin testing.php Tập tin sử dụng CSDL season, Footballteam.txt Result.txt Testing.php hiển thị kết mùa giải tại, cho phép lựa chọn kết cần dự báo, chuyển tiếp cho tập tin result.php, quay lại training.php cần thiết Tập tin sử dụng CSDL season, Footballteam.txt Result.txt Result.php có vai trò hiển thị kết trận đấu cần dự báo, quay lại tập tin testing.php training.php Tập tin sử dụng CSDL algorithm, reference Footballteam.txt 52 Algorithmhybrid.php, algorithmsimple.php, algorithmfuzzy.php tập tin thuật toán sử dụng để dự báo kết dựa vào tập huấn luyện tập kiểm tra Các tập tin sử dụng CSDL tournament, season, infofootball, reference, Footballteam.txt Result.txt Các tập tin thuật tốn tạo thêm xóa 3.4.2 Modul giải đấu Modul giải đấu hoạt động tạo điều kiện cho modul mùa giải, modul dự báo Modul giải đấu bao gồm file tournament.php Tournament.php hiển thị giải đấu có sẵn, cho phép sửa, xóa giải đấu Ngồi ra, tệp cịn cho phép thêm giải đấu Tập tin sử dụng CSDL tournament 3.4.3 Modul mùa giải Modul mùa giải hoạt động dựa modul giải đấu tạo điều kiện cho modul dự báo thực Modul mùa giải bao gồm file season.php, subseason.php, importseason.php, addseason.php, subdata.php, datadetail.php Season.php hiển thị mùa giải có theo giải đấu khác nhau, cho phép sửa tên mùa giải có, thực chuyển tiếp tới addseason.php datadetail.php Tập tin sử dụng CSDL season, tournament Addseason.php hiển thị lựa chọn cách thêm mùa giải, thực chuyển tiếp tới cách thêm mùa giải sau lựa chọn Subseason.php cho phép thêm mùa giải theo cách biên tập trực tiếp Tập tin sử dụng CSDL tournament, season, infofootball, reference, hai file text Footballteam.txt Result.txt Importseason.php thực thêm mùa giải theo cách import file zip Tập tin sử dụng CSDL tournament, season, infofootball, reference, hai file text Footballteam.txt Result.txt Subdata.php thực việc sửa lại nội dung CSDL text file Tập tin sử dụng CSDL season, reference, hai text file Footballteam.txt Result.txt Datadetail.php có chức hiển thị thơng tin đội bóng cho mùa giải, chỉnh sửa mốc cho thông tin, chuyển tiếp cho subdata.php cần thiết Tập tin sử dụng CSDL season, infofootball, reference text file Footballteam.txt 3.4.4 Modul thơng tin đội bóng Modul thơng tin đội bóng hoạt động tạo điều kiện cho modul mùa giải modul dự báo thực chức Modul thơng tin đội bóng bao gồm hai file infofootball.php subinfo.php 53 Infofootball.php hiển thị thông tin đội bóng, cho phép thơng tin đội bóng đƣợc phép sử dụng không sử dụng cho mùa giải, sửa chữa thông tin cho thông tin, chuyển tiếp cho tập tin subinfo.php Tập tin sử dụng bảng CSDL infofootball Subinfo.php thực thêm thơng tin đội bóng Tập tin sử dụng CSDL infofootball 3.4.5 Modul thuật toán Modul thuật toán hoạt động tạo điều kiện cho modul dự báo thực Modul thuật tốn bao gồm file algorithm.php Algorithm.php có vai trị hiển thị thuật tốn có, cho phép sửa tên thuật toán, sửa nội dung thuật toán, lựa chọn thuật tốn dự báo Ngồi ra, tập tin cịn cho phép thêm thuật tốn, quay thuật tốn lúc trƣớc, cập nhật thuật tốn dự phịng Tập tin sử dụng bảng CSDL algorithm 3.5 MINH HỌA CÁC CHỨC NĂNG HỆ THỐNG 3.5.1 Chức dự báo kết bóng đá Chức phần trang chủ website dự báo kết bóng đá Trang web có sẵn số giải đấu Trong giải đấu đó, liệu liên quan bao gồm mùa giải kết thúc mùa giải diễn để ngƣời xem tùy chọn kiểm tra tính xác dự báo Chi tiết bƣớc thực dự báo bóng đá phần trang chủ đƣợc trình bày dƣới đây: Bƣớc 1: Lựa chọn giải đấu cần dự báo Hình 3.10: Lựa chọn giải đấu cho dự báo 54 Bƣớc 2: Lựa chọn mùa giải cần dự báo Hình 3.11: Lựa chọn mùa giải cần dự báo Bƣớc 3: Lựa chọn tập huấn luyện tập kiểm tra Hình 3.12: Lựa chọn tập huấn luyện tập kiểm tra 55 Bƣớc 4: Lựa chọn ô chứa kết cần dự báo Hình 3.13: Lựa chọn kết cần dự báo Bƣớc 5: Lựa chọn sai số cho dự báo xem kết Hình 3.14: Lựa chọn sai số cho kết dự báo hiển thị kết 56 3.5.2 Các chức việc quản lý liệu Các chức phần quản trị bao gồm: quản lý thơng tin đội bóng, quản lý thơng tin giải đấu, quản lý thông tin mùa giải chung, quản lý thơng tin mùa giải chi tiết, quản lý thuật tốn Quản lý thơng tin đội bóng: bao gồm việc thêm, xóa, sửa, mặc định mốc thơng tin đội bóng Ngồi ra, ngƣời sử dụng lựa chọn thơng tin đƣợc sử dụng không sử dụng cho mùa giải Hình 3.15: Giao diện phần quản lý thơng tin đội bóng Quản lý thơng tin giải đấu: thực thao tác, thêm, xóa, sửa giải đấu Hình 3.16: Giao diện phần quản lý giải đấu Quản lý thông tin mùa giải chung: gồm thao tác thêm, xóa, sửa mùa giải cho phù hợp 57 Hình 3.17: Giao diện phần quản lý mùa giải chung Quản lý thông tin mùa giải chi tiết: mùa giải khác có thơng tin đội bóng kết khác Ngƣời dùng thêm, xóa, sửa kết thơng tin đội bóng, thơng tin đội bóng lựa chọn trở lại giá trị mặc định ban đầu Hình 3.18: Giao diện phần quản lý mùa giải chi tiết Quản lý thuật toán: mục cho phép thêm, xóa, sửa thuật tốn cho trang web Ngƣời quản trị quay trở lại thuật toán lúc trƣớc nhƣ thuật toán sai cập nhật cho thuật tốn dự phịng muốn lƣu trữ thuật tốn 58 Hình 3.19: Giao diện phần quản lý thuật toán 3.6 KẾT LUẬN CHƢƠNG Chƣơng này, luận văn triển khai thuật toán lọc cộng tác với độ đo NHSM cho toán dự báo kết bóng đá Kết đạt đƣợc, xây dựng trang web Dự báo kết bóng đá góp phần tƣ vấn cho ngƣời hâm mộ dự báo kết bóng đá tỉ số nhƣ kết thắng - hòa - thua số giải đấu Ngƣời sử dụng lựa chọn dự báo theo mơ hình hệ tƣ vấn để có kết dự báo khác Từ đó, ngƣời dùng có thêm gợi ý để dự báo kết bóng đá phù hợp 59 KẾT LUẬN Hệ tƣ vấn ngày đƣợc ứng dụng nhiều lĩnh vực để đƣa khuyến nghị cho ngƣời dùng cần tìm kiếm, đánh giá thơng tin Trên sở đó, luận văn trình bày đạt đƣợc hai kết sau: 1/ Nghiên cứu tài liệu để hệ thống lại vấn đề sau: Tổng quan kiến thức khai phá thông tin Tổng quan hệ tƣ vấn phƣơng pháp lọc Độ đo tƣơng tự NHSM thuật toán dự báo 2/ Ứng dụng: Triển khai thuật toán lọc cộng tác với độ đo cho toán dự báo kết bóng đá Trong tƣơng lai, thuật tốn tiếp tục đƣợc cải tiến để nâng cao khả khuyến nghị cho tốn dự báo bóng đá nói riêng nhƣ tốn cho hệ khuyến nghị khác nói chung 60 TÀI LIỆU THAM KHẢO Tiếng Việt [1] Nguyễn Đức Cƣờng (2011), Tổng quan khai phá liệu, Khoa Công nghệ Thông tin, Đại học Bách Khoa TPHCM [2] Đỗ Phúc (2005), Giáo trình Khai thác liệu, ĐHQG TPHCM [3] Nguyễn Nhật Quang (2010), Khai phá liệu, Viện Công nghệ Thông tin Truyền thông, Đại học Bách Khoa Hà Nội [4] Hà Quang Thụy (2011), Bài giảng nhập môn khai phá liệu, Đại học Công nghệ, ĐHQGHN Tiếng Anh [1] Abdelwahab A., Sekiya H., Matsuba I., Horiuchi Y., Kuroiwa S (2009), Collaborative filtering based on an iterative prediction method to alleviate the sparsity problem, in: Proceedings of the International Conference on Information Integration and Web-based Applications & Services, pp 375–379 [2] Adomavicius G., R Sankaranarayanan, S Sen and A Tuzhilin (2005), “Incorporating contextual information in recommender systems using a multidimensional approach”, ACM Transactions on Information Systems (TOIS), 23(1), pp 103-145 [3] Adomavicius G., Tuzhilin, A (2005), “Toward the next generation of recommender systems: A survey of the state-of-the-art and possible extensions”, Knowledge and Data Engineering, IEEE Transactions on, 17(6), 734-749 [4] Adomavicius G., Tuzhilin, A (2011), “Context-aware recommender systems”, In Recommender systems handbook, pp 217-253 [5] Ahn H.J (2008), A new similarity measure for collaborative filtering to alleviate the new user cold-starting problem, Inform Sci 178 (1), pp 37–51 [6] Anand D., Bharadwaj K.K (2011), Utilizing various sparsity measures for enhancing accuracy of collaborative recommender systems based on local and global similarities, Expert Syst Appl 38, pp 5101–5109 [7] Bobadilla J., Ortega F., Hernando A., Bernal J (2011), A collaborative filtering approach to mitigate the new user cold start problem, KnowledgeBased Syst 26, pp 225–238 [8] Bryan K., O'Mahony M and Cunningham P (2008), “Unsupervised retrieval of attack profiles in collaborative recommender systems”, Proceedings of the 2008 ACM conference on Recommender systems, pp 155-162 61 [9] Cacheda F., Carneiro V., Fernández D., Formoso V (2011), Comparison of collaborative filtering algorithms: limitations of current techniques and proposals for scalable, high-performance recommender system, ACM Trans Web (1), pp 1–33 [10] DanEr C (2009), The collaborative filtering recommendation algorithm based on BP neural networks, in: Proceedings of the International Symposium on Intelligent Ubiquitous Computing and Education, pp 234–236 [11] Fayyad U., Piatetsky-Shapiro G and Smyth P (1996), “From data mining to knowledge discovery in databases”, AI magazine, 17(3), pp 37 [12] Fu Y (1997), Data mining: Tasks, techniques and applications, Department of Computer Science, University of Missouri-Rolla [13] Han J., Fu Y., Wang W., Koperski K and Zaiane O (1996), “DMQL: A data mining query language for relational databases”, Proc 1996 SiGMOD, 96, pp 27-34 [14] Hand D J., Mannila H and Smyth P (2001), Principles of data mining, MIT press Ho T B (2002), Introduction to knowledge discovery and data mining, National Center for Natural Science and Technology [15] Han J., Kamber M (2001), Data Mining: Concepts and Techniques, Morgan Kaufmann [16] Han J., Kamber M and Pei J (2006), Data mining: concepts and techniques, Morgan kaufmann [17] Han J., Kamber M and Pei J (2011), Data mining: concepts and techniques, Elsevier [18] Hao M., King I., Michael R.I (2007), Effective missing data prediction for collaborative filtering, in: Proceedings of the Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, pp 39–46 [19] Hao M., Haixuan Y., Lyu M.R., Irwin K (2008), Sorec: social recommendation using probabilistic matrix factorization, in: Proceedings of the 17th ACM Conference on Information and Knowledge Management, pp 931–940 [20] Herlocker J.L., Konstan J.A., Borchers A., Riedl J (1999), An algorithmic framework for performing collaborative filtering, in: Proceedings of the Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, pp 230–237 62 [21] Jamali M., Ester M (2009), TrustWalker: a random walk model for combining trust-based and item-based recommendation, in: Proceedings of the 15th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, pp 397–406 [22] Koutrica G., Bercovitz B., Garcia H (2009), FlexRecs: expressing and combining flexible recommendations, in: Proceedings of the ACM SIGMOD International Conference on Management of Data, pp 745–758 [23] Mobasher B., Burke R., Bhaumik R and Williams C (2005), “Effective attack models for shilling item-based collaborative filtering systems”, Proceedings of the 2005 WebKDD Workshop, held in conjuction with ACM SIGKDD’2005 [24] Haifeng L., Zheng H., Ahmad M., Hui T., Xuzhen Z., (2014), “KnowledgeBased Systems: A new user similarity model to improve the accurary of collaborative filtering”, pp 5-6 [25] Nan L., Chunping L (2009), Zero-sum reward and punishment collaborative filtering recommendation algorithm in: Proceedings of the IEEE/WIC/ACM International Conference on Web Intelligence Agent Technology, pp 548– 551 [26] Naisbitt J (1982), Megatrends New York: Warner Books [27] O'Mahony M., Hurley N., Kushmerick N and Silvestre G (2004), “Collaborative recommendation: A robustness analysis”, ACM Transactions on Internet Technology (TOIT), 4(4), pp 344-377 [28] Ricci F., Rokach L and Shapira B (2011), Introduction to recommender systems handbook, pp 1-35 [29] Resnick P., Iacovou N., Suchak M., Bergstrom P., Riedl J (1994), GroupLens: an open architecture for collaborative filtering of netnews, in: Proceeding of the ACM Conference on Computer Supported Cooperative Work, pp 175–186 [30] Shardanand U., Maes P (1994), Social information filtering: algorithms for automating word of mouth, in: Proceedings of the SIGCHI Conference on Human Factors in Computing Systems, pp 210–217 [31] Zenebe A., Norcio A F (2009), “Representation, similarity measures and aggregation methods using fuzzy sets for content-based recommender systems”, Fuzzy Sets and Systems, 160(1), pp 76-94