(Luận văn thạc sĩ) kỹ thuật datamining để khuyến nghị khách hàng trong hệ thống BI (business intelligence)

74 21 0
(Luận văn thạc sĩ) kỹ thuật datamining để khuyến nghị khách hàng trong hệ thống BI (business intelligence)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

i ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG ĐINH ĐỨC LONG KỸ THUẬT DATAMINING ĐỂ KHUYẾN NGHỊ KHÁCH HÀNG TRONG HỆ THỐNG BI (BUSINESS INTELLIGENCE) LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH THÁI NGUYÊN - 2015 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn ii ĐẠI HỌC THÁI NGUYÊN TRƢỜNG ĐẠI HỌC CÔNG NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG ĐINH ĐỨC LONG KỸ THUẬT DATAMINING ĐỂ KHUYẾN NGHỊ KHÁCH HÀNG TRONG HỆ THỐNG BI (BUSINESS INTELLIGENCE) Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số: 60 48 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC MÁY TÍNH HƢỚNG DẪN KHOA HỌC: TS HOÀNG ĐỖ THANH TÙNG THÁI NGUYÊN - 2015 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn iii LỜI CAM ĐOAN Luận văn kết nghiên cứu tổng hợp kiến thức mà học viên thu thập trình học tập trường Đại học Công nghệ Thông tin Truyền thông - Đại học Thái Nguyên, hướng dẫn, giúp đỡ thầy cô bạn bè đồng nghiệp, đặc biệt hướng dẫn, giúp đỡ TS Hoàng Đỗ Thanh Tùng - Viện Công nghệ Thông tin, Viện Hàn lâm Khoa học Công nghệ Việt Nam Em xin cam đoan luận văn sản phẩm chép tài liệu khoa học Thái Nguyên, ngày 30 tháng năm 2015 Học viên Đinh Đức Long Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn iv LỜI CẢM ƠN Em xin gửi lời cảm ơn tới Trường Đại học Công Nghệ Thông Tin Truyền thông - ĐHTN, Viện Công nghệ Thông tin - Viện Hàn lâm Khoa học Công nghệ Việt Nam, nơi Thầy tận tình truyền đạt kiến thức quý báu cho em suốt trình học tập Xin cảm ơn Ban chủ nhiệm khoa cán khoa tạo điều kiện tốt cho chúng em học tập hoàn thành đề tài tốt nghiệp Đặc biệt, em xin gửi lời cảm ơn sâu sắc tới TS Hoàng Đỗ Thanh Tùng, người trực tiếp hướng dẫn, giúp đỡ để em hồn thành luận văn Mặc dù cố gắng hoàn thành luận văn với tất nỗ lực thân, luận văn cịn thiếu sót Kính mong nhận ý kiến đóng góp q thầy, bạn bè đồng nghiệp Em xin chân thành cảm ơn! Thái Nguyên, ngày 30 tháng năm 2015 Học viên Đinh Đức Long Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn v MỤC LỤC LỜI CAM ĐOAN i LỜI CẢM ƠN iv MỤC LỤC v DANH MỤC CÁC TỪ VIẾT TẮT viii DANH MỤC CÁC HÌNH VẼ ix MỞ ĐẦU I ĐẶT VẤN ĐỀ II ĐỐI TƢỢNG VÀ PHẠM VI NGHIÊN CỨU III Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN CỦA ĐỀ TÀI IV PHƢƠNG PHÁP NGHIÊN CỨU CHƢƠNG 1: TÌM HIỂU HỆ THỐNG BUSINESS INTELLIGENCE 1.1 Business Intelligence (BI) ? 1.2 Vai trò Data Mining hệ thống BI 1.2 Khai phá liệu(Data Mining - DM) 1.2.2 Khám phá tri thức CSDL (Knowledge Discovery in Database KDD) 1.2.3 Vai trò DM hệ thống BI 12 1.3 Hệ thống khuyến nghị khách hàng 16 1.3.1 Ma trận khả dụng 16 1.3.2 Các ứng dụng hệ thống khuyến nghị 18 1.3.3 Xây dựng ma trận khả dụng 19 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn vi 1.4 Kết luận chƣơng 19 CHƢƠNG KHAI PHÁ DỮ LIỆU TRONG HỆ THỐNG BI 20 2.1 Giới thiệu số kỹ thuật khai phá liệu dùng BI 20 2.1.1 Phân cụm 20 2.1.2 Luật kết hợp 21 2.1.3 Lý thuyết luật kết hợp 22 2.1.4 Thuật toán Apriori sinh luật kết hợp 23 2.2 Hệ thống khuyến nghị dựa nội dung 26 2.2.1 Hồ sơ hàng hóa 26 2.2.2 Khám phá đặc điểm liệu 27 2.2.3 Lấy đặc điểm mặt hàng từ thẻ (Tag) 29 2.2.4 Trình bày hồ sơ hàng hóa 30 2.2.5 Hồ sơ người dùng 32 2.2.6 Khuyến nghị sản phẩm cho người dùng dựa nội dung 33 2.2.7 Các thuật toán phân lớp 35 2.3 Lọc cộng tác (collaborative filtering) 38 2.3.1 Đo độ tương đồng 38 2.3.2 Tính đối ngẫu tương đồng 42 2.3.3 Phân cụm người dùng mặt hàng 45 2.4 Kết luận chƣơng 47 CHƢƠNG 3: ỨNG DỤNG TRIỂN KHAI THỬ NGHIỆM HỆ THỐNG TƢ VẤN CHỌN PHIM 48 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn vii 3.1 Bài toán 48 3.2 Xây dựng hệ tƣ vấn phim 50 3.2.1 Chuẩn bị liệu 50 3.2.3 Thiết kế hệ thống 54 3.2.2 Lựa chọn giải pháp 56 3.3 Kết luận chƣơng 62 KẾT LUẬN VÀ KIẾN NGHỊ 64 TÀI LIỆU THAM KHẢO 65 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn viii DANH MỤC CÁC TỪ VIẾT TẮT Từ viết tắt BI Viết đầy đủ Ý nghĩa Hệ thống trí tuệ doanh Business Intelligence DSS Decision Support Systems DM Data Mining nghiệp Hệ thống hỗ trợ định Khai phá liệu Dữ liệu phim IMDB Internet Movies DataBase KDD Knowledge Discovery in Database OLAP On – Line Analytical Processing RS Recommender System Số hóa Trung tâm Học liệu – ĐHTN internet Khám phá tri thức sở liệu Phân tích liệu trực tuyến đa chiều Hệ thống khuyến nghị http://www.lrc.tnu.edu.vn ix DANH MỤC CÁC HÌNH VẼ Hình 1.1 Nguồ n gố c của khai thác dữ liê ̣u Hình 1.2 Các bước qui trình khám phá tri thức CSDL 10 Hình 1.3 Các bước của quá trình khai phá dữ liê ̣u 11 Hình 1.4 Vai trò của khai thác dữ liê ̣u và khám phá tri thức lĩnh vực doanh nghiệp 13 Hình 1.5 Vai trò của DM và KDD lĩnh vực quan tâm DN 15 Hình 1.6 Một ma trận khả dụng đại diện cho việc đánh giá 16 phim theo thang từ 1-5 16 Hình 2.1 Một định 38 Hình 2.2 Ma trận khả dụng gợi ý hình 1.6 39 Hình 2.3 Độ khả dụng 3, thay 1, 41 đánh giá bị loại bỏ 41 Hình 2.4 Ma trận khả dụng gợi ý hình 2.2 42 Hình 2.5 Ma trận khả dụng cho người dùng cụm mặt hàng 45 Hình 3.1 Biểu đồ hoạt động hệ thống tư vấn phim 50 Hình 3.2 Kiến trúc hệ tư vấn phim 54 Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn MỞ ĐẦU I ĐẶT VẤN ĐỀ Trong năm gần đây, phát triển thương mại điện tử (ECommerce) đem lại nhiều lợi ích to lớn cho kinh tế tồn cầu Thơng qua thương mại điện tử, nhiều loại hình kinh doanh hình thành, có mua bán hàng mạng Với hình thức này, người tiêu dùng tiếp cận với hàng hóa cách dễ dàng nhanh chóng nhiều so với phương thức mua bán truyền thống môi trường ca ̣nh tranh ngày tăng, doanh nghiệp/tổ chức (DN/TC) đã nhâ ̣n rằ ng để thành cơng có kết tốt kinh doanh vấ n đề nhâ ̣n xu hướng hội thị trường r ất quan trọng, từ đó đáp ứng nhanh cho các nhu cầ u của khách hàng mới Mô ̣t cách ngắ n gọn mục tiêu doanh nghiệp hướng tới mục tiêu khách hàng Ngày việc lưu trữ , xử lý dữ liê ̣u để tổ ng hơ ̣p thông tin và hỗ trơ ̣ quyế t đinh ̣ đã trở nên phổ biế n đố i với nhiề u doanh n ghiê ̣p/tổ chức có nhiề u giải pháp cho vấn đề Business Intelligence (BI – giải pháp quản trị doanh nghiệp thông minh hay hệ thố ng trí tuê ̣ doanh nghiê ̣p ) giải pháp tiêu biểu nhiều DN /TC lựa cho ̣n cho mu ̣c đ ích quản lý điều hành hoạt động Ở nước phát triển , thuâ ̣t ngữ Business Intelligence (BI) tạm dịch giải pháp kinh doanh thơng minh hay hệ thống trí tuê ̣ doanh nghiê ̣p không còn mới mẻ , nhiên ở Viê ̣t N am chúng ta liñ h vực mức sơ khai Vậy BI ? Business Intelligence (BI) Có nhiều định nghĩa quan điểm khác BI , mỗi đinh ̣ nghiã đề câ ̣p đế n mô ̣t đă ̣c trưng nổ i bâ ̣t của ̣ thố ng BI lại tất đề cập đến khả hỗ trợ định cách hiệu hay BI còn đươ ̣c go ̣i là ̣ thố ng hỗ trơ ̣ quyế t đinh (Decision Support Systems ̣ Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 51  Timestamp: Nhãn thời gian thời điểm đánh giá Trường không sử dụng tư vấn phim  Mỗi người dùng có 20 đánh giá Dữ liệu người dùng: lưu file văn “users.dat” File gồm nhiều dòng, dòng ứng với người dùng có định dạng: UserID::Gender::Age::Occupation::Zip-code Ví dụ: 1::F::1::10::48067  UserID: Mã người dùng  Gender: Giới tính người dùng, thể chữ “M” nam, “F” nữ  Age: Độ tuổi người dùng, nhận giá trị tập {1,18,24,35,45,50,56} Ý nghĩa tham chiếu bảng Bảng tham chiếu tuổi tập liệu MovieLens Giá trị trường “Age” Ý nghĩa Dưới 18 tuổi 18 18-24 tuổi 25 25-34 tuổi 35 35-44 tuổi 45 45-49 tuổi 50 50-55 tuổi 56 Từ 56 tuổi trở lên  Occupation: Nghề nghiệp người dùng, nhận giá trị khoảng [0,20], ý nghĩa tham chiếu bảng Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 52 Bảng tham chiếu nghề nghiệp tập liệu MovieLens Giá trị trƣờng “Occupation” Ý nghĩa Không xác định tuổi Nhà nghiên cứu/Giáo viên Nghệ sĩ/hoạ sĩ Nhân viên văn phòng Sinh viên tốt nghiệp Dịch vụ khách hàng Bác sĩ/Chăm sóc sức khoẻ Quản lí/Giám đốc Nông dân Nội trợ 10 Sinh viên 11 Luật sư 12 Lập trình viên 13 Nghỉ hưu 14 Nhân viên bán hàng/tiếp thị 15 Nhà khoa học 16 Kinh doanh tư nhân 17 Kĩ thuật viên / Kĩ sư 18 Thợ thủ công 19 Thất nghiệp 20 Nhà văn Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 53 Zip-code: Mã khu vực người dùng sống Trường không sử dụng tư vấn phim Dữ liệu phim: lưu file “movies.dat” File gồm nhiều dòng, phim lưu dịng theo định dạng sau: MovieID::Title::Genres Ví dụ: 12::Dracula: Dead and Loving It (1995)::Comedy|Horror MovieID: Mã phim Title: Tên phim (bao gồm năm sản xuất) Genres: Thể loại phim Các liệu lưu vào sở liệu tư vấn phim Thông tin chi tiết phim Thông tin chi tiết phim tách từ trang Web Website IMDB: us.imdb.com IMDB cung cấp đường dẫn để truy xuất trang thông tin phim với tên năm sản xuất xác định sau: http://us.imdb.com/M/title-exact?Moviename+(Year)  Moviename tên phim mã hoá theo chuẩn URL  Year năm sản xuất phim [10] Chẳng hạn ta cần tìm thơng tin chi tiết phim “Toy Story” sản xuất vào năm 1995 cách vào trang: [11] http://us.imdb.com/M/title-exact?Toy+Story+(1995) Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 54 3.2.3 Thiết kế hệ thống 3.2.3.1 Kiến trúc tổng quan hệ thống Hệ thống tư vấn phim có kiến trúc sau: Client Client Client Web Server Request Handler Predictor Engine Recommender Engine Data Manager Online Recommendation Engine Database Database of Clusters Database of Ratings Database of Movies, Users Offline Clustering Offline Recommendation Engine Hình 3.2 Kiến trúc hệ tư vấn phim Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 55 Offline Clustering  Đây khối chức thực phân cụm tập người dùng dựa liệu đánh giá người dùng hệ thống thời điểm tiến hành phân cụm  Kết thực phân cụm liệu cụm người dùng lưu sở liệu hoạt động hệ thống Website  Chức phân cụm cần thực lần Khi liệu thay đổi nhiều, quản trị viên thực lại chức Predictor Engine  Đây khối chức thực đánh giá dự đoán người dùng phim Đầu vào cặp (người dùng, phim), đầu dự đoán đánh giá hệ thống  Khối sử dụng hai trường hợp  Người dùng xem thông tin phim, hệ thống cung cấp thơng tin dự đốn đánh giá phim xem  Khối chức “Recommender Engine” sinh tập gợi ý cho người dùng dựa vào dự đoán đánh giá người dùng phim chưa xem Recommender Engine  Đây khối chức thực sinh tập gợi ý cho người dùng thời Đầu vào người dùng, đầu tập phim gợi ý tương ứng với người dùng  Khối chức thực dựa việc dự đoán đánh giá người dùng thời phim chưa xem thông qua việc triệu gọi chức “Predictor Engine” Những phim dự đoán cao gợi ý cho người dùng Data Manager Khối chức Data Manager thực việc vào liệu trình giao tiếp với người dùng bao gồm truy xuất thông tin phim, thông tin Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 56 người dùng, cập nhật đánh giá, đăng kí người dùng mới, quản lý người dùng, quản lý phim hệ thống Request Handler Khối chức Request Handler thực vai trò trung gian người dùng với hệ thống  Nhận yêu cầu người dùng thực chức tương ứng  Sinh trang Web động hiển thị kết trả cho người dùng Database Cơ sở liệu để hệ thống hoạt động bao gồm sở liệu người dùng, phim, sở liệu đánh giá người dùng phim sở liệu phân cụm phục vụ cho chức tư vấn 3.2.2 Lựa chọn giải pháp Thuật toán Hệ thống tư vấn phim sử dụng phương pháp phân cụm tập người dùng nhằm nhóm người dùng có sở thích giống vào nhóm Hoạt động hệ thống gồm hai pha:  Pha offline: Tiến hành phân cụm người dùng  Pha online: Đưa tư vấn dự đoán đánh giá cho người dùng dựa vào việc phân cụm thực pha offline Độ tƣơng đồng Độ tương đồng lựa chọn sử dụng hệ thống độ đo khoảng cách Pearson: l simik  corrik   (r ij j 1 l  (r j 1 ij  ri )(rkj  rk ) l  ri )  (rkj  rk ) j 1 Trong  sim ik độ tương đồ ng hai người dùng ui uk Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 57  l số phim mà ui uk có đánh giá  ri , rk đánh giá trung bình người dùng ui uk  ri  I ui r jI ui i, j , với I u tập phim mà người dùng ui đánh giá i Thuật toán phân cụm Thuật toán phân cụm lựa chọn dựa ý tưởng thuật toán K-means có thay đổi Đầu vào: tập N người dùng Đầu ra: k cụm ổn định khác Thuật toán K-means mô tả sau: Giả sử cần phân tập người dùng vào k cụm khác Chọn k người dùng coi tâm cụm Thực lặp  Gán người dùng vào cụm mà độ tương đồ ng người dùng với tâm cụm lớn  Tính tốn lại tâm cụm Tâm cụm xác định phần tử cụm có trung bình tồn phương độ tương đờ ng v ới phần tử cịn lại cụm lớn  Quá trình lặp dừng cụm ổn định (khơng có người dùng chuyển từ cụm sang cụm khác) số lần lặp vượt giới hạn tối đa Trong thuật toán K-means chuẩn ta cần gán phần tử vào cụm mà phần tử có khoảng cách tới tâm cụm nhỏ Ở đây, hai người dùng giống độ tương đồ ng ớn l nên người dùng gán vào cụm mà tâm cụm có độ tương đồ ng với người dùng lớn Một điểm khác với K-means, tâm cụm xác định trọng tâm phần tử cụm, tức tâm cụm điểm có trung bình tồn phương khoảng cách tới tất phần tử cụm nhỏ Còn với khoảng cách Pearson , hai người dùng giống độ Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 58 tương đờ ng lớn nên phải có cách khác để xác định tâm Ở đây, chọn phương pháp lấy tâm phần tử nhóm có trung bình tồn phương độ tương đờ ng đến phần tử khác lớn Dự đoán đánh giá ngƣời dùng Sau phân cụm cơng việc dự đốn đánh giá người dùng nhẹ nhàng Sử dụng cụm nhƣ tập láng giềng Theo cách coi tất người dùng cụm tập láng giềng người dùng cụm Khi tính tốn dự đốn cho người dùng ta cần xác định cụm tương tự với anh ta, cụ thể là: người dùng thuộc cụm mà tâm cụm có độ tương tự với người dùng lớn Sau sử dụng thuật tốn lọc cộng tác với tập người dùng đầu vào ban đầu cụm chọn Nghĩa tập láng giềng chọn để tính tốn dự đốn cho người dùng tập cụm Như vậy, phương pháp nhằm mục đích xác định tập láng giềng người dùng thời thuật toán dựa nhớ truyền thống Sau xác định tập láng giềng này, dự đoán đánh giá người dùng thời ua phim ij xác định sau: l praj    (r i 1  ri )  sim ij l  sim i 1 Trong đó:  praj dự đoán cho đánh giá người dùng ua phim ij  simai độ tương đồ ng người dùng ua ui  l số người dùng tập láng giềng người dùng ua đánh giá ij  đánh giá trung bình thời người dùng ua Đƣa gợi ý cho ngƣời dùng Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 59 Khi người dùng yêu cầu danh sách phim gợi ý, hệ thống thực bước:  Xây dựng tập phim hợp phim mà láng giềng người dùng thời đánh giá người dùng thời lại chưa đánh giá  Tính dự đoán cho tập phim chọn Lấy phim có độ dự đốn đánh giá cao (top-N) giới thiệu cho người dùng 3.2.3.2 Công cụ mơi trường phát triển Ngơn ngữ lập trình Sau xác định kiến trúc hệ thống, ta cần cài đặt hệ thống ngôn ngữ lập trình cụ thể Ngơn ngữ lập trình lựa chọn để xây dựng hệ thống ASP.NET ASP.NET lựa chọn trước tiên ưu điểm sau:  ASP.NET cho phép ta lựa chọn ngôn ngữ lập trình mà ta quen thuộc: Visual Basic.Net, J#, C#,… Biên dịch trang web động thành tập tin DLL mà Server thi hành nhanh chóng hiệu  ASP.NET hỗ trợ mạnh mẽ thư viện phong phú đa dạng Net Framework, làm việc với XML, Web Service, truy cập sở liệu qua ADO.Net,…  ASP.NET sử dụng phong cách lập trình mới: Code behide Tách code riêng, giao diện riêng điều giúp ta dễ quản lý bảo trì chương trình  Kiến trúc lập trình giống ứng dụng Windows  Tự động phát sinh mã HTML cho Server control tương ứng với loại Browser ASP.NET giúp phát triển triển khai ứng dụng mạng thời gian kỷ lục cung cấp cho ta kiểu mẫu lập trình dễ dàng gọn gàng Ngồi ra, trang ASP.NET làm việc với browsers Internet Explorer (IE), FireFox, Chrome, Netscape, Opera, AOL,… mà không cần phải thay đổi lại nguồn mã Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 60 Với tất ưu điểm trên, ngôn ngữ ASP.NET lựa chọn để cài đặt tư vấn phim Phiên ASP.NET hệ thống hỗ trợ phiên Visual Studio 2010 Hệ quản trị sở liệu Hệ quản trị sở liệu lựa chọn Microsoft SQL Server 2008 Ưu điểm hệ quản trị sở liệu nhập/xuất (import/export) dễ dàng liệu hệ thống với file văn Tính cần thiết cho tư vấn phim trao đổi liệu với thành phần bên lưu trữ liệu dạng file văn SQL Server 2008 với NET Framework giảm phức tạp việc phát triển ứng dụng Các mở rộng ngôn ngữ truy vấn tích hợp (LINQ) NET Framework cách mạng hóa cách chuyên gia phát triển truy vấn liệu việc mở rộng Visual C#.NET Visual Basic.NET để hỗ trợ cú pháp truy vấn giống SQL vốn có Kết quả Giao diện chương trình: - Giao diện chưa đăng nhập: website mặc định hiển thị danh sách phim đánh giá cao Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 61 - Đăng nhập: ví dụ, Tên đăng nhập: 20; Mật khẩu: - Sau đăng nhập vào tài khoản 20, website giữ giao diện mặc định hiển thị thêm chức “Gợi ý cho bạn” menu bên phải: - Chọn chức “Gợi ý cho bạn”, module tư vấn phim tính tốn đưa gợi ý cho người dùng danh sách 20 phim chưa xem có khả thích dựa độ tương đồng với người dùng khác Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 62 3.3 Kết luận chƣơng Chương xây dựng ứng dụng tư vấn chọn phim sử dụng hệ thống khuyến nghị khách hàng BI - Vai trò hệ thống BI mang lại cho người dùng tiện lợi lựa chọn phim, gợi ý phù hợp, nhanh chóng, giúp họ dễ dàng đưa định xem phim khác phù hợp với họ - Vai trò Datamining cơng cụ lõi, thuật tốn khai thác từ liệu thu thập từ người dùng để tìm gợi ý phù hợp Như Datamining công cụ hỗ trợ BI thực nhiệm vụ trợ giúp khách hàng định Giải đƣợc vấn đề - Cung cấp cho người dùng tính thể quan điểm, đánh giá phim hệ thống - Áp dụng thuật tốn phân cụm, lọc cơng tác để trợ giúp tìm phim người dùng thích Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 63 Chƣa giải đƣợc - Hệ thống chưa giải vấn đề thêm phim người dùng Cách giải thời giới thiệu phim trang chủ người dùng khơng triệt để Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 64 KẾT LUẬN VÀ KIẾN NGHỊ Những vấn đề giải đƣợc: Tìm hiểu tổng quan khái niệm, vai trò Datamining hệ thống BI nói chung hệ thống khuyến nghị nói riêng Đi sâu tìm hiểu phương pháp lọc cộng tác số kỹ thuật khai phá liệu K-Means, luật kết hợp, thuật toán Apriori Xây dựng website tư vấn phim dựa vào phương pháp lọc cộng tác kết hợp với phân cụm liệu Những hạn chế luận văn: Do hạn chế mặt thời gian nghiên cứu trình độ học thuật, nên số đề phân tích nghiên cứu luận văn chắn cịn thiếu sót Luận văn đưa tư vấn dựa liệu sẵn có, pha offline tính tốn cịn chậm Dẫn đến chưa giải vấn đề thêm phim người dùng Cách giải thời giới thiệu phim trang chủ người dùng không triệt để Học viên hy vọng hạn chế thiếu sót luận văn khắc phục nghiên cứu sâu Rất mong nhận ý kiến đóng góp từ q thầy đồng nghiệp Hƣớng phát triển Triển khai hoạt động thực Internet, việc cập nhập bổ sung thông tin cho hệ thống cách tự động từ trang chứa liệu Tìm hiểu thêm phương pháp /kỹ thuật để giải vấn đề thêm phim người dùng Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn 65 TÀI LIỆU THAM KHẢO Tiếng Anh: [1] Adomavicius and A Tuzhilin, Towards the next generation of recommender systems: a survey of the state-of-the-art and possible exten- sions, IEEE Trans on Data and Knowledge Engineering 17:6, 734–749, 2005 [2] Anderson, The Long Tail: Why the Future of Business is Selling Less of More, Hyperion Books, New York, 2006 [3] Barry de Ville, Microsoft ® Data Mining Integrated Business Intelligence for e-Commerce and Knowledge Management,Digital Press,USA, 2001 [4] Koren, The BellKor solution to the Netflix grand prize, 2009 [5] Linden, B Smith, and J York, Amazon.com recommendations: itemto-item collaborative filtering,” Internet Computing 7:1, pp 76–80, 2003 [6] Li, Q & Kim, B.M “An approach for combining content-based and collaborative filters”, Korea Research Foundation Grant, KRF-2002041-D00459, 2002 [7] M Piotte and M Chabbert, The Pragmatic Theory solution to the Net- flix grand prize, 2009 [8] Ruchira Bhargava,Yogesh Kumar Jakhar, Knowledge Base Data Mining for Business Intelligence”, National Monthly Refereed Journal of Reasearch in Science & Technology,1(11), 1-5, 2003 Website: [9] http://www.cs.umn.edu/research/grouplens/data [10] http://us.imdb.com/M/title-exact?Moviename+(Year) [11] http://us.imdb.com/M/title-exact?Toy+Story+(1995) Số hóa Trung tâm Học liệu – ĐHTN http://www.lrc.tnu.edu.vn ... NGHỆ THÔNG TIN VÀ TRUYỀN THÔNG ĐINH ĐỨC LONG KỸ THUẬT DATAMINING ĐỂ KHUYẾN NGHỊ KHÁCH HÀNG TRONG HỆ THỐNG BI (BUSINESS INTELLIGENCE) Chuyên ngành: KHOA HỌC MÁY TÍNH Mã số: 60 48 01 01 LUẬN VĂN... phá liệu hệ thống khuyến nghị - Đánh giá thử nghiệm hệ thống khuyến nghị t III Ý NGHĨA KHOA HỌC VÀ THỰC TIỄN CỦA ĐỀ TÀI - Tìm hiểu phương pháp/kỹ thuật/ thuật tốn cho hệ thống khuyến nghị để định... tổng bi? ?n tập chi phối.[2] 1.3.2 Các ứng dụng hệ thống khuyến nghị Phần đưa số ứng dụng quan trọng hệ thống khuyến nghị Ứng dụng hệ thống khuyến nghị sản phẩm: Có lẽ ứng dụng dùng nhiều hệ thống

Ngày đăng: 10/06/2021, 09:21

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan