1. Trang chủ
  2. » Luận Văn - Báo Cáo

NGHIÊN cứu hệ THỐNG gợi ý THEO NGỮ CẢNH và ỨNG DỤNG

71 1,2K 9

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Thông tin cơ bản

Định dạng
Số trang 71
Dung lượng 3,33 MB

Nội dung

BỘ GIÁO DỤC VÀ ĐÀO TẠO ĐẠI HỌC HUẾ TRƯỜNG ĐẠI HỌC KHOA HỌC HOÀNG THỊ THẢO TIÊN NGHIÊN CỨU HỆ THỐNG GỢI Ý THEO NGỮ CẢNH VÀ ỨNG DỤNG CHUYÊN NGÀNH: KHOA HỌC MÁY TÍNH MÃ SỐ: 60 48 01 01 LUẬN VĂN THẠC SĨ KHOA HỌC ĐỊNH HƯỚNG NGHIÊN CỨU NGƯỜI HƯỚNG DẪN KHOA HỌC PGS.TS LÊ MẠNH THẠNH Thừa Thiên Huế, 2016 LỜI CAM ĐOAN Tôi cam đoan kết nghiên cứu đưa luận văn dựa kết thu trình nghiên cứu riêng tôi, không chép kết nghiên cứu tác giả khác Nội dung luận văn có tham khảo sử dụng số thông tin, tài liệu từ nguồn sách, tạp chí liệt kê danh mục tài liệu tham khảo Học viên Hoàng Thị Thảo Tiên LỜI CẢM ƠN Tôi xin chân thành cảm ơn PGS.TS Lê Mạnh Thạnh trực tiếp tận tình hướng dẫn, giúp đỡ, tạo điều kiện thuận lợi cho suốt trình nghiên cứu Tôi xin gởi lời cảm ơn Quý Thầy Cô khoa Công nghệ thông tin trường Đại học Khoa học Huế, cung cấp, truyền đạt kiến thức cho suốt trình học tập trường Xin chân thành cảm ơn anh chị em lớp cao học Khoa học máy tính khoá 2014-2016 bạn bè bên cạnh, động viên, khuyến khích suốt thời gian học tập thực đề tài Cuối cùng, xin bày tỏ lòng biết ơn sâu sắc tới toàn thể gia đình, bạn bè động viên, khích lệ tinh thần để có đủ nghị lực hoàn thành luận văn Xin chân thành cảm ơn! Huế, tháng năm 2016 Học viên Hoàng Thị Thảo Tiên MỤC LỤC Trang LỜI CAM ĐOAN LỜI CẢM ƠN .3 MỤC LỤC DANH MỤC CÁC BẢNG DANH MỤC CÁC HÌNH DANH MỤC CÁC CHỮ VIẾT TẮT MỞ ĐẦU CHƯƠNG TỔNG QUAN VỀ HỆ THỐNG GỢI Ý 1.1 HỆ THỐNG GỢI Ý .5 1.1.1 Giới thiệu hệ thống gợi ý .5 1.1.2 Dữ liệu hệ thống gợi ý 1.1.2.1 Các mục tin(Item) 1.1.2.2 Người sử dụng(user) 1.1.2.3 Giao dịch (Transactions) .9 1.1.3 Chức hệ thống gợi ý 10 1.1.4 Các phương pháp sử dụng hệ thống gợi ý 13 1.1.4.2 Hệ thống gợi ý lọc cộng tác .14 1.1.4.3 Kết hợp phương pháp 16 1.1.5 Ứng dụng .17 1.2 PHƯƠNG PHÁP LỌC CỘNG TÁC 19 1.2.1 Tổng quan lọc cộng tác 19 1.2.2 Ưu điểm lọc cộng tác 20 1.2.3 Các hình thức tiếp cận 22 1.2.3.1 Phương pháp tiếp cận dựa nhớ (Memory base) 22 1.2.3.2 Phương pháp tiếp cận dựa mô hình(Model-based) .23 1.3 TIỂU KẾT CHƯƠNG .24 CHƯƠNG XÂY DỰNG HỆ THỐNG GỢI Ý THEO NGỮ CẢNH 25 2.1 HỆ THỐNG GỢI Ý THEO NGỮ CẢNH 25 2.1.1 Ngữ cảnh hệ thống gợi ý 25 2.1.2 Mô hình hoá thông tin theo ngữ cảnh hệ thống gợi ý 28 2.1.3 Cách thu thập thông tin theo ngữ cảnh .31 2.1.4 Các phương pháp tiếp cận hệ thống gợi ý đa chiều 32 2.2 PHƯƠNG PHÁP XÂY DỰNG HỆ THỐNG GỢI Ý THEO NGỮ CẢNH 35 2.2.1 Xử lý thông tin ngữ cảnh đầu vào 35 2.2.2 Kỹ thuật phân rã ma trận 37 2.2.3 Xử lý thông tin ngữ cảnh đầu .42 2.2.4 Kết hợp phương pháp gợi ý theo ngữ cảnh 44 2.3 TIỂU KẾT CHƯƠNG 46 CHƯƠNG HỆ THỐNG GỢI Ý TRA CỨU KHÁCH SẠN THEO NGỮ CẢNH 47 3.1 MÔ TẢ HỆ THỐNG 47 3.2 PHÂN TÍCH, THIẾT KẾ, XÂY DỰNG HỆ THỐNG GỢI Ý TRA CỨU KHÁCH SẠN THEO NGỮ CẢNH 49 3.2.1 Sơ đồ ngữ cảnh 49 3.2.2 Biểu đồ phân rã chức .49 3.2.3 Biểu đồ luồng liệu 50 3.2.4 Cơ sở liệu hệ thống 52 3.2.5 Một vài giao diện minh hoạ cho hệ thống 53 3.3 ĐÁNH GIÁ 56 3.4 TIỂU KẾT CHƯƠNG 58 58 KẾT LUẬN 59 TÀI LIỆU THAM KHẢO 60 DANH MỤC CÁC BẢNG Trang Bảng 1.1 Ví dụ ma trận người dùng x sản phẩm 15 Bảng 2.1 Minh hoạ tập liệu với ngữ cảnh 36 Bảng 2.2 Tập liệu sau sử dụng phương pháp xử lý ngữ cảnh đầu vào 37 Bảng 2.3 Hậu xử lý kết dự đoán 44 Bảng 3.1 Kết đánh giá dựa công thức RMSE 57 DANH MỤC CÁC HÌNH Trang Hình 1.1 Minh hoạ hệ thống gợi ý Hình 1.2 Minh họa phương pháp gợi ý dựa nội dung 14 Hình 1.3 Minh họa phương pháp gợi ý dựa lọc cộng tác 16 Hình 1.4 Gợi Hình 1.5 ý theo lọc cộng tác Amazon .19 Quy trình hệ thống gợi ý dựa lọc cộng tác 20 Hình 2.1 Minh hoạ cho không gian gợi ý ba chiều .30 Hình 2.2 Mô hình kết hợp ngữ cảnh hệ thống gợi ý 33 Hình 2.3 Quy trình gợi ý theo ngữ cảnh 35 Hình 2.4 Sử dụng phương pháp xử lý ngữ cảnh đầu vào .36 Hình 2.5 Minh họa kỹ thuật phân rã ma trận .38 Hình 2.6 Minh hoạ dự đoán người dùng thứ cho item thứ .41 Hình 2.7 Xử lý thông tin ngữ cảnh đầu .43 Hình 3.1 Sơ đồ kiến trúc hệ thống 48 Hình 3.2 Sơ đồ ngữ cảnh .49 Hình 3.3 Sơ đồ chức hệ thống 50 Hình 3.4 Sơ đồ luồng liệu mức .50 Hình 3.5 Sơ đồ luồng liệu mức .51 Hình 3.6 Sơ đồ luồng liệu mức .51 Hình 3.7 Sơ đồ luồng liệu mức .52 Hình 3.8 Biểu đồ sở liệu 52 Hình 3.9 Giao diện website 53 Hình 3.10 Giao diện mô tả chi tiết khách sạn .53 Hình 3.11 Giao diện vị trí khách sạn .54 Hình 3.12 Giao diện đánh giá người dùng 54 Hình 3.13 Giao diện gợi ý cho người dùng theo thể loại 55 Hình 3.14 Giao diện gợi ý theo ngữ cảnh vị trí 56 Hình 3.15 Giao diện kết gợi ý theo ngữ cảnh vị trí 56 DANH MỤC CÁC CHỮ VIẾT TẮT C Ngữ cảnh (Context) CF Collaborative filtering (Lọc cộng tác) I Item (Các mục tin) IF Information filtering (Lọc thông tin) IR Information retrieval(Thu thập thông tin) MF Matrix Factorization(Kỹ thuật phân rã ma trận) R Rating (Đánh giá) RS Recommender Systems (Hệ thống gợi ý) SGD Stochastic Gradient Descent (Giảm độ lêch ngẫu nhiên) U Users( Người dùng) CHƯƠNG HỆ THỐNG GỢI Ý TRA CỨU KHÁCH SẠN THEO NGỮ CẢNH 3.1 MÔ TẢ HỆ THỐNG Hệ thống gợi ý khách sạn xây dựng dạng trang web cung cấp thông tin khách sạn: Tên khách sạn, địa chỉ, quy mô khách sạn, dịch vụ kèm theo số thông tin khác mà người dùng tham khảo đặt phòng thông tin tiện nghi phòng, phòng cho người lớn hay trẻ em Khi có người truy cập vào website tìm kiếm, tham khảo thông tin khách sạn, bình chọn đánh giá khách sạn yêu thích Để bình chọn đánh giá khách sạn, hệ thống xây dựng chức cho phép người dùng đánh giá khách sạn dựa thang điểm 10 cho hạng mục: sẽ, vị trí, nhân viên, sở hạ tầng Từ hạng mục bình chọn có điểm bình chọn cho khách sạn Ngoài người dùng viết nhận xét khách sạn ngữ cảnh mà người dùng sử dụng hệ thống khách sạn Từ thông tin cần thiết liên quan đến bình chọn nhận xét, hệ thống lưu lại thông tin sở liệu dùng để thực chức gợi ý cho lược người dùng truy cập sau Các đối tượng hệ thống: - Thành viên: Các thông tin như: họ tên, năm sinh, giới tính, email, tên đăng nhập mật - Khách sạn: thông tin gồm: tên địa điểm khách sạn, địa chỉ, hình ảnh đại diện, số thông tin khác - Thông tin ngữ cảnh: người cùng, thời gian, mục đích, thời tiết, vị trí khoảng cách người dùng - Thông tin đánh giá: người dùng đăng nhập thành viên họ tham gia đánh giá xếp hạng, quyền bình luận xem bình luận 47 thành viên khác Thông tin đánh giá bao gồm: khách sạn đánh giá người dùng, thông tin ngữ cảnh, kết đánh giá, ngày đánh giá Hệ thống phân quyền cho nhóm người dùng thành viên quản trị Trong nhóm người quản trị có đầy đủ quyền hệ thống như: cập nhật thông tin khách sạn, thống kê số lượt truy cập trung bình đánh giá khách sạn, thống kê số lượt đánh giá liệt kê đánh giá thành viên,… nhóm thành viên có số quyền hệ thống như: Xem thông tin khách sạn, đánh giá xếp hạng bình luận, hệ thống gợi ý đường Khi sử dụng chức gợi ý, hệ thống gợi ý dựa theo ngữ cảnh điều kiện mà họ muốn: mục đích: nghỉ lễ, người cùng: gia đình, thời gian: ngày cuối tuần Hệ thống gợi ý cho người dùng khách sạn phù hợp với ngữ cảnh mà người dùng chọn có nhiều người đánh giá cao (trung bình đánh giá cao nhất) Hệ thống cài đặt Web thiết kế theo mô hình MVC (Model View Controller) dùng ngôn ngữ lập trình PHP kết hợp với hệ quản trị sở liệu MySQL Sơ đồ kiến trúc hệ thống mô tả sau Hình 3.1 Sơ đồ kiến trúc hệ thống 48 3.2 PHÂN TÍCH, THIẾT KẾ, XÂY DỰNG HỆ THỐNG GỢI Ý TRA CỨU KHÁCH SẠN THEO NGỮ CẢNH 3.2.1 Sơ đồ ngữ cảnh Hình 3.2 Sơ đồ ngữ cảnh 3.2.2 Biểu đồ phân rã chức Với mô tả toán trên, xây dựng mô hình chức hệ thống gồm ba chức chính: • Chức đăng ký: Người dùng truy cập vào hệ thống website đăng ký đăng nhập vào hệ thống website • Chức đánh giá: Khi người dùng truy cập vào hệ thống website phải đăng ký đăng nhập đánh giá khách sạn theo tiêu chí ngữ cảnh tương ứng người dùng • Chức gợi ý: Khi người dùng đánh giá xong Những thông tin đánh giá hệ thống xử lý lưu vào database dùng để gợi ý người dùng khác truy cập vào hệ thống đưa khách sạn phù hợp cho ngữ cảnh người dùng 49 Hình 3.3 Sơ đồ chức hệ thống 3.2.3 Biểu đồ luồng liệu - Sơ đồ luồng liệu mức 0: Hình 3.4 Sơ đồ luồng liệu mức 50 - Sơ đồ luồng liệu mức 1: Hình 3.5 Sơ đồ luồng liệu mức - Sơ đồ luồng liệu mức 2: Hình 3.6 Sơ đồ luồng liệu mức 51 - Sơ đồ luồng liệu mức 3: Hình 3.7 Sơ đồ luồng liệu mức 3.2.4 Cơ sở liệu hệ thống Hình 3.8 Sơ đồ sở liệu 52 3.2.5 Một vài giao diện minh hoạ cho hệ thống Hình 3.9 Giao diện website Hình 3.10 Chi tiết khách sạn 53 Hình 3.11 Giao diện vị trí đồ khách sạn Khách hàng đánh giá chấm điểm cho khách sạn Dựa vào điểm mà khách hàng đánh giá hệ thống dự đoán sản phẩm mà khách hàng thích.Ngoài khách hàng gửi nội dung đánh giá cho khách sạn Đây hình thức gợi ý cho khách hàng chọn khách sạn (Hình 3.12) Hình 3.12 Giao diện đánh giá người dùng 54 Một thách thức hệ thống gợi ý vấn đề người dùng (new user) mục tin (new item)-do họ chưa có thông tin đánh giá khứ nên giải thuật dự đoán Trong nghiên cứu này, đề xuất giải vấn đề người dùng cách đưa khách sạn nhiều người đánh giá cao phù hợp với sở thích người dùng dựa vào ngữ cảnh người dùng theo chủ đề mà họ quan tâm (Hình 3.13) Hình 3.13 Giao diện gợi ý cho người dùng theo thể loại Sau người dùng chọn thông tin ngữ cảnh chủ đề mà quan tâm hệ thống vào để gợi ý Người dùng thay đổi phạm vi vị trí hai để gợi ý khác phù hợp hơn.(Hình 3.14) 55 Hình 3.14 Giao diện tìm kiếm theo ngữ cảnh vị trí Hình 3.15 Kết gợi ý theo ngữ cảnh vị trí 3.3 ĐÁNH GIÁ Dữ liệu: Tạo liệu đánh giá người dùng cho điểm khách sạn phạm vi thành phố Huế Tập liệu gồm 50 người dùng (users), 30 điểm du lịch (items) 100 đánh giá (ratings - từ đến 10 tương ứng với mức độ thích từ thấp 56 đến cao) Các ngữ cảnh mà người dùng chọn “Bạn đồng hành”, “thời điểm”, “thời tiết”, “vị trí” “phạm vi” Độ đo: Để đánh giá hiệu giải thuật (hay tổng quát hệ thống), ta sử dụng độ đo phổ biến mà cộng đồng người dùng lĩnh vực hệ thống gợi ý thường sử dụng Root Mean Squared Error (RMSE) Đây độ đo hay dùng dự đoán xếp hạng (rating prediction) – lĩnh vực nghiên cứu RMSE xác định qua công thức: RMSE = ∑ ( u ,i , r )∈DTest (r −rˆu ,i ) DTest Trong đó: Dtest ⊆ ( U x I x R) tập liệu dùng để đánh giá (u, i, r) tương ứng user, item rating; r giá trị đánh giá thực tế rˆu ,i giá trị dự đoán tương ứng user u item i Kết đánh giá dựa độ đo RMSE: Bảng 3.1 Kết đánh giá dựa công thức RMSE 57 Kết thực nghiệm tập thực với n=10 hình Dựa theo kết RMSE = 0.2932 cho thấy phương pháp gợi ý theo ngữ cảnh có độ tin cậy cao có nghĩa số RMSE thấp hệ thống gợi ý xác Các giá trị đo lường hệ thống đạt hiệu tốt Giá trị cao hiệu hệ thống thấp 3.4 TIỂU KẾT CHƯƠNG Trong chương luận văn tập trung cài đặt ứng dụng hệ thống gợi ý theo ngữ cảnh vào việc tìm kiếm khách sạn Một số kết chạy mô với mục đích cho thấy ưu điểm hệ thống gợi ý theo ngữ cảnh Hệ thống gợi ý khách sạn theo ngữ cảnh xây dựng hoàn chỉnh thực nghiệm từ phản hồi người dùng cho thấy hệ thống đưa lời gợi ý phù hợp với ngữ cảnh người dùng 58 KẾT LUẬN Như biết gần hệ thống gợi ý trở thành vấn đề nghiên cứu có ý nghĩa Trong luận văn này, trình bày về: • Bước đầu tìm hiểu hệ thống gợi ý kỹ thuật lọc cộng tác • Tiếp theo giải pháp xây dựng hệ thống gợi ý dựa vào thông tin ngữ cảnh, từ áp dụng vào toán gợi ý khách sạn • Cuối luận văn tiến hành cài đặt ứng dụng việc gợi ýkhách sạn theo ngữ cảnh Hệ thống gợi ý khách sạn theo ngữ cảnh xây dựng hoàn chỉnh thực nghiệm từ phản hồi người dùng đưa lời gợi ý phù hợp với ngữ cảnh người dùng Hướng phát triển Hệ thống tiếp tục mở rộng theo hướng như: Phát triển hệ thống tảng thiết bị di dộng thông minh, ứng dụng GPS để định vị xác giúp cho chức dẫn đường hiệu hơn, phát triển thêm chức khác kèm theo cho hệ thống như: gợi ý nhà hàng - ẩm thực, gợi ý, Việc gợi ý theo ngữ cảnh mở rộng sang nhiều lĩnh vực khác như: âm nhạc, phim ảnh, bán hàng trực tuyến, Tuy nhiên ứng dụng cụ thể ta cần xác định yếu tố ngữ cảnh cho phù hợp 59 TÀI LIỆU THAM KHẢO Tiếng Việt: [1] Lư Chân Thiện Nguyễn Thái Nghe (2015) Một tiếp cận xây dựng hệ thống gợi ý theo ngữ cảnh Kỷ yếu Hội nghị quốc gia lần thứ VIII "Nghiên cứu ứng dụng Công nghệ thông tin" (FAIR 2015) Tiếng Anh: [2] Damianos Gavalas, Charalampos Konstantopoulos, Konstantinos Mastakas; Grammati Pantziou (2014) Mobile recommender systems in tourism, Journal of Network and Computer Application, Pages 319-333 [3] Francesco Ricci, Lior Rokach, Bracha Shapira; Paul B Kantor (2011) Recommender Systems Handbook, pages 217-250 [4] Gediminas Adomavicius and Alexander Tuzhilin (2008) Context-aware recommender systems In Proceedings of the 2008 ACM RecSys '08 ACM, New York, 335-336 [5] G.Linden, B Smith and J York Amazon.com recommendations: Item - item collaborative filtering IEEE Internet Comput, 2003 [6] José M Noguera, Manuel J Barranco, Rafael J Segura, Luís Martínez (2012) A Mobile 3D-GIS Hybrid Recommender System for Tourism Journal Information Sciences: an International Journal Volume 215, December, 2012, pp 37-52 [7] Yehuda Koren, Robert Bell and Chris Volinsky (2009) Matrix Factorization Techniques for Recommender Systems Computer 42, (August 2009), 30-37 [8] Kostas Stefanidis, Evaggelia Pitoura, Panos Vassiliadis (2007) A context‐ aware preference database system International Journal of Pervasive Computing and Communications, Vol Iss: 4, pp.439 – 460 60 [9] X Su, T M Khoshgoftaar (2009) A Survey of Collaborative Filtering Techniques Advances in Artificial Intelligence, vol 2009, pp.1-20 61

Ngày đăng: 26/07/2016, 12:41

TỪ KHÓA LIÊN QUAN

TÀI LIỆU CÙNG NGƯỜI DÙNG

TÀI LIỆU LIÊN QUAN

w