HỌC VIỆN CƠNG NGHỆ BƯU CHÍNH VIỄN THƠNG - LÊ THỊ CẨM TÚ KẾT HỢP KỸ THUẬT PHÂN CỤM VÀ MÔ HÌNH MARKOV ĐỂ DỰ ĐỐN TRUY CẬP WEB Chun ngành: Truyền liệu mạng máy tính Mã số: 60.48.15 TÓM TẮT LUẬN VĂN THẠC SĨ KỸ THUẬT NGƯỜI HƯỚNG DẪN KHOA HỌC : PGS TS TRẦN ĐÌNH QUẾ HÀ NỘI - 2011 MỞ ĐẦU Trong năm gần đây, Web sử dụng rộng rãi nhiều lĩnh vực khác thương mại, giải trí, giáo dục, y tế Do tính phổ biến dẫn đến lưu lượng truy cập lớn Internet Hầu hết người dùng sử dụng trình duyệt web để điều khiển trang web di chuyển đến trang Web theo siêu liên kết mà họ nghĩ có liên quan với trang bắt đầu trang họ tìm thấy thơng tin cần tìm kiếm hay nhiều trang [10] Mỗi ngày, máy chủ Web phải thu nhận số lượng lớn liệu Việc rút dấu vết người sử dụng so sánh chúng với mục đích sử dụng web người dùng để dự đoán truy cập người sử dụng nhằm chuẩn bị sẵn tài nguyên phù hợp với thao tác người dùng, giúp tối ưu hóa cấu trúc mạng Nếu dự đốn xác truy cập người sử dụng chuẩn bị sẵn tài nguyên phù hợp độ trễ mạng giảm đáng kể [9] Trên thực tế có nhiều kỹ thuật sử dụng để khai phá sử dụng web nhằm dự đốn truy cập người sử dụng mơ hình Markov, Xích Markov, luật kết hợp ([1 11]) Tuy nhiên, sử dụng mơ hình Markov thấp cho kết dự đốn độ xác khơng cao; sử dụng mơ hình Markov bậc cao Xích Markov cho kết dự đốn độ xác cao chúng phải tính tốn với khơng gian trạng thái phức tạp; sử dụng luật kết hợp có nhược điểm có q nhiều luật, khơng dễ dàng để tìm thấy tập luật thích hợp để đưa dự đốn[9] u cầu đặt tìm phương pháp khai phá sử dụng Web nhằm dự đoán truy cập người sử dụng mà cho kết dự đoán độ xác cao mà lại khơng liên kết với khơng gian trạng thái phức tạp Chính vậy, luận văn lựa chọn chủ đề “Kết hợp kỹ thuật phân cụm mơ hình Markov để dự đốn truy cập Web” làm đề tài nghiên cứu Đề tài tập trung nghiên cứu việc kết hợp kỹ thuật phân cụm cách chia liệu thành cụm trước đưa vào thực hiện, sau đó, sử dụng mơ hình Markov bậc thấp cho cụm liệu thay phải thực với tồn tập liệu Luận văn cấu trúc sau: Chương Khai phá liệu Web Phần tập trung vào trình bày kiến trúc chung cho trình khai phá Web tập trung tìm hiểu trình khai phá việc sử dụng Web, kỹ thuật khai phá việc sử dụng Web Chương Một số kỹ thuật dự đoán Chương nghiên cứu số kỹ thuật dự đốn thường sử dụng: Mơ hình Markov, thuật tốn phân cụm K – means; số hạn chế sử dụng Mơ hình Markov kỹ thuật phân cụm K- means Với hạn chế đó, ta kết hợp mơ hình Markov với kỹ thuật phân cụm nhằm giảm không gian trạng thái phức tạp cho kết độ xác dự đốn cao Chương Cài đặt thử nghiệm Mục đích chương giới thiệu chương trình thử nghiệm IMC đánh giá Kết luận Trình bày, đánh giá kết đạt đề xuất hướng phát triển luận văn ... số kỹ thuật dự đốn thường sử dụng: Mơ hình Markov, thuật toán phân cụm K – means; số hạn chế sử dụng Mơ hình Markov kỹ thuật phân cụm K- means Với hạn chế đó, ta kết hợp mơ hình Markov với kỹ thuật. .. độ xác cao mà lại không liên kết với không gian trạng thái phức tạp Chính vậy, luận văn lựa chọn chủ đề ? ?Kết hợp kỹ thuật phân cụm mô hình Markov để dự đốn truy cập Web? ?? làm đề tài nghiên cứu Đề... nguyên phù hợp độ trễ mạng giảm đáng kể [9] Trên thực tế có nhiều kỹ thuật sử dụng để khai phá sử dụng web nhằm dự đoán truy cập người sử dụng mơ hình Markov, Xích Markov, luật kết hợp ([1 11])