Đồ án tốt nghiệp bài toán khai thác thông tin về sản phẩm từ web

58 21 0
Đồ án tốt nghiệp  bài toán khai thác thông tin về sản phẩm từ web

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng MỤC LỤC MỤC LỤC DANH SÁCH CÁC HÌNH GIỚI THIỆU CHƢƠNG 1: CƠ SỞ LÝ THUYẾT 1.1CÁC KHÁI NIỆM CƠ BẢN 1.2 KHÁM PHÁ TRI THỨC TRONG CƠ SỞ DỮ LIỆU 1.3 CÁC KỸ THUẬT ÁP DỤNG TRONG KHAI PHÁ DỮ LIỆU 11 1.3.1 Các kỹ thuật tiếp cận Khai phá liệu 11 1.3.2 Các dạng liệu khai phá 12 1.4TÌM KIẾM THÔNG TIN TRÊN INTERNET .12 1.5 PHÂN LOẠI THƠNG TIN TÌM KIẾM 15 1.6TỔ CHỨC LƢU TRỮ THƠNG TIN TÌM KIẾM 17 1.7XỬ LÝ THÔNG TIN 17 CHƢƠNG 2: KHAI PHÁ VÀ TỔNG HỢP DỮ LIỆU 19 2.1 PHÂN CỤM DỮ LIỆU 19 2.2 CÁC ỨNG DỤNG CỦA PHÂN CỤM DỮ LIỆU 20 2.3 CÁC KIỂU DỮ LIỆU VÀ ĐỘ ĐO TƢƠNG TỰ 21 2.3.1 Phân loại kiểu liệu dựa kích thƣớc miền 21 2.3.2 Phân loại kiểu liệu dựa hệ đo 21 2.4 CÁC YÊU CẦU CẦN THIẾT CHO TẠO DỤNG KỸ THUẬT PCDL 22 2.5 MỘT SỐ THUẬT TỐN PHÂN CỤM DỮ LIỆU ĐIỂN HÌNH 24 2.5.1 Họ thuật toán phân hoạch 24 2.5.2 Các thuật toán phân cụm phân cấp 28 2.5.3 Các thuật toán phân cụm dựa mật độ 31 CHƢƠNG 3: HỆ THỐNG ĐÁNH GIÁ THÔNG TIN SẢN PHẨM 35 3.1 Phát biểu toán .35 3.2 Xác định mô hình nghiệp vụ 36 3.2.1 Các chức nghiệp vụ 36 3.2.2 Biểu đồ Use Case tổng quan 37 3.2.3 Mô tả khái quát hệ 38 3.2.4 Các mô hình ca sử dụng chi tiết 39 3.3 Phân tích hệ thống 43 3.3.2 Phân tích gói ca sử dụng “Cập nhật danh mục” 43 3.3.3 Phân tích gói ca sử dụng “Tìm kiếm” 49 3.3.4 Phân tích gói ca sử dụng “Báo cáo” 51 3.4 Thiết kế hệ thống 52 3.5 Thiết kế chƣơng trình 53 3.5.1 Giao diện chƣơng trình 53 3.5.2 Giao diện cập nhật sản phẩm 53 3.5.3 Giao diện cập nhật loại sản phẩm 54 3.5.4 Giao diện cập nhật nhóm sản phẩm 55 3.5.5 Giao diện tìm kiếm thơng tin sản phẩm 56 3.5.6 Kết chƣơng trình minh họa 56 KẾT LUẬN 57 Nguyễn Văn Huy – CT1301 Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng TÀI LIỆU THAM KHẢO 58 Nguyễn Văn Huy – CT1301 Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng DANH SÁCH CÁC HÌNH Hình 1.1:Các bƣớc thực q trình khám phá tri thức 10 Hình 1.2 Các lĩnh vực liên quan đến Khám phá tri thức CSDL 11 Hình 1.3: Sơ đồ khối Khối truy vấn 13 Hình1.4: Sơ đồ khối Đánh mục 14 Hình2.1:Hình minh họa phân cụm liệu 19 Hình2.2: Hình dạng cụm liệu khám phá đƣợc k-means 25 Hình 2.3:Cây CF đƣợc sử dụng thuật toán BIRCH 28 Hình 2.4:Các cụm liệu đƣợc khám phá CURE 30 Hình 2.5: Hình minh họa phân cụm OPTICS 33 Hình 2.6:Hình minh họa DENCLUE với hàm phân phối Gaussian .34 Hình 3.1: Biểu đồ Use Case tổng quan 37 Hình 3.2: Biểu đồ ca sử dụng gói “Cập nhật” 39 Hình 3.3: Biểu đồ ca sử dụng gói “Tìm kiếm” .39 Hình 3.4: Biểu đồ ca sử dụng gói “Báo cáo” 41 Hình 3.5: Biểu đồ thực thi ca sử dụng “Cập nhật nhóm sản phẩm” 44 Hình 3.6: Biểu đồ cộng tác thực thi ca sử dụng “Cập nhật nhóm sản phẩm” 44 Hình 3.7: Biểu đồ thực thi ca sử dụng “Cập nhật loạisản phẩm” .45 Hình 3.8: Biểu đồ cộng tác thực thi ca sử dụng “Cập nhật loạisản phẩm” .45 Hình 3.9: Biểu đồ thực thi ca sử dụng “Cập nhật sản phẩm” .46 Hình 3.10: Biểu đồ cộng tác thực thi ca sử dụng “Cập nhật sản phẩm” 46 Hình 3.11: Biểu đồ thực thi ca sử dụng “Cập nhật Search Engine” 47 Hình 3.12: Biểu đồ cộng tác thực thi ca sử dụng “Cập nhật Search Engine” .47 Hình 3.13: Biểu đồ thực thi ca sử dụng “Cập nhật thơng số tìm kiếm” 48 Hình 3.14: Biểu đồ cộng tác thực thi ca sử dụng “Cập nhật thơng số tìm kiếm” 48 Hình 3.15: Mơ hình phân tích gói ca “Cập nhật” 49 Hình 3.16: Biểu đồ thực thi ca sử dụng “Tìm kiếm” 49 Hình 3.17: Biểu đồ cộng tác thực thi ca sử dụng “Tìm kiếm” .50 Hình 3.18: Mơ hình phân tích gói ca”Tìm kiếm” 50 Hình 3.19: Biểu đồ thực thi ca sử dụng “Lập báo cáo” 51 Hình 3.20: Biểu đồ cộng tác thực thi ca sử dụng “Báo cáo” 51 Hình 3.21: Mơ hình phân tích gói ca”Báo cáo” 51 Hình 3.22: Mơ hình lớp thiết kế hệ thống 52 Hình 3.23 Giao diện chƣơng trình 53 Hình 3.24: Giao diện cập nhật sản phẩm 53 Hình 3.25: Giao diện cập nhật loại sản phẩm 54 Hình 3.26: Giao diện cập nhật nhóm sản phẩm 55 Nguyễn Văn Huy – CT1301 Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phịng Hình 3.27: Giao diện tìm kiếm thơng tin sản phẩm .56 Nguyễn Văn Huy – CT1301 Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng DANH SÁCH BẢNG BIỂU Bảng 3.1: Bảng xác định chức nghiệp vụ hệ thống 36 Bảng 3.2: Bảng xác định tác nhân hệ thống .37 Bảng 3.3: Bảng mô tả ca sử dụng tác nhân 38 Bảng 3.4: Bảng mơ tả ca sử dụng cập nhật nhóm sản phẩm 39 Bảng 3.5: Bảng mô tả ca sử dụng cập nhật loại sản phẩm 40 Bảng 3.6: Bảng mô tả ca sử dụng cập nhật sản phẩm 40 Bảng 3.7: Bảng mô tả ca sử dụng câp nhật Search Engine 41 Bảng 3.8: Bảng mô tả ca sử dụng cập nhật thơng số tìm kiếm 41 Bảng 3.9: Bảng mơ tả ca sử dụng tìm kiếm 42 Bảng 3.10: Bảng mô tả ca sử dụng báo cáo 43 Nguyễn Văn Huy – CT1301 Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng GIỚI THIỆU Web kho tài nguyên liệu khổng lồ, không ngừng tăng trƣởng với tốc độ cao Ngày nhiều thông tin sống đƣợc đƣa lên Internet Trong đó, Internet chứa nhiều thơng tin có giá trị liên quan đến cộng đồng nói chung, hoạt động sản xuất kinh doanh nói riêng.Xuất phát từ thực tế đó, có phƣơng pháp nào? Chúng ta khai thác thông tin từ Internet để phục vụ sống Hiện có nhiều cơng trình nghiên cứu phƣơng pháp khai thác thông tin từ Internet Xuất phát từ toán thực tế hoạt động kinh doanh thƣơng mại, liệu có phƣơng pháp đánh giá thông tin sản phẩm thông qua nhận xét ngƣời dùng Internet? Đây toán khó cần kết hợp nhiều kiến thức để giải tốn Do em chọn đề tài: “Bài tốn khai thác thơng tin sản phẩm từ Web”.Khóa luận tập trung tìm hiểu lý thuyết liên quan nhằm phần giải đƣợc vấn đề đặt Một hệ thống tổng hợp thông tin từ Internet cho phép ngƣời dùng đƣa vào thông tin cần đánh giá sản phẩm đƣợc quan tâm Sau đó, hệ thống đƣa đƣợc thông tin liên quan đến sản phẩm để hỗ trợ doanh nghiệp có thêm kênh thơng tin sản phẩm thị trƣờng Hệ thống đƣợc mô tả nhƣ sau: Nhập thông tin sản phẩm:Ngƣời dùng nhập thuật ngữ thông tin sản phẩm vào ô thông tin sản phẩm cần đánh giá Hệ thống trả thông tin sản phẩm mà hệ thống khai thác, phân loại, thống kê đƣợc thơng qua máy tìm kiếm Tìm kiếm thơng tin:Hệ thống dựa vào thơng tin sản phẩm đƣợc nhập vào gửi vào máy tìm kiếm để tìm Ý kiến người dùng sản phẩmhoặc Xu hướng Hỗ trợ đánh giá:Kết trả từ máy tìm kiếm đƣợc đem phân loại, thống kê thông tin cần thiết sản phẩm nhằm đánh giá cảm nhận người tiêu dùng sản phẩm đƣợc đƣa vào đánh giá Báo cáo:Hệ thống đƣa báo cáo ý kiến ngƣời sử dụng sản phẩm số liệu theo chuyên môn Nguyễn Văn Huy – CT1301 Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Giao diện hệ thống:Hệ thống có giao diện thân thiện, thuận lợi cho ngƣời dùng ngƣời quản lý Qua cách đặt vấn đề trên, khóa luận trình bày sau: Giới thiệu: Giới thiệu chung toán phạm vi khóa luận Chƣơng 1:Trình bày sở lý thuyết để thục khóa luận Chƣơng 2:Trình bày kiến thức liên quan đến tốn tìm kiếm thơng tin Internet dùng để trợ giúp hoạt động kinh doanh Chƣơng 3:Trình bày phần phân tích thiết kế ứng dụng mang tính chất thử nghiệm Kết luận Tài liệu tham khảo Nguyễn Văn Huy – CT1301 Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng CHƢƠNG 1: CƠ SỞ LÝ THUYẾT 1.1CÁC KHÁI NIỆM CƠ BẢN Khai phá liệu hƣớng nghiên đời thập niên trở lại đây.Các kỹ thuật đƣợc áp dụng lĩnh vực phần lớn đƣợc thừa kế từ lĩnh vực Cơ sở liệu,học máy, trí tuệ nhân tạo, lý thuyết thông tin, xác suất thống kê, tính tốn hiệu cao Do phát triển nhanh Khai phá liệu phạm vi áp dụng phƣơng pháp tìm kiếm tri thức, nên có nhiều quan điểm khác Khai phá liệu Tuy nhiên, mức trừu tƣợng định, theo [1] khái niệm Khai phá liệu nhƣ sau: “Khai phá liệu trình tìm kiếm, phân tích, phát tri thức mới, tiềm ẩn, hữu dụng sở liệu lớn.” Trong lĩnh vực khai phá liệu, có nhiều hƣớng nghiên cứu đƣợc đƣa có số hƣớng đƣợc nhiều nhà nghiên cứu quan tâm Khai phá liệu văn bản,Web, Trích chọn thơng tin, Phân tích mạng xã hội, khai phá quan điểm, Phân tích liệu kinh tế - tài chính, Khai phá liệu sinh học, y tế,… Khóa luận hƣớng đến việc tìm hiểu xây dựng hệ thống thống nhằm khai thác thông tin sản phẩm mà ngƣời tiêu dùng đánh giá Internet, cụ thể trang web Ngƣời tiêu dùng có mua, sử dụng sản phẩm họ có cảm nhận suy nghĩ sản phẩm Đơi lúc họ đƣa cảm nhận sản phẩm lên trang web cá nhân, diễn đàn, … Internet Bài tốn mà khóa luận tìm cách giải tìm cách khai thác thơng tin sản phẩm cụ thể Internet, thống kê để phục vụ cho công tác khảo sát đánh giá sản phẩm thị trƣờng Sau số khái niệm đƣợc sử dụng Thông tin sản phẩm: Là thơng tin mơ tả nguồn gốc, tính kỹ thuật, tính chất lý hóa tính, cơng dụng chính, giá thành, màu sắc, hình dáng, kích thƣớc, … sản phẩm Nguyễn Văn Huy – CT1301 Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Ý kiến ngƣời dùng sản phẩm: Là thông tin ngƣời dùng phản ánh sản phẩm đƣợc thể qua từ đánh giá ƣu điểm nhƣ: Tốt, thuận tiện, tiết kiệm, bền, rẻ, đẹp, phong phú, đa dạng, mƣợt mà, mịn, … đƣợc đánh giá nhƣợc điểm: Xấu, kém, mau hỏng, hàng giả, hàng nhái, … đƣợc thể mong muốn sản phẩm qua từ nhƣ: giá nhƣ, giá mà, cần, phải, để tốt hơn, … Xu hƣớng: Là từ liên quan đến mong muốn ngƣời dùng sản phẩm Đƣợc chi thành xu hƣớng tốt xấu không thiện cảm + Xu hƣớng tốt: Xu hƣớng đánh giá thông tin sản phẩm tốt + Xu hƣớng xấu: Xu hƣớng đánh giá thông tin sản phẩm xấu + Xu hƣớng không thiện cảm: Xu hƣớng không khen, không chê sản phẩm Ngƣời tiêu dùng: Là ngƣời mua ngƣời sử dụng sản phẩm ngƣời có ý định mua hay sử dụng sản phẩm có gửi thơng tin lên Internet Ngƣời dùng: Ngƣời có tƣơng tác với hệ thống Ngƣời quản trị: Ngƣời có nhiệm vụ quản lý hệ thống Máy tìm kiếm:Các cỗ máy tìm kiếm thơng tin Internet: Google, Yahoo, Bing, … Sản phẩm: Là tất mặt hàng đƣợc tiêu thụ thị trƣờng bao gồm thị trƣờng nƣớc nƣớc 1.2 KHÁM PHÁ TRI THỨC TRONG CƠ SỞ DỮ LIỆU Khai phá liệu lĩnh vực có liên quan đến nhiều ngành khác nhƣ: thống kê, học máy, tính tốn phân tán,cơ sở liệu, thuật tốn, mơ hình hóa liệu,… Mục tiêu khai phá liệu khám phá tri thức từ dùng hỗ trợ định, lĩnh vực hẹp đƣợc chia thành số giai đoạn [3][4]:  Trích chọn liệu: bƣớc trích liệu cần đƣợc khám phá từ hệ thống liệu (databases, data warehouses, data repositories) ban đầu theo số tiêu chí định Nguyễn Văn Huy – CT1301 Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng  Tiền xử lý liệu:Bƣớc làm liệu (xử lý liệu dƣ thừa, nhiễu, v.v.), rút gọn liệu (áp dụng thuật tốn lấy mẫu, v.v.), rời rạc hóa liệu Kết liệu quán, đầy đủ, đƣợc rút gọn, đƣợc rời rạc hóa  Biến đổi liệu:Đây bƣớc chuẩn hóa liệu, tinh chỉnh liệu để đƣa liệu dạng chuẩn để giúp kỹ thuật khai phá liệu bƣớc sau  Khai phá liệu: Áp dụng kỹ thuật phân tích nhằm để trích chọn thơng tin, mối liên hệ đặc biệt liệu Bƣớc quan trọng cần nhiều tài nguyên tồn q trình khai phá trin thức  Đánh giá biểu diễn tri thức: Các mẫu tin quan hệ chúng đƣợc rút trích bƣớc đƣợc mã hóa biểu diễn theo dạng dễ quan sát nhƣ đồ thị, cây, bảng biểu, luật, v.v Bƣớc cung cấp thông tin cho nhà quản trị định Các giai đoạn KDD đƣợc thể trực quan nhƣ hình dƣới đây: Hình 1.1:Các bước thực trình khám phá tri thức Nguyễn Văn Huy – CT1301 10 Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phịng Hình 3.5: Biểu đồ thực thi ca sử dụng “Cập nhật nhóm sản phẩm” Biểu đồ cộng tác thực thi ca sử dụng Hình 3.6: Biểu đồ cộng tác thực thi ca sử dụng “Cập nhật nhóm sản phẩm” Nguyễn Văn Huy – CT1301 44 Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng 3.3.2.2 Ca sử dụng “Cập nhật loại sản phẩm” Biểu đồ thực thi ca sử dụng Hình 3.7: Biểu đồ thực thi ca sử dụng “Cập nhật loạisản phẩm” Biểu đồ cộng tác thực thi ca sử dụng Hình 3.8: Biểu đồ cộng tác thực thi ca sử dụng “Cập nhật loạisản phẩm” 3.3.2.3 Ca sử dụng “Cập nhật sản phẩm” Biểu đồ thực thi ca sử dụng Nguyễn Văn Huy – CT1301 45 Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Hình 3.9: Biểu đồ thực thi ca sử dụng “Cập nhật sản phẩm” Biểu đồ cộng tác thực thi ca sử dụng Hình 3.10: Biểu đồ cộng tác thực thi ca sử dụng “Cập nhật sản phẩm” Nguyễn Văn Huy – CT1301 46 Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng 3.3.2.4 Ca sử dụng “Cập nhật Search engine” Biểu đồ thực thi ca sử dụng Hình 3.11: Biểu đồ thực thi ca sử dụng “Cập nhật Search Engine” Biểu đồ cộng tác thực thi ca sử dụng Hình 3.12: Biểu đồ cộng tác thực thi ca sử dụng “Cập nhật Search Engine” Nguyễn Văn Huy – CT1301 47 Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phịng 3.3.2.5 Ca sử dụng “Cập nhật thơng số tìm kiếm” Biểu đồ thực thi ca sử dụng Hình 3.13: Biểu đồ thực thi ca sử dụng “Cập nhật thơng số tìm kiếm” Biểu đồ cộng tác thực thi ca sử dụng Hình 3.14: Biểu đồ cộng tác thực thi ca sử dụng “Cập nhật thơng số tìm kiếm” Nguyễn Văn Huy – CT1301 48 Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng 3.3.2.6 Mơ hình phân tích gói ca sử dụng “Cập nhật” Hình 3.15: Mơ hình phân tích gói ca “Cập nhật” 3.3.3 Phân tích gói ca sử dụng “Tìm kiếm” 3.3.3.1 Ca sử dụng “Nhận lệnh tìm kiếm” Biểu đồ thực thi ca sử dụng Hình 3.16: Biểu đồ thực thi ca sử dụng “Tìm kiếm” Nguyễn Văn Huy – CT1301 49 Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng Biểu đồ cộng tác thực thi ca sử dụng Hình 3.17: Biểu đồ cộng tác thực thi ca sử dụng “Tìm kiếm” 3.3.3.2 Mơ hình phân tích gói ca sử dụng “Tìm kiếm” Hình 3.18: Mơ hình phân tích gói ca”Tìm kiếm” Nguyễn Văn Huy – CT1301 50 Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng 3.3.4 Phân tích gói ca sử dụng “Báo cáo” 3.3.4.1 Ca sử dụng “Lập báo cáo” Biểu đồ thực thi ca sử dụng Hình 3.19: Biểu đồ thực thi ca sử dụng “Lập báo cáo” Biểu đồ cộng tác thực thi ca sử dụng Hình 3.20: Biểu đồ cộng tác thực thi ca sử dụng “Báo cáo” 3.3.4.2 Mơ hình phân tích gói ca sử dụng “Báo cáo” Hình 3.21: Mơ hình phân tích gói ca”Báo cáo” Nguyễn Văn Huy – CT1301 51 Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phịng 3.4 Thiết kế hệ thống Hình 3.22: Mơ hình lớp thiết kế hệ thống Nguyễn Văn Huy – CT1301 52 Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phịng 3.5 Thiết kế chƣơng trình Chƣơng trình viết ngơn ngữ lập trình C# Chƣơng trình sử dụng hệ quản trị sở dũ liệu SQL 2008 3.5.1 Giao diện chƣơng trình Hình 3.23 Giao diện chương trình Giao diện cung cấp thơng tin chƣơng trình menu thực cơng việc 3.5.2 Giao diện cập nhật sản phẩm Hình 3.24: Giao diện cập nhật sản phẩm Giao diện đƣợc mở từ menu “Sản phẩm” giao diện Nguyễn Văn Huy – CT1301 53 Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phịng Khi cập nhật sản phẩm cần chọn tên nhóm từ “tên nhóm”, tên loại sản phẩm từ “tên loại”, nhập tên sản phẩm vào ô “tên sản phẩm”, nhập đặc điểm sản phẩm vào ô “đặc điểm” Nút “lƣu” để lƣu thông tin Nhấn nút “thêm” để nhập sản phẩm Nhấn chuột phải vào loại sản phẩm , chọn “Xóa” muốn xóa sản phẩm, chọn “Sửa” muốn sửa sản phẩm 3.5.3 Giao diện cập nhật loại sản phẩm Hình 3.25: Giao diện cập nhật loại sản phẩm Giao diện đƣợc gọi từ menu “Loại sản phẩm ” giao diện Khi cập nhật loại sản phẩm cần chọn tên nhóm sản phẩm từ “tên nhóm”, nhập tên loại sản phẩm vào ô “loại sản phẩm” Nhấn nút “Lƣu” để lƣu thông tin Nút thêm để thêm loại Nhấn chuột phải vào loại sản phẩm , chọn “Xóa” muốn xóa nhóm sản phẩm, chọn “Sửa” muốn sửa loại sản phẩm Nguyễn Văn Huy – CT1301 54 Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng 3.5.4 Giao diện cập nhật nhóm sản phẩm Hình 3.26: Giao diện cập nhật nhóm sản phẩm Giao diện đƣợc gọi từ menu “Nhóm SP” từ giao diện Khi cập nhật nhóm sản phẩm cần nhập tên nhóm vào “tên nhóm” Nút lƣu để lƣu thông tin Nhấn nút “Thêm” để thêm nhóm Nhấn chuột phải vào nhóm sản phẩm , chọn “Xóa” muốn xóa nhóm sản phẩm, chọn “Sửa” muốn sửa nhóm sản phẩm Nguyễn Văn Huy – CT1301 55 Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phịng 3.5.5 Giao diện tìm kiếm thơng tin sản phẩm Hình 3.27: Giao diện tìm kiếm thơng tin sản phẩm Ô “Số KQ Google” dung để nhập số kết tìm kiếm mong muốn Chọn nhóm sản phẩm từ “Tên nhóm”, chọn tên loại sản phẩm từ “Tên loại”, chọn sản phẩm từ “Tên sản phẩm”, tích chọn đặc điểm ô đặc điểm Nút “ ” để sửa sản phẩm chọn Nhấn “Tim kiếm” để bắt đâu tìm kiếm Chọn chuỗi tìm kiếm “Chuỗi tìm kiếm”, nhấn nút “Thống kê” để xem kết thống kê cho chuỗi tìm kiếm Nút “Thốt” để khỏi giao diện trở giao diện 3.5.6 Kết chƣơng trình minh họa - Chƣơng trình giải đƣợc vấn đề mà tốn đƣa tìm kiếm đƣợc đánh giá vế sản phẩm web Chƣơng trình xây dựng đƣợc chức mà toán đƣa  Cập nhật, thêm mới, xóa lƣu thơng tin sản phẩm, chuỗi tìm kiếm, kết tìm kiếm  Cho phép tìm kiếm đánh giá tự động Có chức hiển thị số lƣợng đánh giá Nguyễn Văn Huy – CT1301 56 Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng KẾT LUẬN Đề tài tìm kiếm thơng tin sản phẩm Web cơng việc thú vị Nó thể rõ việc áp dụng công nghệ thông tin vào lĩnh vực khác đem lại kết cao Khóa luận đạt số kết nhƣ sau: Trình bày khái niệm lĩnh vực khai phá liệu từ giúp cho việc hiểu rõ toán cần đƣợc giải nhƣ Khóa luận tổng hợp số thuật tốn liên quan đến lĩnh vực khai phá liệu phân tích,thiết kế, xây dựng chƣơng trình minh họa ứng dụng tìm kiếm thơng tin sản phẩm Web, nhằm giúp nhà quản lý định tốt sản phẩm nhóm sản phẩm họ định triển khai thị trƣờng Với cách trình bày từ khái niệm đến cách thức xây dựng hệ thống tìm kiếm thông tin sản phẩm Web giúp cho em bổ sung nhiều kiến thức liên quan đến thực tế nghề nghiệp Nguyễn Văn Huy – CT1301 57 Đồ án tốt nghiệp Trƣờng ĐHDL Hải Phòng TÀI LIỆU THAM KHẢO Tiếng Việt [1] Hà Quang Thụy, Phan Xuân Hiếu - Đồn Sơn - Ngun Trí Thành Nguyễn Thu Trang - Nguyễn Cầm Tú, Giáo trình khai phá liệu web, NXBGDVN, 2009, 313 tr [2] Lê Văn Phùng, Quách Xuân Trƣởng, Khai phá liệu, NXB TT-TT, 2012, 320 tr Tiếng Anh [3] W Bruce Croft,Donald Metzler,Trevor Strohman, Search Engines: Information Retrieval in Practice,Addison-Wesley, 2008,524p [4] Alan Rea, Data Mining – An Introduction The Parallel Computer Centre, Nor of The Queen’s University of Belfast, 1995 [5] Jiawei Han and Micheline Kamber, Data Mining:Concepts andTechniques, Hacours Science and Technology Company, USA, 2005 [6] Usama M Fayyad, Gregory Piatetsky-Shapiro, Padhraic Smyth, and Ramasamy Uthurusamy, Advances in Knowledge Discovery and Data Mining, AAAI Press- The MIT Press, 1996 [7] Jiawei Han and Micheline Kamber (2001), Data Mining: Concepts and Techniques, Hacours Science and Technology Company, USA [8] J.Han, M.Kamber and A.K.H Tung (2002), Spatial Clustering Methods in Data mining: A Survey, Simon Fraster University, Canada Nguyễn Văn Huy – CT1301 58 ... chứa địa Website có chứa thơng tin bút bi, Thuộc tính Contentchứa văn thông tin loại bút bị có Website Vanphongphamt2.com, đơi cịn có lẫn thẻ định dạng HTML trang Web Dữ liệu liệu thô Các tin đƣợc... Trong lĩnh vực khai phá liệu, có nhiều hƣớng nghiên cứu đƣợc đƣa có số hƣớng đƣợc nhiều nhà nghiên cứu quan tâm Khai phá liệu văn bản ,Web, Trích chọn thơng tin, Phân tích mạng xã hội, khai phá quan... Sorting: Sắp xếp kết tìm kiếm theo độ liên quan, phân cụm theo địa web, theo thứ tự thời gian, kích thước 1.5 PHÂN LOẠI THƠNG TIN TÌM KIẾM Bài tốn phâncụm thơng tinlà tốn quan trọng lĩnh vực khai

Ngày đăng: 07/04/2020, 14:08

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan