1. Trang chủ
  2. » Luận Văn - Báo Cáo

phát triển hệ thống thương mại điện tử Book store

75 23 0

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

THÔNG TIN TÀI LIỆU

Nội dung

Đồ án tốt nghiệp Mục lục 3.2.2 Quá trình cập nhật liệu 4647 3.2.3 Lập mục văn với Lucene 4748 3.2.4 Thuật toán tìm kiếm Inverted Index 4950 3.2.5 Thuật toán Vector Space Model 5051 3.2.6 Thuật toán TF-IDF 5152 3.3 Cấu hình cho Solr 5253 3.3.1 Câu trúc thư mục Solr 5253 3.3.2 Thư mục conf 5253 3.4 Truy vấn Solr 5758 3.4.1 Solr Request 5758 3.4.2 Solr response 5859 3.5 Sử dụng Apache Solr cho việc tìm kiếm thơng tin 5960 3.5.1 Tìm kiếm thơng tin 5960 3.5.2 Tìm kiếm thơng tin sử dụng Solr 5960 3.5.3 Tìm kiếm - gợi ý sử dụng Solr 6061 CHƯƠNG 4: PHÁT TRIỂN VÀ CÀI ĐẶT THỬ NGHIỆM 6263 4.1 Sơ Java Platform, Enterprise Edition 6263 4.2 J2EE API 6263 4.2.1 Java Database Connectivity (JDBC) 6364 4.2.2 Java Servlets 6364 4.2.3 Java Server Page (JSP) 6465 4.3 Môi trường cài đặt thử nghiệm 6566 4.3.1 Môi trường 6566 4.3.2 Cài đặt thử nghiệm 6566 4.4 Tích hợp Apache Solr vào hệ thống 6667 4.4.1 Dữ liệu cho việc tìm kiếm 6667 4.4.2 Kết tìm kiếm gợi ý 6667 KẾT LUẬN VÀ HƯỚNG PHÁT TRIỂN 6869 DANH MỤC CÁC TÀI LIỆU THAM KHẢO 7071 Lê Tất Doãn – D12CNPM2 v Đồ án tốt nghiệp Danh mục bảng DANH MỤC CÁC BẢNG Bảng 2-1: Bảng thuật ngữ 76 Bảng 2-2: Scenario Khách hàng đăng ký tài khoản 109 Bảng 2-3: Scenario Khách hàng tìm kiếm sách 1110 Bảng 2-4: Scenario Khách hàng xem sách 1110 Bảng 2-5: Scenario Khách hàng tạo giỏ hàng 1211 Bảng 2-6: Scenario Khách hàng tạo giỏ hàng 1312 Bảng 2-7: Scenario Khách hàng xóa giỏ hàng 1312 Bảng 2-8: Scenario Khách hàng tạo đơn đặt hàng 1413 Bảng 2-9: Scenario Khách hàng hủy bỏ đơn đặt hàng 1514 Bảng 2-10: Scenario Nhân viên nhập sách 1615 Bảng 2-11: Scenario Nhân viên sửa thông tin sách 1716 Bảng 2-12: Scenario Nhân viên thêm khuyến 1817 Bảng 2-13: Scenario Nhân viên sửa khuyến 1817 Bảng 2-14: Scenario Nhân viên áp dụng khuyến 1918 Bảng 2-15: Scenario Nhân viên xử lý đơn hàng 2019 Bảng 2-16: Scenario Nhân viên tạo loại khách hàng 2120 Bảng 2-17: Scenario Quản lý xem thống kê 2120 Bảng 2-18: Lớp thuộc tính lớp 3736 Bảng 3-1: Kiểu liệu Solr 5453 Bảng 3-2: Parameter truy vấn Solr 5857 Lê Tất Doãn – D12CNPM2 vi Đồ án tốt nghiệp Danh mục hình vẽ DANH MỤC CÁC HÌNH VẼ Hình 2-1: Sơ đồ Usecase tổng quan 76 Hình 2-2: Sơ đồ Usecase phía khách hàng 87 Hình 2-3: Sơ đồ Usecase phía Nhân viên 98 Hình 2-4: Sơ đồ Usecase phía Quản lý 98 Hình 2-5: Sơ đồ lớp thực thể pha phân tích 2221 Hình 2-6: Scenario khách hàng đăng ký tài khoản 2322 Hình 2-7: Scenario khách hàng tìm kiếm sách 2322 Hình 2-8: Scenario khách hàng xem sách 2423 Hình 2-9: Scenario khách hàng tạo giỏ hàng 2423 Hình 2-10: Scenario khách hàng xóa sản phẩm giỏ hàng 2524 Hình 2-11: Scenario khách hàng tạo đơn hàng 2625 Hình 2-12: Scenario khách hàng tạo đơn hàng (tiếp) 2726 Hình 2-13: Scenario khách hàng hủy bỏ đơn hàng 2827 Hình 2-14: Scenario nhân viên nhập sách 2827 Hình 2-15: Scenario nhân viên sửa thông tin sách 2928 Hình 2-16: Scenario nhân viên thêm khuyến 2928 Hình 2-17: Scenario nhân viên sửa khuyến 3029 Hình 2-18: Scenario nhân viên áp dụng khuyến 3130 Hình 2-19: Scenario nhân viên xử lý đơn hàng 3130 Hình 2-20: Scenario nhân viên tạo loại khách hàng 3231 Hình 2-21: Scenario quản lý xem thống kê 3231 Hình 2-22: Biể đồ lớp thực thể pha thiết kế 3332 Hình 2-23: Lược đồ sở liệu 3736 Hình 2-24: Giao diện trang chủ 3938 Hình 2-25: Giao diện trang đăng ký tài khoản 4039 Hình 2-26: Giao diện trang giỏ hàng 4140 Hình 2-27: Giao diện nhập thơng tin giao hàng 4241 Hình 2-28: Giao diện chọn toán 4241 Hình 2-29: Giao diện admin xem thống kê 4342 Hình 2-30: Giao diện admin xử lý đơn hàng 4342 Hình 3-1: Các hệ thống ứng dụng Solr tìm kiếm 4544 Hình 3-2: Kiến trúc tổng quát Solr 4544 Lê Tất Doãn – D12CNPM2 vii Đồ án tốt nghiệp Danh mục hình vẽ Hình 3-3: Kiến trúc index liệu Solr 4746 Hình 3-4: Index SQL 4847 Hình 3-5: Inverted index 4948 Hình 3-6 Vector Space Model 5049 Hình 3-7: Cây thư mục Solr 5251 Hình 3-8: Cấu trúc file data-config.xml 5352 Hình 3-9: Cấu trúc file schema.xml 5453 Hình 3-10: Analyer 5554 Hình 3-11: Thành phần file solrconfig.xml 5655 Hình 3-12: Luồng xử lý truy vấn 5756 Hình 3-13: Response JSON từ Solr 5857 Hình 4-1: Cấu trúc Servlets ứng dụng web 6463 Hình 4-2: Tích hợp Solr vào chức tìm kiếm sản phẩm 6665 Hình 4-3: Tích hợp Solr vào chức gợi ý sản phẩm liên quan 6766 Lê Tất Doãn – D12CNPM2 viii Đồ án tốt nghiệp Danh mục hình vẽ DANH MỤC CÁC TỪ VIẾT TẮT STT Từ viết tắt Nghĩa đầy đủ TMDT Thương mại điện tử SĐT Số điện thoại TF-IDF Term Frequency – Inverse Document Frequency CNTT Công nghệ thông tin UIMA Unstructured Information Management Architecture Lê Tất Doãn – D12CNPM2 ix Đồ án tốt nghiệp Lời mở đầu LỜI MỞ ĐẦU Trong thời đại ngày phát triển bùng nổ Internet giúp ích nhiều cho sống người Internet giúp người tìm kiếm tổng hợp thơng tin toàn giới cách dễ dàng Internet tạo gia giới phẳng, nơi mà tiếp xúc cá nhân trở nên dễ dàng chặt chẽ hơn, giao dịch thương mại dễ dàng thực hiện… Thương mại điện tử (TMDT) trở thành xu kinh doanh Nó giúp doanh nghiệp tiếp cận tớinhiều tầng lớp khách hàng, việc quản lý kinh doanh trở lên đơn giản nhiều ưu điểm mà TMDT đem lại khơng cho doanh nghiệp mà cịn góp phần thúc đẩy kinh tế quốc gia Để xây dựng hệ thống TMDT thành công khơng thể thiếu cơng cụ tìm kiếm, gợi ý sản phẩm Chúng giúp cho khách hàng tiếp cận sản phẩm mà họ quan tâm nhanh hơn, từ đem tới nhiều hội mua sắm cho doanh nghiệp Từ lợi mà TMDT công cụ tìm kiếm đem lại kết hợp với nhu cầu tìm kiếm mua bán sách, báo, tạp chí xã hội em chọn đề tài cho đồ án “Xây dựng hệ thống giới thiệu bán sách trực tuyến” Đề tài tập trung vào phần sau:  Phân tích thiết kế xây dựng hệ thống bán sách trực tuyến  Nghiên cứu cơng cụ tìm kiếm thơng tin Apache Solr  Sử dụng Apache Solr để phát triển, cài đặt phần tìm kiếm giới thiệu sách cho hệ thống bán sách trực tuyến Em xin chân thành cảm ơnTS.Nguyễn Thị Thu Phương tận tình giúp đỡ em hồn thành đề tài Do kiến thức hạn chế nên đồ án cịn nhiều thiếu xót, em mong nhận nhiều ý kiến đánh giá nhận xét quý thầy cô Nội dung đề tài bao gồm: Chương 1: Khảo sát xây dựng toán Thu thập yêu cầu, trình bày trạng kinh doanh, vấn đề gặp phải hình thức kinh doanh từ đặt yêu cầu cho hệ thống Chương 2: Phân tích thiết kế Trình bày tài liệu phân tích thiết kế: sơ đồ usecase, kịch ca sử dụng, sơ đồ cho kịch bản, sơ đồ lớp thực thể, thiết kế giao diện Lê Tất Doãn – D12CNPM2 Đồ án tốt nghiệp Lời mở đầu Chương 3: Search Platform Apache Solr Trình bày tổng quan Search Platform Apache Solr, trình đánh mục, khác tìm kiếm solr với tìm kiếm sử dụng truy vấn sở liệu Chương 4: Phát triển cài đặt thử nghiệm Trình bày cơng nghệ sử dụng, môi trường cài đặt bước thực cài đặt thử nghiệm Lê Tất Doãn – D12CNPM2 Đồ án tốt nghiệp Chương 1: Khảo sát xây dựng toán CHƯƠNG 1: KHẢO SÁT VÀ XÂY DỰNG BÀI TỐN Chương trình bày trạng kinh doanh nhà sách từ đưa yêu cầu để xây dựng hệ thống 1.1 Hiện trạng kinh doanh nhà sách Xã hội ngày phát triển, nhu cầu hiểu biết tất lĩnh vực người ngày nâng cao Đáp ứng yêu cầu này, Việt Nam nhiều nhà sách xuất hiện, đa số cửa hàng bán sách tổ chức kinh doanh theo phương pháp truyền thống gồm quy trình sau:  Nhập sách từ nhà cung cấp: lập đơn đặt mua, gửi đơn đặt mua, nhận sách từ nhà cung cấp, lưu sách vào kho, toán, quảng cáo trưng bày sách mới…  Bán sách: trưng bày sách lên giá sách theo thể loại  Quy trình mua bán cần có nhân viên trực tiếp làm việc với khách hàng quầy than toán  Thanh toán theo phương thức truyền thống Phương thức kinh doanh trực tiếp dẫn đến khó khăn sau:  Cửa hàng phải tốn diện tích lớn cho việc trưng bày sách  Khi khách hàng có nhu cầu mua sách thường họ phải nhiều thời gian để tìm kiếm sách  Khi sách xuất thời gian mà đến với bạn đọc thường lâu phải qua phương tiện quảng cáo đắt tiền tivi, báo chí…  Khó khăn việc tiếp thị, giới thiệu đầu sách mà khách hàng quan tâm  Rất khó để khách hàng biết nội dung sách Những khó khăn trực tiếp làm giảm đáng kể doanh thu nhà sách Đặt cho nhà sách cần phải có cách tiếp cận, thu hút nhằm đem lại hiệu Giải pháp áp dụng công nghệ thông tin vào kinh doanh quản lý xu tất yếu Một hệ thống quản lý bán sách mạng giúp giải khó khăn điều quan trọng đáp ứng nhu cầu đơng đảo khách hàng có nhu cầu tra cứu sách, phương tiện quảng cáo sách cho cửa hàng tốt nhất, rẻ hiệu Điều đồng nghĩa với việc doanh thu cửa hàng tăng lên Lê Tất Doãn – D12CNPM2 Đồ án tốt nghiệp Chương 1: Khảo sát xây dựng toán 1.2 Yêu cầu xây dựng hệ thống Hệ thống phải đáp ứng yêu cầu chức sau:  Chức xem chi tiết sản phẩm: bao gồm việc giới thiệu thông tin chi tiết sản phẩm (tên sản phẩm, số lượng, giá bán, )  Chức gợi ý sản phẩm: hiển thị đầu sách liên quan tới sản phẩm mà khác hàng xem chi tiết  Chức đánh giá sản phẩm: cho phép khách hàng đánh giá số cho sản phẩm  Chức tìm kiếm: Cơng cụ tra cứu nhanh, giúp khách hàng giảm thời gian tìm kiếm  Chức tìm kiếm nâng cao: cho phép khách hàng nhập đoạn mô tả, tiêu đề sách  Chức giỏ hàng: Cho phép khách hàng lúc đặt mua nhiều sản phẩm với số lượng khác Hệ thống tự động tính tốn giá trị giỏ hàng bổ sung thông tin khuyến kèm theo sản phẩm đặt mua  Chức tạo đơn đặt hàng: Q trình đặt hàng thơng qua giỏ hàng cho phép thu thập đầy đủ thông tin khách hàng kèm theo thông tin tốn Các thơng tin trợ giúp phận bán hàng trình quản trị xử lý đơn hàng Quá trình tạo đơn hàng yêu cầu khách hàng phải có tài khoản hệ thống  Chức quản lý đơn hàng: Khách hàng thể xem lại đơn hàng đặt, hủy bỏ đơn hàng chưa xử lý Nhân viên xem danh sách đơn hàng đặt, thực việc xử lý hủy bỏ đơn hàng  Chức tích điểm: Với đơn hàng thành công, số điểm quy đổi tiền áp dụng cho đơn hàng sau  Chức quản lý khách hàng: Quản lý thông tin giao dịch khách hàng: thông tin khách hàng, đơn hàng, số lượng mặt hàng khách hàng mua Từ tổ chức khách hàng theo nhóm  Chức thống kê: Tiện ích cho phép theo dõi hoạt động website, thống kê báo cáo số lượng đơn hàng theo thời gian, thống kế số lượng sách bán theo thời gian  Chức quản lý sách: Cho phép nhân viên thêm, sửa xóa thơng tin sách  Quản lý khuyển mãi: Cho phép nhân viên thêm, sửa, xóa chương trình khuyến mãi, áp dụng khuyến cho sản phẩm Lê Tất Doãn – D12CNPM2 Đồ án tốt nghiệp Chương 2: Phân tích thiết kế CHƯƠNG 2: PHÂN TÍCH VÀ THIẾT KẾ Chương trình bày tài liệu phân tích u cầu, tài liệu thiết kế hệ thống, kịch bản, sơ đồ tuần tự, sơ đồ quan hệ lớp thực thể, sơ đồ thiết kế sở liệu, thiết kế giao diện 2.1 Phân tích yêu cầu 2.1.1 Phân tích yêu cầu hệ thống a Yêu cầu khách hàng  Giao diện dễ sử dụng có tính thẩm mỹ cao  Cho phép khách hàng đăng ký thành viên đảm bảo bí mật thơng tin  Xem thay đổi thông tin cá nhân thơng tin tài khoản  Hình thức tốn phải đảm bảo xác  Cho phép sử dụng tiền thưởng từ đơn hàng thành công  Thông tin sản phẩm chi tiết, dầy đủ  Luôn cập nhật, giới thiệu sản phẩm  Cho phép khách hàng tìm kiếm sản phẩm nhanh chóng, xác theo nhiều tiêu chí  Cho phép xem danh sách đơn hàng đặt, hủy bỏ đơn hàng chưa xử lý  Cho phép khách hàng đánh giá cho sản phẩm b Yêu cầu nhân viên  Quản lý sách: Tìm kiếm sách, thêm, sửa, xóa thơng tin sách danh mục  Quản lý khách hàng: Tạo nhóm khách hàng, chia nhóm khách hàng  Quản lý đơn hàng: Xử lý đơn đặt hàng, xem đơn hàng hủy xử lý  Quản lý khuyến mãi: Thêm, sửa, xóa, áp dụng khuyến cho sản phẩm c Yêu cầu người quản lý Ngoài yêu cầu giống nhân viên, hệ thống phải đảm bảo yêu cầu sau người quản lý:  Quản lý nhân viên:Thêm nhân viên, sửa thơng tin nhân viên, xóa nhân viên, tìm kiếm nhân viên  Phân quyền nhân viên Lê Tất Doãn – D12CNPM2 Đồ án tốt nghiệp Chương 3: Search Platform Apache Solr Trong hình khai báo thư viện đường dẫn tới thư viện ta sử dụng, thành phần xử lý request… Hình 3-11: Thành phần file solrconfig.xml Ta thấy file data-config.xml sử dụng requestHandler Và để import liệu từ sở liệu ta tạo truy vấn với đường dẫn: http://localhost:8080/solr/dataimport?command=full-import&clean=true Lê Tất Doãn – D12CNPM2 56 Đồ án tốt nghiệp Chương 3: Search Platform Apache Solr 3.4 Truy vấn n Solr 3.4.1 Solr Request Mỗi request handler s ánh xạ tới mộtt URL riêng bi biệt Tiến trình xử lý với câu truy vấnn select đư thể hình 3-12 Hình 3-12: Luồng xử lý truy vấn URL gọi tớii requestHanlder select, t tham số gửi kèm truy vấn xử lý theo ng ki kiểu liệu (các thành phần đượcc đđịnh nghĩa file schema.xml) Kết sau xử lý đ đưa tới lucene để thực tìm kiếếm trả kết tìm kiếm theo định nh ddạng mà request yêu cầu (Solr hỗ trợ đđịnh dạng: XML, XSLT, Binary, JSON…) Một câu truy vấn tớii tìm ki kiếm ngồi từ khóa tìm kiếm ta cầần tìm hiểu thêm parameters mà SearchHandler hhỗ trợ nhằm nâng cao kết tìm ki kiếm Bảng liệtt kê danh sách m vài parameters thường đượ ợc sử dụng: STT Parameter Ý nghĩa q Chứa từ khóa tìm kiếm sort Lê Tất Doãn – D12CNPM2 Quy định kết sau trả vvề xếp hay không 57 Đồ án tốt nghiệp Chương 3: Search Platform Apache Solr Việc xếp thực hiệnn m nhiều trường liệu start Xác định kết trả bắt đầuu ttừ vị trí có giá trị nằm start Giá trị mặc định cho start là: rows Thông số xác định số lượng ng ttối đa kết trả cho câu truy vấn Giá trị mặc định nh cho rows là: 10 wt wt (write type) xác định định nh dang cho kkết trả Giá trị mặc định cho wt là: xml Bảng 3-2: Parameter truy vấn Solr 3.4.2 Solr response Solr hỗ trợ nhiều cấuu trúc cho kết k tìm kiếm như: csv, geo geojson, javabin, json, php, phps, python, ruby, smile, velocity, xlsx, xml, xslt… Trong phầnn ssẽ tìm hiểu cấu trúc json củaa response: Cấuu trúc response ssử dụng câu truy vấn: q=id:VS1GB400C3&wt=json Hình 3-13: Response JSON từ Solr Lê Tất Doãn – D12CNPM2 58 Đồ án tốt nghiệp Chương 3: Search Platform Apache Solr Phần responseHeader chỉ thông tin câu truy vấn, thời gian đáp ứng cho request tính theo đơn vị mili giây Sau phần responseHeader phần respone chứa thơng tin số lượng kết tìm nằm biến “numFound”, vị trí bắt đầu kết quả: “start” phần cuối kết tìm kiếm chứa “docs” 3.5 Sử dụng Apache Solr cho việc tìm kiếm thơng tin 3.5.1 Tìm kiếm thơng tin Theo định nghĩa Stanford, Tìm kiếm thơng tin (Information Retrieval – IR) tìm kiếm tài nguyên tập lớn liệu phi cấu trúc lưu trữ máy tính nhằm thỏa mãn nhu cầu thơng tin Hiện có nhiều trang web với cơng cụ hỗ trợ tìm kiếm giúp cho người sử dụng Internet nhiều việc tìm kiếm thơng tin Trong số kể đến trang Web hỗ trợ tìm kiếm thơng dụng Google, Yahoo, Bing… Để tìm kiếm thơng tin, trước hết, hệ thống tìm kiếm xử lý tài liệu thơ thành tài liệu tách từ, phân đoạn (tokennized documents) sau lập mục (index) dựa vị trí từ Khi người dùng đưa vào câu truy vấn, hệ thống tìm kiếm thơng tin xử lý câu truy vấn thành ngôn ngữ mục mô tả yếu tố thơng tin cần tìm kiếm thực đối chiếu với mục tài liệu để tìm tài liệu liên quan Cuối cùng, tài liệu liên quan ñược trả cho người dùng theo danh sách xếp theo độ ưu tiên xác giảm dần (ranked list) 3.5.2 Tìm kiếm thơng tin sử dụng Solr Solr máy tìm kiếm (search engine) cho phép tìm kiếm thơng tin theo yêu cầu người dùng với đặc điêm bật sau:  Khả tìm kiếm văn tồn diện (Full-Text Search) giống kiểu Google  Chỉnh sửa để hiệu tốt  Dựa chuẩn mở giao tiếp với hệ thống khác – XML, JSON HTTP  Quản trị dạng giao diện HTML đơn giản  Thống kê dạng JMX  Khả mở rộng nhiều server Solr  Cấu hình đơn giản dễ dàng với định dạng XML  Có khả bổ sung phần mở rộng (plugin) Ví dụ phân tích mở rộng tiếng Việt: Bắt lỗi tả, bỏ dấu,… Lê Tất Dỗn – D12CNPM2 59 Đồ án tốt nghiệp Chương 3: Search Platform Apache Solr  Cho phép highlighting kết tìm kiếm, cách mà google thị thơng tin tóm tắt kết mà câu truy vấn in đậm  Có thể xây dựng nhiều ứng dụng khác mà trang tìm kiếm cần như: autosuggestion, spellchecking, xây dựng tagcloud, phân loại kết clustering (như Bing làm), trending keywords, category navigation, kết liên quan, nhóm kết (field collapsed) …  Cho phép scale hệ thống cách dễ dàng bạn có lượng lớn liệu mà không đủ chứa máy chủ hay phải phục vụ nhiều người dùng đồng thời  Solr dùng CSDL NoSQL hay cache layer, dùng cho listing cần performance tốt  Solr hỗ trợ realtime cho phép tìm kiếm kết sau index Điều đặc biệt khó index lớn Hiện Solr cho phép kết rât nhanh, phải hy sinh thời gian index Với liệu lớn có bạn phải 30 phút nhiều để cập nhật tài liệu, nhiên sử dụng kiểu cập nhật liệu cho ghi thay đổi (đề cập chi tiết phần sau)  Solr hỗ trợ nhiều công cụ để tinh chỉnh kết tìm kiếm, tất thông tin mà bạn cung cấp để kết trả tốt Ví dự đánh trọng số trường, click log, số lượt view, … 3.5.3 Tìm kiếm - gợi ý sử dụng Solr Khi nói đến cơng cụ tìm kiếm, người ta nghĩ tới khung search để điền thông tin Tương tự nghĩ tới công cụ recommendation (gợi ý), người ta nghĩ tới thuật toán tự động đề xuất thông tin dựa nhu cầu hành vi người dùng Trong thực tế, search recommendation nhìn chung so khớp input thơng tin có sẵn Về chất, search recommendation hoạt động tương tự nhau: xây dựng kết nối văn tìm kiếm thơng tin có liên quan dựa số thiết lập sẵn Search recommendation khác chỗ search yêu cầu input từ người dùng cách cụ thể recommendation tự động cung cấp thông tin dựa thông tin từ người dùng, profile hay lịch sử search Chức tìm kiếm hệ thống thường sử dụng tính Fulltext search CSDL, hay sử dụng Google Custome Search để giải vấn đề Cả hai cách thực nhanh Tuy nhiên có nhược điểm khơng thể bỏ qua: Với SQL search: Lê Tất Doãn – D12CNPM2 60 Đồ án tốt nghiệp Chương 3: Search Platform Apache Solr  Chất lượng kết tìm kiếm tệ, thường trả kết mà thấy khơng phải kết tốt nhất, thứ mà người dùng muốn tìm  Tốc độ tìm kiếm chậm đặc biệt với CSDL lớn có nhiều người dùng CSDL khơng phải thiết kế để tìm kiếm nên chậm điều hiển nhiên Với Google Custom Search (GCS):  Dùng GCS, phát huy Google index tất thông tin bạn cách kịp thời, điều mà có số trang web có Rank cao  Google thông tin liệu khác bạn, ngồi ký tự đưa lên web ví dụ public date, category, … Vì người dùng khơng thể lọc kết tìm kiếm theo trường đó, xếp, thống kê Các tính đặc biệt hữu ích cho người dùng để tìm kết họ cần khơng phải lúc máy tìm kiếm trả kết xác dựa vào câu truy vấn Với Apache Solr:  Solr lưu liệu dạng mục điều làm tăng tốc độ tìm kiếm liệu  Cho phép highlighting kết tìm kiếm: Như cách mà google thị thơng tin tóm tắt kết mà câu truy vấn in đậm  Hỗ trợ nhiều cú pháp tìm kiếm: Hỗ trợ nhiều kiểu đầu Json, XML, PHP, … cho phép Apache Solr tích hợp với ứng dụng web cách đơn giản  Cho phép scale hệ thống cách dễ dàng bạn có lượng lớn liệu mà khơng đủ chứa máy chủ hay phải phục vụ nhiều người dùng đồng thời Lê Tất Doãn – D12CNPM2 61 Đồ án tốt nghiệp Chương 4: Phát triển cài đặt thử nghiệm CHƯƠNG 4: PHÁT TRIỂN VÀ CÀI ĐẶT THỬNGHIỆM Chương trình bày sơ cơng nghệ, tảng sử dụng để phát triển hệ thống Các bước cài đặt thử nghiệm 4.1 Sơ Java Platform, Enterprise Edition Một Platform (nền tảng) hiểu đơn giản hệ điều hành hay kiến trúc máy tính thường kết hợp Java platform có thành phần:  JVM (máy ảo java)  API ( Java Application Programming Interface ) Java Platform, Enterprise Edition (Nền tảng Java, phiên 2) hay Java EE (gọi tắt J2EE) tảng lập trình dành cho việc phát triển ứng dụng phân tán kiến trúc đa tầng, chủ yếu dựa vào thành phần môđun chạy máy chủ ứng dụng 4.2 J2EE API Những công nghệ dùng J2EE bao gồm: Java Standard Edition (J2SE) - trước gọi JDK Java Database Connectivity (JDBC) - Một API chuẩn dùng để kết nối Java Platform với sở liệu RMI-JRMP – Remote Method Invocation (RMI), chuẩn dùng để gọi hàm từ xa dựa Java Remote Message Protocol (JRMP) Java Interface Definition Language (Java IDL) - dịch vụ kết hợp Common Object Request Broker Architecture (Corba) vào Java Platform để cung cấp tính interoperability thơng qua chuẩn IDL Remote Method Invocation – Internet Inter- ORB Protocol (RMI-IIOP) - Một giao thức cho phép lập trình viên RMI kết hợp lợi ích RMI API giao thức CORBA IIOP để giao tiếp với CORBA-compliant client phát triển ngôn ngữ tuân theo CORBA Enterprise JavaBean (EJB) - kiến trúc component để phát triển triển khai ứng dụng kiểu component-based distributed Servlet – tương tác với Web client thông qua chế request – response Cơ chế dựa giao thức HTTP Java Server Page (JSP) – Dùng để xây dựng ứng dụng có chứa nội dung web động HTML, DHTML, XML Lê Tất Doãn – D12CNPM2 62 Đồ án tốt nghiệp Chương 4: Phát triển cài đặt thử nghiệm Java Message Service (JMS) - API để giao tiếp với Message Oriented Middleware (MOM) cho phép truyền nhận message theo chế point-to-point publish/subcribre Java Naming and Directory Interface (JNDI) - interface dùng để truy cập kiểu dịch vụ khác naming directory Java Transaction API (JTA) - tập API cho phép quản lý transaction Ứng dụng dụng JTA để start, commint, abord transaction JavaMail - API cung cấp framework platform-independent protocolindependent (không phụ thuộc giao thức platform) để xây dựng ứng dụng mail messaging JavaBean Activation Framework (JAF) - tập API sử dụng package khác JavaMail,…Bạn dùng JAF để xác định kiểu liệu, đóng gói truy cập đến liệu đó, mở rộng tác vụ dựa liệu khởi tạo bean tương ứng để thực tác vụ Ví dụ JavaMail dùng JAF để xác định object khởi tạo dựa kiểu MIME object 4.2.1 Java Database Connectivity (JDBC) JDBC API tiêu chuẩn dùng để tương tác với loại sở liệu quan hệ JDBC có tập hợp class Infterface dùng cho ứng dụng Java giao tiếp với sở liệu Các thành phần JDBC API bao gồm: DriverManager: Là class, dùng để quản lý danh sách Driver (database drivers) Driver: Là Interface, dùng để liên kết liên lạc với sở liệu, điều khiển liên lạc với database Một Driver tải lên, lập trình viên khơng cần phải gọi cách cụ thể Connection: Là Interface với tất method cho việc liên lạc với database Nó mơ tả nội dung liên lạc tất thông tin liên lạc với sở liệu thơng qua có đối tượng Connection Statement: Là Interface, gói gọn câu lệnh SQL gửi tới sở liệu phân tích, tổng hợp, lập kế hoạch thực ResultSet: ResultSet đại diện cho tập hợp ghi lấy thực truy vấn 4.2.2 Java Servlets Java Servlets chương trình chạy Web server Application server thực tầng trung gian Yêu cầu từ trình duyệt web HTTP client với Database ứng dụng HTTP server Lê Tất Doãn – D12CNPM2 63 Đồ án tốt nghiệp Chương 4: Phát triểnn cài đđặt thử nghiệm Sử dụng Servlets, bạnn có th thể thu thập Input từ người sử dụng ng thông qua form trang web, hiển thị b ghi (record) từ Database hoặặc từ nguồn khác, tạo trang web động Sơ đồ dướii minh họa h cấu trúc Servlets ứng dụụng web: Hình 4-1: Cấu trúc Servlets ứng dụng ng web Servlets thực hiệnn tác vụ v chủ yếu sau: Đọc liệu hiểnn th thị (explicit) gửi Client (hoặcc trình duyệt) bao gồm mộtt HTML Form m trang web có thểể từ Applet chương trình ình Custom từ t HTTP Client Đọc liệu yêu cầầu HTTP ẩn (implicit) gửi bởii Client (ho (hoặc trình duyệt) bao gồm m cookie, lo loại media Xử lý liệuu cho kkết Tiến trình u ccầu Database, thực thi triệuu hồi h tới RMI CORBA, triệu hồi mộột Web Service, tính tốn phản hồii m cách trực tiếp Gửi liệu hiển thịị (ví dụ: tài liệu) tới Client (hoặcc trình duyệt) Tài liệu gửii theo nhi nhiều định dạng khác nhau, gồm m text (HTML ho XML), nhị phân (hình ảnh nh GIF), Excel, v.v Gửi phản hồii HTTP ẩn tới Client (hoặc trình duyệt), t), thơng báo cho trình duyệt hoặcc Client v kiểu tài liệu trả (ví dụ:: HTML), thi thiết lập Cookie Caching tham số, s tác vụ khác 4.2.3 Java Server Page (JSP) JavaServer Pages (JSP) m công nghệ để phát triển Webpage mà hhỗ trợ nội dung động, giúp lậpp trình viên chèn java code vào HTML page bbằng việc sử dụng thẻ JSP đặcc bi biệt, hầu hết bắt đầu với Lê Tất Doãn – D12CNPM2 64 Đồ án tốt nghiệp Chương 4: Phát triển cài đặt thử nghiệm Một thành phần JavaServer Pages (JSP) loại Java Servlet, thiết kế để thực vai trò giao diện người dùng cho ứng dụng Java Web Lập trình viên Web viết JSPs text file mà kết nối HTML code XHTML code, phần tử XHTML, JSP actions câu lệnh JSP nhúng Sử dụng JSP, ta thu thập input từ người dùng thơng qua Webpage Form, trình bày ghi từ Database, truy cập thành phần JavaBeans, truyền điều khiển page chia sẻ thông tin Request, page, … 4.3 Môi trường cài đặt thử nghiệm 4.3.1 Môi trường a Môi trường cài đặt Solr  Java jdk: http://www.oracle.com  Mã nguồn redir.html Solr: http://lucene.apache.org/solr/mirrors-solr-latest-  Một server: Tomcat, Jetty, WildFly… b Môi trường cài đặt hệ thống BookStore  Môi trường java jdk 1.8  Trình biên dịch Netbeans IDE 8.1  Cơ sở liệu Microsoft SQL Server 2014  Trình duyệt sử dụng Google Chrome phiên 54 (64-bit) 4.3.2 Cài đặt thử nghiệm a Cài đặt thử nghiệm Apache Solr Copy toàn file thư mục example\solr đường dẫn “D:\apache-solr-3.6.0\example\solr” tới “C:\solr\” Copy file *solr*.war từ thư mục “D:\apache-solr-3.6.0\dist\” tới thư mục webapps server Tomcat “C:\xampp\tomcat\webapps” Đổi tên file *solr*.war thành solr.war Tạo file solr.xml “C:\xampp\tomcat\conf\Catalina\localhost” thư mục:

Ngày đăng: 04/05/2021, 10:23

TỪ KHÓA LIÊN QUAN

w